各位大佬好鴨!又是我小熊貓啦
咱這次直接上代碼 開始之前先解釋下:
requests >>> pip install requests
parsel >>> pip install parsel
re
解釋器: python 3.8
編輯器: pycharm
發送請求
獲取數據
解析數據
保存數據
代碼裡一些東西被我刪了好過審核,有需要得小伙伴可看評論或私聊我領取~
import requests # 發送請求
import re
# 偽裝
headers = {
'cookie': '',
'referer': '',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = ''
html_data = requests.get(url=url, headers=headers).text
info_list = re.findall('<h2 class="book_name"><a href="(.*?)" target="_blank" data-eid=".*?" data-cid=".*?" alt=".*?" title=".*?">(.*?)</a></h2>', html_data)
for link, title in info_list:
link = 'https:' + link
# print(link, title)
# 1. 發送請求
response = requests.get(url=link, headers=headers)
# 2. 獲取數據
link_data = response.text
# print(html_data)
# 3. 解析數據
# 網頁標簽 <p></p> <a></a> <div></div> <img />
# <div class="read-content j_readContent" id=".*?">(.*?)</div>
text = re.findall('<div class="read-content j_readContent" id=".*?">(.*?)</div>', link_data, re.S)[0]
text = text.replace('<p>', '\n')
text = title + '\n\n' + text
print(text)
# 4. 保存數據
with open('網戀女友竟是九天神凰.txt', mode='a', encoding='utf-8') as f:
f.write(text)
好了,我的這篇文章寫到這裡就結束啦!
有更多建議或問題可以評論區或私信我哦!一起加油努力叭(ง •_•)ง
喜歡就關注一下博主,或點贊收藏評論一下我的文章叭!!!
Authors brief introduction : H
Its today 214 Valentines Day ,