有什麼python相關報錯解答自己不會的、或者源碼資料/模塊安裝/
女裝大佬精通技巧都可以來這裡:(https://jq.qq.com/?_wv=1027&k=2Q3YTfym)或者+V:python10010問我(文末就有)
python學習交流群:903971231###
海量視頻數據一鍵保存
html標簽數據解析方法
re解析數據方法
python 3.8
pycharm 2021.2
requests >>> pip install requests
parsel >>> pip install parsel
+python安裝包 安裝教程視頻
+pycharm 社區版 專業版 及 激活碼免費
我們通過在網頁鏈接前面+ view-source:https:.....
就可以查看到網頁源代碼, 我們在網頁源代碼當中可以找到 視頻鏈接地址
1. 發送網絡請求
2. 獲取數據 網頁源代碼
3. 篩選數據 視頻詳情頁地址
4. 發送網絡請求
5. 獲取數據 網頁源代碼
6. 篩選數據 視頻播放地址
7. 訪問視頻播放地址
8. 獲取視頻二進制數據
9. 保存 視頻數據
import requests # 發送網絡請求
import re # 正則模塊
import parsel # 解析數據模塊
看看誰沒有安裝好模塊
url_1 = 'https://www.520mmtv.com/tag/xg.html'
response_1 = requests.get(url_1)
data_html_1 = response_1.text
selector = parsel.Selector(data_html_1)
info_url_list = selector.css('.meta-title::attr(href)').getall()
title_url_list = selector.css('.meta-title::text').getall()
new_title_list = [i for i in title_url_list if i != ' ']
# zip: 我們需要把視頻鏈接 標題一起進行循環
for zip_data in zip(info_url_list, new_title_list):
url = zip_data[0]
# 1. 發送網絡請求
response = requests.get(url=url)
# <Response [200]>: 發送請求成功響應
# 2. 獲取數據 網頁源代碼
data_html = response.text
# 3. 篩選數據 視頻播放地址
# 第一個參數匹配規則 第二個我們要在哪裡匹配
video_url = re.findall('url: "(.*?)",', data_html)[0]
print(video_url)
# 4. 訪問視頻播放地址
# 5. 獲取視頻/音頻/圖片 二進制數據
video_data = requests.get(video_url).content
title = zip_data[1]
# 6. 保存 視頻數據
with open(f'video\\{
title}.mp4', mode='wb') as f:
f.write(video_data)
print(title, '爬取成功!!!')
好了,我的這篇文章寫到這裡就結束啦!
有更多建議或問題可以評論區或私信我哦!一起加油努力叭(ง •_•)ง