您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

如何用Python 看遍女神視界？美女咋越看越精神呢~（內含完整源碼）

編輯：Python

well ~well ~well ~

最近精神不是很好，工作總沒動力~

可能是工作太累了，

所以我給自己整了個小東西放松一下~

有什麼python相關報錯解答自己不會的、或者源碼資料/模塊安裝/~~女裝大佬精通技巧~~ 都可以來這裡：（https://jq.qq.com/?_wv=1027&k=2Q3YTfym）或者+V：python10010問我（文末就有）

話不多說，我們直接開始

[知識點]:

python學習交流群:903971231###
海量視頻數據一鍵保存
html標簽數據解析方法
re解析數據方法

[環境介紹]：

python 3.8
pycharm 2021.2
requests >>> pip install requests
parsel >>> pip install parsel

+python安裝包安裝教程視頻
+pycharm 社區版專業版及激活碼免費

一. 分析網站(思路分析)

我們通過在網頁鏈接前面+ view-source:https:.....
就可以查看到網頁源代碼, 我們在網頁源代碼當中可以找到 視頻鏈接地址

二. 代碼實現

1. 發送網絡請求
2. 獲取數據 網頁源代碼
3. 篩選數據 視頻詳情頁地址
4. 發送網絡請求
5. 獲取數據 網頁源代碼
6. 篩選數據 視頻播放地址
7. 訪問視頻播放地址
8. 獲取視頻二進制數據
9. 保存 視頻數據

導入模塊

import requests # 發送網絡請求
import re # 正則模塊
import parsel # 解析數據模塊

看看誰沒有安裝好模塊

1. 發送網絡請求

url_1 = 'https://www.520mmtv.com/tag/xg.html'
response_1 = requests.get(url_1)

2. 獲取數據網頁源代碼

data_html_1 = response_1.text

3. 篩選數據視頻詳情頁地址

selector = parsel.Selector(data_html_1)
info_url_list = selector.css('.meta-title::attr(href)').getall()
title_url_list = selector.css('.meta-title::text').getall()
new_title_list = [i for i in title_url_list if i != ' ']
# zip: 我們需要把視頻鏈接 標題一起進行循環
for zip_data in zip(info_url_list, new_title_list):
url = zip_data[0]

 # 1. 發送網絡請求
response = requests.get(url=url)
# <Response [200]>: 發送請求成功響應
# 2. 獲取數據 網頁源代碼
data_html = response.text
# 3. 篩選數據 視頻播放地址
# 第一個參數匹配規則 第二個我們要在哪裡匹配
video_url = re.findall('url: "(.*?)",', data_html)[0]
print(video_url)
# 4. 訪問視頻播放地址
# 5. 獲取視頻/音頻/圖片 二進制數據
video_data = requests.get(video_url).content
title = zip_data[1]
# 6. 保存 視頻數據
with open(f'video\\{
title}.mp4', mode='wb') as f:
f.write(video_data)
print(title, '爬取成功!!!')

好了，我的這篇文章寫到這裡就結束啦！

有更多建議或問題可以評論區或私信我哦！一起加油努力叭(ง •_•)ง