程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

如何用Python 看遍女神視界?美女咋越看越精神呢~(內含完整源碼)

編輯:Python

well ~well ~well ~

最近精神不是很好,工作總沒動力~

可能是工作太累了,

所以我給自己整了個小東西放松一下~


有什麼python相關報錯解答自己不會的、或者源碼資料/模塊安裝/女裝大佬精通技巧 都可以來這裡:(https://jq.qq.com/?_wv=1027&k=2Q3YTfym)或者+V:python10010問我(文末就有)

話不多說,我們直接開始

[知識點]:

python學習交流群:903971231###
海量視頻數據一鍵保存
html標簽數據解析方法
re解析數據方法

[環境介紹]:

python 3.8
pycharm 2021.2
requests >>> pip install requests
parsel >>> pip install parsel

+python安裝包 安裝教程視頻
+pycharm 社區版 專業版 及 激活碼免費


一. 分析網站(思路分析)

我們通過在網頁鏈接前面+ view-source:https:.....
就可以查看到網頁源代碼, 我們在網頁源代碼當中可以找到 視頻鏈接地址

二. 代碼實現

1. 發送網絡請求
2. 獲取數據 網頁源代碼
3. 篩選數據 視頻詳情頁地址
4. 發送網絡請求
5. 獲取數據 網頁源代碼
6. 篩選數據 視頻播放地址
7. 訪問視頻播放地址
8. 獲取視頻二進制數據
9. 保存 視頻數據



導入模塊

import requests # 發送網絡請求
import re # 正則模塊
import parsel # 解析數據模塊

看看誰沒有安裝好模塊

1. 發送網絡請求

url_1 = 'https://www.520mmtv.com/tag/xg.html'
response_1 = requests.get(url_1)

2. 獲取數據 網頁源代碼

data_html_1 = response_1.text

3. 篩選數據 視頻詳情頁地址

selector = parsel.Selector(data_html_1)
info_url_list = selector.css('.meta-title::attr(href)').getall()
title_url_list = selector.css('.meta-title::text').getall()
new_title_list = [i for i in title_url_list if i != ' ']
# zip: 我們需要把視頻鏈接 標題一起進行循環
for zip_data in zip(info_url_list, new_title_list):
url = zip_data[0]
 # 1. 發送網絡請求
response = requests.get(url=url)
# <Response [200]>: 發送請求成功響應
# 2. 獲取數據 網頁源代碼
data_html = response.text
# 3. 篩選數據 視頻播放地址
# 第一個參數匹配規則 第二個我們要在哪裡匹配
video_url = re.findall('url: "(.*?)",', data_html)[0]
print(video_url)
# 4. 訪問視頻播放地址
# 5. 獲取視頻/音頻/圖片 二進制數據
video_data = requests.get(video_url).content
title = zip_data[1]
# 6. 保存 視頻數據
with open(f'video\\{
title}.mp4', mode='wb') as f:
f.write(video_data)
print(title, '爬取成功!!!')

好了,我的這篇文章寫到這裡就結束啦!

有更多建議或問題可以評論區或私信我哦!一起加油努力叭(ง •_•)ง

喜歡就關注一下博主,或點贊收藏評論一下我的文章叭!!!


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved