攝圖網
https://699pic.com/tupian/3d-yuanyuzhouxunixianshi.html
1、window11
2、python3.7
3、PyCharm Community Edition 2021.2.1
4、雙核浏覽器
5、浏覽器自帶開發者工具
攝圖網是一個包含各種樣式圖片的網站,通過python爬蟲我們可以實現批量下載該網站上的圖片,網站如圖:
抓包,打開浏覽器自帶的開發者工具,刷新網頁,找到第一個數據包,就是該網頁的網絡請求數據包,如圖:
對元素標簽進行定位,發現圖片鏈接都在img標簽的src屬性值中,但是鏈接不完整,需要後期進行拼接,如圖:
使用正則表達式對所有圖片的鏈接進行匹配,str_image = ‘data-original=“(.*?)”’
保存二進制數據時,不要使用encoding參數,否則會報錯如下:ValueError: binary mode doesn’t take an encoding argument