您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

Python爬蟲編程思想（153）：使用Scrapy抓取數據，抓取多個Url

編輯：Python

在前面的案例中都是只抓取了一個Url對應的頁面，但在實際應用中，通常需要抓取多個Url，在爬蟲類的start_urls變量中添加多個Url，運行爬蟲時就會抓取start_urls變量中所有的Url。下面的代碼在start_urls變量中添加了2個Url，運行MultiUrlSpider爬蟲後，就會抓取這兩個Url對應的頁面。

class MultiUrlSpider(scrapy.Spider):
name = 'MultiUrlSpider'
start_urls = [
'https://www.jd.com',
'https://www.taobao.com'
]
... ...

下面的例子通過一個文本文件（urls.txt）提供多個Url，並在爬蟲類中讀取urls.txt文件中的內容，然後將讀取的多個Url存入start_urls變量中。最後會抓取urls.txt文件中所有的Url對應的頁面，並輸出頁面的博文數（本例提供的Url是geekori.com的博文列表頁面，如果讀者使用其他的Url，需要修改分析頁面的邏輯代碼）。

import scrapy
class MultiUrlSpider(scrapy.Spider):
name = 'Mult

上一篇文章：用python實現CSI幅值和相位信息的可視化
下一篇文章： Python爬蟲編程思想（152）：使用Scrapy抓取數據，使用ItemLoader保存多條抓取的數據

Python

Python - scheduled tasks

1. The first method , Is the r

使用 Python 的 requests 和 Beautiful Soup 來分析網頁

作者：譯者： | 2022-06-28 13

python基礎篇【第八篇】面向對象（下）

一、面向對象特性之多態：　　上一篇已經介紹了面向對象的三大

使用python模擬登錄

使用python模擬登錄運行環境步驟浏覽器階段思路編碼使用J

Data type and color space conversion in Python digital image processing

Catalog One 、 Image data type

Python魔法方法之__iter__

Python魔法方法之__iter__一個形象的科學解釋上次