linux中爬蟲架構scrapy的快速安裝及搭建(一)

2023-04-08 07:05:13

scrapy是一個快速、高層次的web抓取架構

建立虛拟環境

具體解釋看上一篇推文，

輸入: >mkvirtualenv -p /usr/bin/python3 Articlespider

linux中爬蟲架構scrapy的快速安裝及搭建(一)
安裝scrapy

可以直接使用:>pip install scrapy下載下傳，但是速度比較慢

也可以尋找鏡像下載下傳(我這裡用的清華大學的)：>pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scrapy

安裝如果提示： Failed building wheel for xxx

可以在 https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 找到對應的安裝包進行安裝
在pycharm中建立scrapy項目

在Documents中建立一個檔案夾scrapy，在指令行中進入scrapy檔案夾：>cd /home/ailiya/Documents/scrapy

在檔案夾中建立scrapy項目：>scrapy startproject Articlespider

進入項目：>cd Articlespider
在pycharm中導入Articlespider

file->new project->

linux中爬蟲架構scrapy的快速安裝及搭建(一)
在location中填寫Articlespider的位置打開：

linux中爬蟲架構scrapy的快速安裝及搭建(一)
建立爬蟲檔案夾

在指令行中輸入：>scrapy genspider jobbole blog.jobbole.com(爬蟲的網站）

打開pycharm，可以看到檔案夾建立成功

linux中爬蟲架構scrapy的快速安裝及搭建(一)

上一篇: 使用scrapy中crawlspider爬取csdn文章

下一篇: 關于小紅書 x-sign 的資料的破解

繼續閱讀