注明:小編親測,隻要把第一部分裡面的url修改,即可抓取部落格專家裡邊所有的專家的部落格内容和标題,後續小編還會對此代碼改進,敬請期待
文章分為兩部分:Python爬蟲爬取移動開發專家的姓名和部落格首頁位址,爬取每個專家的所有部落格存放在已該專家名字命名的txt檔案中
說明:本爬蟲主要是采用BeautifulSoup和少量的正則比對,在第一部分抓取完畢後需要将檔案格式改為ANSI,代碼如下:
第一部分:
第二部分:
結果如下圖:

注明:小編親測,隻要把第一部分裡面的url修改,即可抓取部落格專家裡邊所有的專家的部落格内容和标題,後續小編還會對此代碼改進,敬請期待
文章分為兩部分:Python爬蟲爬取移動開發專家的姓名和部落格首頁位址,爬取每個專家的所有部落格存放在已該專家名字命名的txt檔案中
說明:本爬蟲主要是采用BeautifulSoup和少量的正則比對,在第一部分抓取完畢後需要将檔案格式改為ANSI,代碼如下:
第一部分:
第二部分:
結果如下圖: