天天看點

《精通Python網絡爬蟲:核心技術、架構與項目實戰》——2.4 小結

本節書摘來自華章出版社《精通python網絡爬蟲:核心技術、架構與項目實戰》一書中的第2章,第2.4節,作者 韋 玮,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

1)爬蟲的出現,可以在一定程度上代替手工通路網頁,是以,原先我們需要人工去通路網際網路資訊的操作,現在都可以用爬蟲自動化實作,這樣可以更高效率地利用好網際網路中的有效資訊。

2)檢索是一種行為,而索引是一種屬性。如果有一個好的索引,則可以提高檢索的效率,若沒有索引,則檢索的效率會很低。

3)使用者爬蟲是網絡爬蟲的其中一種類型。所謂使用者爬蟲,即專門用來爬取網際網路中使用者資料的一種爬蟲。由于網際網路中的使用者資料資訊,相對來說是比較敏感的資料資訊,是以,使用者爬蟲的利用價值也相對較高。