
**
前言
當你看前言的時候,不得不說你做出了一個聰明的選擇,因為前言中有作者對整本書的概括和學習建議,這會對大家之後的閱讀産生事半功倍的效果。在聊這本書之前。大家可以在github中對不懂的内容進行提問,我會盡可能地幫助大家解決問題。其實在前言開頭放這個連結是挺突兀的,不過确實是擔心大家不會完整地看完前言。
接下來聊一聊這本書,寫這本書的原因來自于我個人的微信公衆号:七夜安全部落格。我經常在部落格園、知乎和微信平台上釋出技術文章,分享一些知識和見解,有很多熱心的朋友願意和我進行交流讨論。記得2016年4月初的某一天,有一個朋友在微信背景留言,問我怎樣将python爬蟲技術學好,有什麼書籍可以推薦。我當時回答了好長一段建議,但是那個朋友依然希望能推薦一本書籍幫助入門和提高。其實我特别能了解初學者的心情,畢竟我也是從初學者走過來的,但是确實挺糾結,不知從何推薦。于是,我專門找了一下這方面的書籍,隻找到一本外國人寫的書,中文版剛出版沒多久,名字為《python網絡資料采集》。我花了半天看了一下裡面的内容,整本書條理比較清晰,容易了解,但是很多知識點都談得很淺,系統的實戰項目基本上沒有,更多的是一些代碼片段,僅僅适合一些剛剛入門的朋友。自從這件事情以後,我就下定決心寫一本python爬蟲方面的書籍,既然國内還沒有人寫這方面的書籍,我願意做一個抛磚引玉的人,幫助大家更好地學習爬蟲技術。
有了寫書的想法後,開始列提綱,确定書的主題和内容。由于爬蟲是一項實踐性很強的技術,是以書的主題是以實戰項目為驅動,由淺及深地講解爬蟲技術,希望你看這本書的時候是個菜鳥,認真學習完之後不再是個菜鳥,可以自主地開發python爬蟲項目了。從寫書的那一刻開始,我就知道在書寫完之前,我應該是沒有周末了。這本書寫了大半年的時間,由于我平時有寫筆記、做總結的習慣,是以寫書的時間不是特别長,不過直到2017年年初我依然在更新内容,畢竟爬蟲技術更新得比較快,我努力将比較新的知識貢獻給大家。
在寫書的過程中,我的内心變得越來越平靜,越來越有耐心,不斷地修改更新,對每個實戰項目進行反複驗證和敲定,盡可能地貼近初學者的需求,希望能幫助他們完成蛻變。
最後做一下自我介紹,本人是一位資訊安全研究人員,比較擅長網絡安全、軟體逆向,同時對大資料、機器學習和深度學習有非常濃厚的興趣,歡迎大家和我交流,共同進步。
前路多艱,學習的道路不可能一帆風順,爬蟲技術隻是個開始,願與諸君一道共克難關。
[第1章 回顧python程式設計
1.1.1 windows上安裝python
1.1.2 ubuntu上的python
<a href="https://yq.aliyun.com/articles/108803">1.2 搭建開發環境</a>
1.2.1 eclipse+pydev
1.2.2 pycharm
<a href="https://yq.aliyun.com/articles/108812">1.3 io程式設計</a>
1.3.1 檔案讀寫
1.3.2 操作檔案和目錄
1.3.3 序列化操作
<a href="https://yq.aliyun.com/articles/108828">1.4 程序和線程</a>
1.4.1 多程序
1.4.2 多線程
1.4.3 協程
1.4.4 分布式程序
<a href="https://yq.aliyun.com/articles/108844">1.5 網絡程式設計</a>
1.5.1 tcp程式設計
1.5.2 udp程式設計
<a href="https://yq.aliyun.com/articles/108850">1.6 小結</a>
[第2章 web前端基礎
2.1.1 html
2.1.2 css
2.1.3 javascript
2.1.4 xpath
2.1.5 json
<a href="https://yq.aliyun.com/articles/108913">2.2 http标準</a>
2.2.1 http請求過程
2.2.2 http狀态碼含義
2.2.3 http頭部資訊
2.2.4 cookie狀态管理
2.2.5 http請求方式
<a href="https://yq.aliyun.com/articles/108917">2.3 小結</a>
[第3章 初識網絡爬蟲
3.1.1 網絡爬蟲及其應用
3.1.2 網絡爬蟲結構
<a href="https://yq.aliyun.com/articles/108958">3.2 http請求的python實作</a>
3.2.1 urllib2/urllib實作
3.2.2 httplib/urllib實作
3.2.3 更人性化的requests
<a href="https://yq.aliyun.com/articles/108964">3.3 小結</a>