Python爬蟲人工智能教程: www.python88.cn
本文主要講爬取微信好友性别比例和地區分布,後面還會講如何爬取好友其他資訊,代碼已上傳到QQ群(627714866)
源碼擷取:
點選下方擷取源碼在論壇擷取:
>> 擷取源碼 連結:http://www.bat666.cn/forum.php?mod=viewthread&tid=436&extra=
爬蟲技術:pandas、matplotlib、itchat、面向對象寫法
先看下方大螢幕,男朋友近600,女朋友300,還有一些未知生物存在,不小心暴露了小編的性取向
,好友分布主要集中于廣東和河南,可以猜下小編是哪裡人
廢話不多說,直接上代碼
1、pip install itchat,安裝微信接口子產品,導入pandas和matplotlib子產品
2、建立一個類,并初始化方法擷取朋友資訊
self.friends:資料結構清單包含字典,每個字典代表每個好友姓名、地區、簽名等資訊[{},{},{}]
plt.rcParams用來處理繪圖顯示中文問題
3、提取名字,性别,省份,城市,簽名資訊,并儲存到新清單
4、pandas将朋友資訊清單轉成dataframe,并儲存為csv友善檢視
5、pandas的value_counts()方法可以統計每種性别和每個省份出現的次數,并由大到小排序,這裡我們提取省份前15個,并轉成dataframe結構
由于有些省份沒有填寫,為空,通過周遊,将空的省份替換成“未知”
6、繪圖,參數說明+繪圖方法
7、調用方法
源碼擷取:
點選下方擷取源碼在論壇擷取:
>> 擷取源碼 連結:http://www.bat666.cn/forum.php?mod=viewthread&tid=436&extra=
python爬蟲人工智能大資料公衆号
公衆号回複“資料”擷取500GB相關視訊教程,部分教程分類和截圖如下:
python、django 、flask、資料分析、爬蟲、運維、大資料、量化金融、機器學習、深度學習、自然語言處理、人工智能、電子書
0、python入門教程
1、Django教學網站項目實戰視訊,帶xadmin背景和源碼:
2、Flask項目實戰視訊和源碼:
3、爬蟲項目實戰視訊和源碼:
4、資料分析項目實戰和源碼:
5、全部資料