
1.jpg (42.83 KB, 下載下傳次數: 0)
2018-5-12 19:05 上傳
1.具體的抓取程式已經放在後面了,供大家下載下傳安裝,下面具體說一下使用方法。
本軟體使用了漁網形式來抓取騰訊宜出行的熱力圖資料,使用要準備号一張你要進行抓取的目标城市的shape檔案,在ArcGIS中打開這個檔案後,使用前現在ArcGiS軟體中生成漁網操作,在資料管理工具->要素類->建立漁網來進行建立一個漁網。具體的步驟已經截圖如下:

2.jpg (37.79 KB, 下載下傳次數: 0)
2018-5-12 19:09 上傳
2.将圖層屬性中的坐标設定為投影坐标,然後加載shp檔案,再使用建立漁網工具進行漁網建立,選擇你需要建立漁網的圖層,勾選建立标注點,同時像元高度和像元寬度設定為2600(即2.6km),其他參數預設即可。我們需要的使漁網的标注點,删除不需要的标注點,之後設定圖層屬性中坐标系為wgs1984,生成wgs1984坐标下的經緯度,即可導入宜出行工具中使用。
3.下面把整個程式的主檔案目錄介紹一下
3.1 chromedriver.exe是你需要使此程式正常跑起來的一個谷歌浏覽器驅動,将這個驅動放在你的谷歌浏覽器的安裝目錄,并且把驅動的路徑添加到系統環境變量
3.2 data.txt 是我們剛才使用ArcGIS生成的漁網坐标點資料
3.2 main.py 這是我們的爬蟲主程式,提前在你的電腦上面配置好Python3.6版本的環境,然後在DOS視窗直接使用python main.py即可運作主程式
3.3 qqlist.py 由于每個QQ有爬取次數限制,大概在120次左右吧,是以這裡可以設定多個QQ号,一個QQ号反扒了之後會自動切換到另外一個QQ繼續爬取資料
3.4 run.bat 如果你不想輸入剛才的DOS指令運作這個程式,那就直接輕按兩下這個檔案即可運作
3.5 settings.py 這個是程式要抓取的目标地區的輸入參數,例如目标城市,城市四至界限的經緯度等
3.6 transCoordinateSystem.py 騰訊坐标系與其他坐标系的互相轉換

3.jpg (9.71 KB, 下載下傳次數: 0)
2018-5-12 19:13 上傳
關于本程式的更多使用說明,文章内容版權請參見文章: