我的目錄
- 微網誌三個接口的擷取
-
- 1.使用者搜尋接口
- (8)使用者搜尋接口格式
- 2.使用者資訊、使用者微網誌接口
- (3)使用者資訊接口格式
- (4)使用者微網誌接口格式
不知不覺2021年了,先祝大家元旦快樂!這段時間有些忙,在學習tk,特地買了一本書來學(《Python GUI設計 tkinter菜鳥程式設計》),根據書中所學和網上資料,開發微網誌圖檔采集工具GUI版本。
本篇文章會詳細講解weibo三個接口的擷取。
微網誌三個接口的擷取
以下三個接口的擷取都是基于https://m.weibo.cn/
1.使用者搜尋接口
(1)首先打開https://m.weibo.cn/
這是微網誌手機版的網頁頁面。
(2)點選圖中紅框标記的位置,轉到搜尋頁面
(3)輸入一個關鍵字,搜尋一下。
(4)發現出來很多分類,有綜合、使用者、分類…
這時候就是關鍵了,打開F12開發者工具并且切換到Network,因為要找使用者搜尋的接口,是以切換到使用者一欄,最後F5重新整理頁面。
發現此處産生了很多請求與響應。
(5)微網誌不是靜态頁面,是以接口很可能在XHR(XMLHttpRequest)或者JS(JavaScript)中通過觀察Size大小以及對資料的判斷,最終找到了這個接口
其實根據url中的單詞也能夠簡單判斷他是搜尋的接口。
(6)驗證,在頁面中随便複制一位部落客的名字,在Netwoek中切換到Preview欄 ctrl+f,搜尋這位部落客大名,發現資料就在這個json中!
(7)分析這個接口
https://m.weibo.cn/api/container/getIndex?containerid=100103type%3D3%26q%3D%E4%BA%8B%E4%BB%B6%26t%3D0&page_type=searchall
把這個接口放到urldecode上解碼
能夠發現我們輸入的關鍵字就在其中
(8)使用者搜尋接口格式
https://m.weibo.cn/api/container/getIndex?containerid=100103type%3d3%26q%3d關鍵字%26t%3d0%26page_type%3dsearchall
2.使用者資訊、使用者微網誌接口
(1)接着從上面第(6)步說,點選一個使用者頭像,跳轉到他的微網誌首頁,F12打開開發者工具并且切換到Network欄,觀F5重新整理頁面,觀察産生的資料。
(2)在此能夠得到兩個接口,一個是使用者資訊接口,一個是使用者微網誌接口。
(3)使用者資訊接口格式
https://m.weibo.cn/api/container/getIndex?uid=uid&containerid=100505uid
這是縮減以後的接口,其他參數可有可無。
(4)使用者微網誌接口格式
https://m.weibo.cn/api/container/getIndex?uid=uid&containerid=107603uid
**高亮部分需要您自行替換内容**