天天看點

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

我的目錄

  • 微網誌三個接口的擷取
    • 1.使用者搜尋接口
    • (8)使用者搜尋接口格式
    • 2.使用者資訊、使用者微網誌接口
    • (3)使用者資訊接口格式
    • (4)使用者微網誌接口格式

不知不覺2021年了,先祝大家元旦快樂!這段時間有些忙,在學習tk,特地買了一本書來學(《Python GUI設計 tkinter菜鳥程式設計》),根據書中所學和網上資料,開發微網誌圖檔采集工具GUI版本。

本篇文章會詳細講解weibo三個接口的擷取。

微網誌三個接口的擷取

以下三個接口的擷取都是基于https://m.weibo.cn/

1.使用者搜尋接口

(1)首先打開https://m.weibo.cn/

這是微網誌手機版的網頁頁面。

(2)點選圖中紅框标記的位置,轉到搜尋頁面

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

(3)輸入一個關鍵字,搜尋一下。

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

(4)發現出來很多分類,有綜合、使用者、分類…

這時候就是關鍵了,打開F12開發者工具并且切換到Network,因為要找使用者搜尋的接口,是以切換到使用者一欄,最後F5重新整理頁面。

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

發現此處産生了很多請求與響應。

(5)微網誌不是靜态頁面,是以接口很可能在XHR(XMLHttpRequest)或者JS(JavaScript)中通過觀察Size大小以及對資料的判斷,最終找到了這個接口

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

其實根據url中的單詞也能夠簡單判斷他是搜尋的接口。

(6)驗證,在頁面中随便複制一位部落客的名字,在Netwoek中切換到Preview欄 ctrl+f,搜尋這位部落客大名,發現資料就在這個json中!

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

(7)分析這個接口

https://m.weibo.cn/api/container/getIndex?containerid=100103type%3D3%26q%3D%E4%BA%8B%E4%BB%B6%26t%3D0&page_type=searchall

把這個接口放到urldecode上解碼

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

能夠發現我們輸入的關鍵字就在其中

(8)使用者搜尋接口格式

https://m.weibo.cn/api/container/getIndex?containerid=100103type%3d3%26q%3d關鍵字%26t%3d0%26page_type%3dsearchall

2.使用者資訊、使用者微網誌接口

(1)接着從上面第(6)步說,點選一個使用者頭像,跳轉到他的微網誌首頁,F12打開開發者工具并且切換到Network欄,觀F5重新整理頁面,觀察産生的資料。

python3--詳細解讀微網誌接口擷取微網誌三個接口的擷取

(2)在此能夠得到兩個接口,一個是使用者資訊接口,一個是使用者微網誌接口。

(3)使用者資訊接口格式

https://m.weibo.cn/api/container/getIndex?uid=uid&containerid=100505uid

這是縮減以後的接口,其他參數可有可無。

(4)使用者微網誌接口格式

https://m.weibo.cn/api/container/getIndex?uid=uid&containerid=107603uid

**高亮部分需要您自行替換内容**