天天看點

【Python】爬蟲 | 有道翻譯

我的學習參考教程:http://c.biancheng.net/view/2011.html

因為我是初學者,是以有很多基礎的問題,這隻是我自己記錄自己學習的一個工具而已,希望大家不要是以而嘲笑我。

我今天做的是使用requests.post抓取有道翻譯。

使用 requests.post 方法抓取有道翻譯結果的完整代碼如下:

import requests        #導入requests包
import json
def get_translate_date(word=None):
    url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
    From_data={'i':word,'from':'zh-CHS','to':'en','smartresult':'dict','client':'fanyideskweb','salt':'15477056211258','sign':'b3589f32c38bc9e3876a570b8a992604','ts':'1547705621125','bv':'b33a2f3f9d09bde064c9275bcb33d94e','doctype':'json','version':'2.1','keyfrom':'fanyi.web','action':'FY_BY_REALTIME','typoResult':'false'}
    #請求表單資料
    response = requests.post(url,data=From_data)
    #将Json格式字元串轉字典
    content = json.loads(response.text)
    print(content)
    #列印翻譯後的資料
    #print(content['translateResult'][0][0]['tgt'])
if __name__=='__main__':
    get_translate_date('我愛中國')
           

我自己在這個過程中遇到的問題:

  1. if __name__=='__main__':

    是什麼意思?

    我搜尋了一下,自己總結了一下,大概的意思是,如果目前的這個py檔案是主函數的話執行,如果是作為子產品被其他檔案導入的時候,不執行。

    以下是我主要參考的部落格:

    https://www.cnblogs.com/chen8023miss/p/11189938.html

    https://blog.csdn.net/anshuai_aw1/article/details/82344884

    另外需要注意的是,_有兩個。

  2. 在我debug完了跑通了以後,顯示

    {‘errorCode’: 50}

    我百度了一下,是因為有道有反爬蟲機制,

    解決方法:去除url中的_o即可

    這裡我還不太懂,需要進一步研究

繼續閱讀