天天看點

手把手使用Python教你破解谷歌(Google)人機驗證碼—上篇

/1 前言/

今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜尋引擎了,我們可以借助Google龐大的搜尋資源找到一些自己想要的資源,可能是一些收費電影,可能是一些奇門小說,可能是某個角落的種子,不管怎麼說,Google搜尋還是挺給力的,但是呢,有梯子的我們可能都遇到過,我們搜尋的多了,會有下圖的這種情況。

這種驗證碼呢,叫做ReCaptcha驗證碼,相對來說,是比較繁瑣的驗證碼之一。

  當然了,ReCaptcha不止谷歌一家在用,國外的網站很多都是使用這種驗證碼,但是在國内不多,因為在國内比較容易被牆,是以用的少。但是我們是高端玩家,在自由的Internet中,我們怎麼可能隻局限于國内,下面,我們就針對ReCaptcha驗證碼進行破解。

/2 測試網站預覽/

  測試網站:

https://www.google.com/recaptcha/api2/demo

  谷歌提供的範例,實際網站驗證碼和這個一模一樣。

ReCaptcha驗證碼樣式,如下圖所示。

/3 為什麼使用第三方平台/

今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜尋引擎了。老讀者們可能知道,年前的時候我用第三方服務破解了B站的登入,沒有來得及上車的小夥伴可以戳這兩篇文章:幹貨|Python大佬手把手帶你破解哔哩哔哩網滑動驗證(上篇),幹貨|Python大佬手把手帶你破解哔哩哔哩網滑動驗證(下篇)。但是經常逛B站的小夥伴們肯定都知道B站目前已經更改了登入方式,想了解之前B站自動登入的小夥伴可以戳這裡:Python奇淫技巧之自動登入哔哩哔哩,是以我那篇文章真是趕上了末班車,但是然并卵,現在肯定是登入不了了。後期有時間,給大家整理一篇關于B站破解的新文章學習一下。

嗯,看到這可能有人會對我不屑一顧,說辣雞才會用第三方平台,要是按照技術來劃分的話,我是真的辣雞,哈哈~~

  但是這裡要擡杠一下,并不是說用第三方平台就是辣雞,我們可以想象一下,如果是滑動驗證碼,我們當然有一試的能力,python可以調用OpenCV,看看文檔,當然是可以實作了。但是有個問題是,你可能針對的一個網站的滑動驗證識别好了,但是在每個網站的滑動驗證碼都不太一樣的情況下,在用OpenCV識别的時候,可能就會出現識别率低的情況。要是在公司,一直完不成任務,嗯,,,等着被炒鱿魚吧,再說,像谷歌人機個人也解決不了,沒有NB的機器學習是不可能的,是以隻能用第三方平台,畢竟,完成任務才是首要任務。

  話不多說,這裡選用的第三方平台:

https://2captcha.com/zh?from=8779379

/4 為什麼使用第三方平台/

我們先來了解一下現在打碼平台機制大概都有哪些,不是很全面,但是可以參考一下。

  第一種呢:就是打碼平台訓練好各種各樣的資料,比如,哪些是花,哪些是車,然後我們把圖檔發送給打碼平台,他給我們結果,但是這樣會有個問題,如果訓練的不好,我們這邊的結果也是很不好的,各種不準确,影響效果

  第二種:就是平台雇人,我們把整個驗證碼都給打碼平台,平台找人幫助我們點選,然後把結果給我們,我們在登入了或者做其他

  我們可以看出來,肯定是第二種更加靈活的,現在階段,機器再NB,至少 在驗證碼上準确率還是不如我們人類這麼機智的。

  2captcha平台目前采用的就是第二種方式,賺取的是中間差價,但是識别率是我用過最高的,曾經因為選錯了平台,一直不成功,加班加點,滑鼠都被我砸壞了,唉,是以,選擇一個合适的平台還是很重要的

/5 所需工具/

Chromedriver:浏覽器驅動,可以了解為一個沒有界面的chrome浏覽器。

Selenium:用于模拟人對浏覽器進行點選、輸出、拖拽等操作,就相當于是個人在使用浏覽器,也常常用來應付反爬蟲措施。

/6 總結/

寫到這裡,文章字數已經将近2000字了,介于篇幅原因,這篇文章主要介紹了第三方打碼平台(點選閱讀原文可以擷取)和破解的理論部分,下一篇文章将詳細介紹破解谷歌人機的具體過程,下篇文章會配上較多的圖和代碼,小夥伴們敬請期待吧!

繼續閱讀