天天看點

探秘機器是如何“長大成人”(含視訊)

        在網際網路世界裡,算法無處不在。例如:當你打開TweetBook時,是算法決定你會看到什麼内容。當你在相冊中搜尋照片時,也是算法幫你查找,甚至可以為你制作成小視訊。當你購買東西時,還是算法标出價格,并且還在你的銀行賬戶中識别詐騙交易。

        股票市場也充斥着大量算法交易。出于好奇心,你可能想要了解這些簡單算法機器人是如何在你的工作領域工作的。在過去,我們通過給予可以解釋的指令來建構算法機器人,例如“if then”語句。但是對一個人類來說,為算法機器人寫出簡單指令的任務太艱巨、太困難了。比如,一秒内會有大量的金融交易,哪些是詐騙的?在NetMeTube上有無法計算數量的視訊,那應該推薦哪八個視訊給使用者觀看呢?哪些視訊應該在本網站完全禁止?對這個航空公司的座位,此時使用者願意支付的最高價格是多少?對于這些問題,算法機器人都能給出答案。雖然不是完美答案,但是比人類能做到的要好得多。這些機器人是如何工作的越來越精準的,沒有人知道,即使是建造它們的人也不知道。

     機器人的大腦建構是一個嚴格保守的商業機密,而且現在的大腦一般都處于低智商階段,不能完全了解人們的意思。例如:現在問任何一個網站上的機器人:“我希望你喜歡線性代數”,它們的回答都是“我不知道”。

        接下來我們讨論一種可以了解的方法:機器人是否可以被“建構”?假設你想要一個能識别圖檔的機器人,識别圖檔中是一個蜜蜂還是一個數字三?這對人類來說非常容易,但是我們無法用機器語言告訴機器人它是什麼,因為我們隻知道這是一隻蜜蜂,那是一個數字“三”。我們能通過說話來描述區分他們,但是機器人不了解我們所說的。那是在我們大腦中的印象輪廓使我們能夠識别的出來。雖然個别的神經元可以被了解,神經元的綜合行動集合也被大概地掌握,但整體是超越性的。 是以,要得到一個可以進行分類的機器人,隻需要建一個機器人去制造機器人,再建一個機器人來教授機器人。制造型機器人制造機器人,盡管他們也不太擅長這個。起初,建造型機器人幾乎都是随機的連接配接這些機器人大腦中的線路和子產品,這導緻了一些非常“特殊”的機器人被送到教師型機器人那裡去教機器人。

        當然,教師型機器人也無法分辨蜜蜂和數字“三”,如果人類能夠制造出那樣的教師型機器人,問題就解決了。教師型機器人不會教,但是能夠測試。呆萌的學生機器人非常的努力,但是它們做的卻非常糟糕。最後,那些做的好的機器人被放到一邊,其他的被回收。制造者機器人仍然不擅長制造機器人,但是現在它将剩下的機器人在重組和改變之後再複制出多個。

        現在,制造者機器人随機的制造,教師機器人不教隻是測試,學生機器人不會學,理論上是不會出現現在這樣的機器人,但是實際中,确實實作了。部分原因在于,在每一次疊代中,制造者機器人都會保留最好的機器人,丢棄其餘的,另外部分原因是,教師型機器人并不是隻教十幾個,而是上千個。考試也不是就十個問題,而是一百萬個問題。

        幸存的學生型機器人僅僅是因為幸運,但是通過結合足夠多的幸運機器人,并且隻保留那些有用的,随機的整合新的機器人,最終産生了一個幾乎可以分辨蜜蜂和數字三的機器人。随着這個機器人被不斷的複制和改進,平均測試分數會慢慢上升,是以,在接下來的一輪中生存下來機器人需要的測試分數也越來越高。一直持續如此,定會出現一個機器人,它能超越之前所有機器人,完美的分辨出一張照片上是一隻蜜蜂還是數字“三”。

        但是學生型機器人是如何做到的呢?在保留了這麼多有用的随機變化之後,它的頭部的線路變得異常複雜,它可能了解單個代碼行,模糊地了解代碼集合的一般用途,然後整體結果是超越的。但這是令人沮喪的,特别是因為學生機器人完全隻擅長處理被教給的那些類的問題。

        它對識别照片非常有用,但對視訊或者颠倒的照片,或者明顯不是蜜蜂的照片就毫無用處了。業内公認,足夠多的訓練資料能夠讓學生型機器人學的更好,這也是為什麼公司癡迷于收集資料的原因:更多的資料等于更長測試時間等于更好的機器人。

是以,當你在網站上回答“你是人類嗎?”你不僅證明了你是人類,還幫忙進行了測試,使機器人能夠閱讀、或者計數、或者分辨山和湖、人和馬。

        但是機器人真正的想法,或者說它是如何思考的,是不可知的。可以知道的是,這個學生型機器人逐漸變成了算法,因為它與之前的機器人相比,在完成人類設計的測試任務時要高出1%。是以無論在網際網路上,還是在幕後,都有一些測試來增加與使用者的互動,或者設定最高價格來擷取最大化收益,或者從你所有的朋友那裡挑出你最喜歡的文章,或者被其他人分享最多的文章。如果這些東西是可測試的或可教的。“可教的”,一個學生機器人将從資料庫中畢業成為該領域的算法程式。我們習慣了使用那些即使我們不了解的工具,有的人能了解,但用這些機器去學習我們越來越多的使用工具或者被工具使用的崗位,然而沒有人哪怕是它們的創造者了解它們。我們隻能寄希望于通過制定的測試來指導它們,我們需要适應這種情況,畢竟算法機器人到處都是,它在無時無刻的從你身上學習知識。

視訊教程網址:

文章原标題《How Machines Learn - YouTube》

作者:Lilian Weng

譯者:奧特曼,審校:袁虎。

繼續閱讀