天天看點

圖靈測試過時了?

文章目錄

  • ​​一、什麼是圖靈測試?​​
  • ​​二、計算機是否通過了圖靈測試?​​
  • ​​三、圖靈測試已過時?​​

一、什麼是圖靈測試?

“機器是否能夠思考?”,1950 年,Alan Turing 針對這個問題提出了一個著名的思想實驗:圖靈測試(Turing test),用于測試機器是否能表現出與人等價或無法區分的智能。

測試的談話僅限于使用唯一的文本管道,例如計算機鍵盤和螢幕,這樣的結果不依賴于計算機把單詞轉換為音頻的能力。

測試内容:測試者與被測試者(一個人和一台機器)在不發生實體接觸的情況下,由測試者通過一些裝置(如鍵盤)向被測試者随意發問。經過多次測試後,如果有超過 30%的測試者不能确定被測試者是人還是機器,那麼這台機器就通過了測試。

二、計算機是否通過了圖靈測試?

自從圖靈測試的概念誕生以來,所有的人工智能均以通過圖靈測試為目标。那麼,70 年過去了,至今為止計算機是否通過了圖靈測試呢?

2014 年 6 月 8 日,在 Alan Turing 逝世 60 周年紀念日這一天,英國皇家學會舉行了 2014 圖靈測試大會,聊天程式 Eugene Goostman 成功騙過了研究人員,并首次“通過”了圖靈測試。然而,後來有文章指出它其實并未真正通過所有測試。

後來,Google 的 GPT-3 通過圖靈測試的新聞也業界引起了廣泛的關注。然而,對于此次測試,有人表示稱贊,也有不少人仍然表示質疑。

三、圖靈測試已過時?

為什麼我們至今仍然無法通過圖靈測試?

原因之一是目前的人工智能研究者們對于通過圖靈測試的興趣不大,因為圖靈測試的目标和目前的人工智能研究方向并不完全一緻。

主要表現在以下方面:

圖靈測試幾乎沒有考慮到人工智能的“機器”屬性,如高速計算和資訊檢索等功能,而這兩者正是現代計算機最擅長的部分。
要通過圖靈測試,人工智能必須能夠“欺騙”人類,而要想完美地欺騙,人工智能必須模仿人類在回答問題時的延遲。例如“129*3256=?”,“北京到上海的距離是多少?”這類的問題,普通人作答需要花費很長時間計算或查找資訊,但計算機完全可以立即給出答案。以現在的觀點來看,讓計算機放棄自己的優勢去模拟人類的延遲是完全沒有必要的。
圖靈測試僅考慮了文本交流的情況,而沒有考慮到現在的人工智能已經能夠使用各種傳感器,能夠從視覺、聽覺、觸覺等多角度來感受外部世界。      

那麼這是否表明圖靈測試已經過時呢?

這是大衆對于圖靈測試的一個廣泛誤解。實際上,圖靈測試是人工智能的一個充分條件,它本身并沒有試圖定義人工智能的範疇。換句話說,一個優秀的人工智能應該“能夠”通過圖靈測試,但并不表明圖靈測試是人工智能的全部。是以,圖靈測試并沒有過時,隻不過現代人工智能研究并沒有把通過圖靈測試作為重點而已。

四、圖靈測試與如今的 AI 發展

如今人工智能研究的目标不再局限于 AI 是否與人類有差別,而是發揮機器的速度和資訊搜尋優勢,增強人類的智力,改善人們的日常生活。

現在智能手機的計算能力都是阿波羅 Apollo 11 的幾十萬倍,再加上雲計算和高帶寬連接配接,人工智能可以在幾秒鐘内根據大量資料做出決策。這些都是普通人無法完成的事情。基本目标之一是讓 AI 展現類似于人類的智力屬性,包括擁有常識、自我監督以及語言能力,并結合快速搜尋和超強的記憶力,代替人類完成工作。

那麼,我們現在應該如何評價人工智能呢?

亞馬遜于 2016 年設立的“Alexa 大賽”可以為我們提供一些參考。該比賽的要求是制造一個“社交機器人”,而評判标準則是由人類與該機器人交談 20 分鐘,内容涉及娛樂、體育、政治、科技等方方面面,然後由人類以是否願意與該機器人再次交談為标準進行評分。

整個過程中,人類事先知道交談對象是機器人。可以看到,為了讓人類“願意”與機器人繼續交談,機器人必須優先展示出幽默感、同理心等,但模仿人類并不是最優先的目标。

此外,我們還可以從日常生活對于人工智能助手的接受程度來評價人工智能的發展。人工智能想要融入日常生活,就要在人類有需要時提供幫助,不需要時退居幕後。例如,它可以在你睡覺時幫你關閉忘記關掉的燈,或者在發生意外情況時自動報警燈。人工智能還應該有能力解決更為通用的任務,而不僅僅是幫你設定日程安排這種特殊任務,這就要求它必須有足夠強大、足夠通用的自我學習能力。

這些評價标準都與圖靈測試相去甚遠,但并不妨礙圖靈測試成為人工智能的充分條件。

繼續閱讀