天天看點

隔着螢幕和你聊天的是不是人類? 人工智能的水準測試

作者:奔跑的三角龍

ChatGPT釋出以來,赢得各種好評,被各界人士所推崇。比爾蓋茨高度評價ChatGPT的出現的意義,将不亞于網際網路和個人電腦的誕生。在網絡上,網友們争先恐後去體驗它的智能:寫論文、寫聯考作文、寫代碼、寫小說......

也有傳聞說ChatGPT已經通過了圖靈測試。在網上搜尋了一下,多為各界的猜測,沒有明确的消息。

隔着螢幕和你聊天的是不是人類? 人工智能的水準測試

人工智能正在快速發展,它的成熟度也在不斷提高。Gartner釋出了《2022年人工智能技術成熟度曲線》,反映了人工智能發展的現狀。

隔着螢幕和你聊天的是不是人類? 人工智能的水準測試

當然,還有許多方法可以驗證人工智能的水準,例如圖靈測試和溫諾格拉德測試等。

一、圖靈測試

“圖靈測試”是人工智能領域中最著名的測試之一,最早出現在1950年圖靈發表的一篇名為《計算機械和智能》的論文中,是判斷機器是否具有人工智能的一套方法。

圖靈測試是人工智能最初的概念,它早于“人工智能”這個詞本身,“人工智能”這一詞是在1956年才被提出的。圖靈測試的發明者艾倫圖靈被譽為計算機科學之父、人工智能之父。

隔着螢幕和你聊天的是不是人類? 人工智能的水準測試

圖靈測試的方法其實很簡單,就是讓測試者與被測試者(一個人和一台計算機)隔離開,通過一些裝置(如鍵盤)向被測試者随意提問。進行多輪次的測試後,如果有超過30%的測試者不能确定出被測試者是人還是機器,那麼這台機器就通過了測試,并被認為具有人工智能。

二、溫諾格拉德測試

類似圖靈測試,旨在評估機器的智能水準的還有多倫多大學提出了「溫諾格拉德」測試。

溫諾格拉德測試(Winograd Schema Challenge,WSC),也叫威諾格拉德模式挑戰。是由多倫多大學計算機科學家赫克托·萊韋斯克提出的機器智能測試,試圖改進傳統的圖靈測試。它通過向機器詢問特别設計的選擇題進行檢測。這些問題都包含一種特殊結構,被稱為“威諾格拉德模式”(Winograd Schema),其名稱源于斯坦福大學計算機科學家特裡·威諾格拉德。

測試中,機器需要指出問題中某一代詞的先行詞。為了正确回答問題,機器需要要擁有常識推理的能力。

隔着螢幕和你聊天的是不是人類? 人工智能的水準測試

圖靈測試是判斷機器是否能夠思考、是否能表現出與人無法區分的智能。它給出了一個可操作的定義,為判斷智能提供了一個套客觀的标準。然而,在實際測試中,被測試的機器會故意回報一些虛張聲勢、混淆視聽的回答。參與測試的程式有的裝瘋賣傻、有的花言巧語來打斷對話者的思路等等,隻是單純為了通過測試。

也是針對這種現象才提出了溫諾格拉德測試來替代圖靈測試。相較于圖靈測試更加注重機器對常識推理和語言細微之處的了解能力。它可以更好地檢測機器是否具備更深層意義上的智能。

當然,無論是否通過這些測試,最重要的還是要看人工智能在實際應用中的表現。

且不說它是否通過了測試、是否有了人類的智慧。就現階段而言,它帶來的科技創新、商業應用創新将不斷的滲透我們的工作與生活,帶來的社會影響也将是巨大的。

#新人小白求關注#

#所見所得,都很科學#

#chatGTP人工智能#

#頭條新人#

繼續閱讀