隔着螢幕和你聊天的是不是人類？人工智能的水準測試

作者：奔跑的三角龍 2023-06-14 14:07:00

ChatGPT釋出以來，赢得各種好評，被各界人士所推崇。比爾蓋茨高度評價ChatGPT的出現的意義，将不亞于網際網路和個人電腦的誕生。在網絡上，網友們争先恐後去體驗它的智能：寫論文、寫聯考作文、寫代碼、寫小說......

也有傳聞說ChatGPT已經通過了圖靈測試。在網上搜尋了一下，多為各界的猜測，沒有明确的消息。

人工智能正在快速發展，它的成熟度也在不斷提高。Gartner釋出了《2022年人工智能技術成熟度曲線》，反映了人工智能發展的現狀。

當然，還有許多方法可以驗證人工智能的水準，例如圖靈測試和溫諾格拉德測試等。

一、圖靈測試

“圖靈測試”是人工智能領域中最著名的測試之一，最早出現在1950年圖靈發表的一篇名為《計算機械和智能》的論文中,是判斷機器是否具有人工智能的一套方法。

圖靈測試是人工智能最初的概念，它早于“人工智能”這個詞本身，“人工智能”這一詞是在1956年才被提出的。圖靈測試的發明者艾倫圖靈被譽為計算機科學之父、人工智能之父。

圖靈測試的方法其實很簡單，就是讓測試者與被測試者（一個人和一台計算機）隔離開，通過一些裝置（如鍵盤）向被測試者随意提問。進行多輪次的測試後，如果有超過30%的測試者不能确定出被測試者是人還是機器，那麼這台機器就通過了測試，并被認為具有人工智能。

二、溫諾格拉德測試

類似圖靈測試，旨在評估機器的智能水準的還有多倫多大學提出了「溫諾格拉德」測試。

溫諾格拉德測試（Winograd Schema Challenge，WSC），也叫威諾格拉德模式挑戰。是由多倫多大學計算機科學家赫克托·萊韋斯克提出的機器智能測試，試圖改進傳統的圖靈測試。它通過向機器詢問特别設計的選擇題進行檢測。這些問題都包含一種特殊結構，被稱為“威諾格拉德模式”（Winograd Schema），其名稱源于斯坦福大學計算機科學家特裡·威諾格拉德。

測試中，機器需要指出問題中某一代詞的先行詞。為了正确回答問題，機器需要要擁有常識推理的能力。

圖靈測試是判斷機器是否能夠思考、是否能表現出與人無法區分的智能。它給出了一個可操作的定義，為判斷智能提供了一個套客觀的标準。然而，在實際測試中，被測試的機器會故意回報一些虛張聲勢、混淆視聽的回答。參與測試的程式有的裝瘋賣傻、有的花言巧語來打斷對話者的思路等等，隻是單純為了通過測試。

也是針對這種現象才提出了溫諾格拉德測試來替代圖靈測試。相較于圖靈測試更加注重機器對常識推理和語言細微之處的了解能力。它可以更好地檢測機器是否具備更深層意義上的智能。

當然，無論是否通過這些測試，最重要的還是要看人工智能在實際應用中的表現。

且不說它是否通過了測試、是否有了人類的智慧。就現階段而言，它帶來的科技創新、商業應用創新将不斷的滲透我們的工作與生活，帶來的社會影響也将是巨大的。

#新人小白求關注#

#所見所得，都很科學#

#chatGTP人工智能#

#頭條新人#

隔着螢幕和你聊天的是不是人類？人工智能的水準測試

繼續閱讀

卡内基梅隆大學研究人工智能更好為人類提供公平的方法

人工智能行業深度報告-“元年”之後-再看大模型應用商業化進展

人工智能疊代一切，文科生将是“最後幸存者”

一件純花錢的事連幹6年，阿裡還樂此不疲，背後野心藏不住了！就在6月13号，2024阿裡數學競賽決賽名單新鮮出爐，共有全球

2024:美國财富500強最多的州今年進入财富500強榜單的公司總部分布在37個州的226個城市，從俄亥俄州的小城鎮到洛

歡迎！德國科學院院士Gerhard P. Fettweis加入亞太人工智能學會

AI 資料模組化：人工智能如何重塑人類進步的未來（3/5）

大模型應用之路：從提示詞到通用人工智能（AGI）

什麼是人工智能，它與人工智能有何不同，它們的用途是什麼？

北約未來二十年：人工智能技術的戰略演進與前瞻

頂尖龍頭+算力+人工智能+存儲+機器人+半導體+短劇+預制菜

AIGC如何幫助數字内容的生産者降本增效在數字時代，内容生産者的效率和成本控制至關重要。AIGC（人工智能生成内容）技術

AI 資料模組化：人工智能如何重塑人類進步的未來（4/5）

人工智能概念股，今年以來漲跌幅排名：

拙文《與何祚庥院士讨論大型粒子對撞機問題》發表之後，何祚庥院士随即給我留言進一步強調“@劉長玉。最為關鍵的問題，是不是"

探索文字魅力：從初識到共鳴，人工智能助手的心路曆程

隔着螢幕和你聊天的是不是人類？ 人工智能的水準測試

繼續閱讀

隔着螢幕和你聊天的是不是人類？人工智能的水準測試