隔着屏幕和你聊天的是不是人类？人工智能的水平测试

作者：奔跑的三角龙 2023-06-14 14:07:00

ChatGPT发布以来，赢得各种好评，被各界人士所推崇。比尔盖茨高度评价ChatGPT的出现的意义，将不亚于互联网和个人电脑的诞生。在网络上，网友们争先恐后去体验它的智能：写论文、写高考作文、写代码、写小说......

也有传闻说ChatGPT已经通过了图灵测试。在网上搜索了一下，多为各界的猜测，没有明确的消息。

人工智能正在快速发展，它的成熟度也在不断提高。Gartner发布了《2022年人工智能技术成熟度曲线》，反映了人工智能发展的现状。

当然，还有许多方法可以验证人工智能的水平，例如图灵测试和温诺格拉德测试等。

一、图灵测试

“图灵测试”是人工智能领域中最著名的测试之一，最早出现在1950年图灵发表的一篇名为《计算机械和智能》的论文中,是判断机器是否具有人工智能的一套方法。

图灵测试是人工智能最初的概念，它早于“人工智能”这个词本身，“人工智能”这一词是在1956年才被提出的。图灵测试的发明者艾伦图灵被誉为计算机科学之父、人工智能之父。

图灵测试的方法其实很简单，就是让测试者与被测试者（一个人和一台计算机）隔离开，通过一些装置（如键盘）向被测试者随意提问。进行多轮次的测试后，如果有超过30%的测试者不能确定出被测试者是人还是机器，那么这台机器就通过了测试，并被认为具有人工智能。

二、温诺格拉德测试

类似图灵测试，旨在评估机器的智能水平的还有多伦多大学提出了「温诺格拉德」测试。

温诺格拉德测试（Winograd Schema Challenge，WSC），也叫威诺格拉德模式挑战。是由多伦多大学计算机科学家赫克托·莱韦斯克提出的机器智能测试，试图改进传统的图灵测试。它通过向机器询问特别设计的选择题进行检测。这些问题都包含一种特殊结构，被称为“威诺格拉德模式”（Winograd Schema），其名称源于斯坦福大学计算机科学家特里·威诺格拉德。

测试中，机器需要指出问题中某一代词的先行词。为了正确回答问题，机器需要要拥有常识推理的能力。

图灵测试是判断机器是否能够思考、是否能表现出与人无法区分的智能。它给出了一个可操作的定义，为判断智能提供了一个套客观的标准。然而，在实际测试中，被测试的机器会故意反馈一些虚张声势、混淆视听的回答。参与测试的程序有的装疯卖傻、有的花言巧语来打断对话者的思路等等，只是单纯为了通过测试。

也是针对这种现象才提出了温诺格拉德测试来替代图灵测试。相较于图灵测试更加注重机器对常识推理和语言细微之处的理解能力。它可以更好地检测机器是否具备更深层意义上的智能。

当然，无论是否通过这些测试，最重要的还是要看人工智能在实际应用中的表现。

且不说它是否通过了测试、是否有了人类的智慧。就现阶段而言，它带来的科技创新、商业应用创新将不断的渗透我们的工作与生活，带来的社会影响也将是巨大的。

#新人小白求关注#

#所见所得，都很科学#

#chatGTP人工智能#

#头条新人#

隔着屏幕和你聊天的是不是人类？人工智能的水平测试

继续阅读

美政府被曝正考虑再出招限制中国获取用于人工智能的芯片技术，中方此前已表态

数学到底有多重要，看官媒给你科普。与航空航天，国防安全，生物医药，海洋，人工智能，信息，能源，先进制造的联系越来越紧密。

卡内基梅隆大学研究人工智能更好为人类提供公平的方法

人工智能行业深度报告-“元年”之后-再看大模型应用商业化进展

人工智能迭代一切，文科生将是“最后幸存者”

一件纯花钱的事连干6年，阿里还乐此不疲，背后野心藏不住了！就在6月13号，2024阿里数学竞赛决赛名单新鲜出炉，共有全球

2024:美国财富500强最多的州今年进入财富500强榜单的公司总部分布在37个州的226个城市，从俄亥俄州的小城镇到洛

欢迎！德国科学院院士Gerhard P. Fettweis加入亚太人工智能学会

AI 数据建模：人工智能如何重塑人类进步的未来（3/5）

大模型应用之路：从提示词到通用人工智能（AGI）

什么是人工智能，它与人工智能有何不同，它们的用途是什么？

北约未来二十年：人工智能技术的战略演进与前瞻

顶尖龙头+算力+人工智能+存储+机器人+半导体+短剧+预制菜

AIGC如何帮助数字内容的生产者降本增效在数字时代，内容生产者的效率和成本控制至关重要。AIGC（人工智能生成内容）技术

AI 数据建模：人工智能如何重塑人类进步的未来（4/5）

人工智能概念股，今年以来涨跌幅排名：

隔着屏幕和你聊天的是不是人类？ 人工智能的水平测试

继续阅读

隔着屏幕和你聊天的是不是人类？人工智能的水平测试