天天看点

隔着屏幕和你聊天的是不是人类? 人工智能的水平测试

作者:奔跑的三角龙

ChatGPT发布以来,赢得各种好评,被各界人士所推崇。比尔盖茨高度评价ChatGPT的出现的意义,将不亚于互联网和个人电脑的诞生。在网络上,网友们争先恐后去体验它的智能:写论文、写高考作文、写代码、写小说......

也有传闻说ChatGPT已经通过了图灵测试。在网上搜索了一下,多为各界的猜测,没有明确的消息。

隔着屏幕和你聊天的是不是人类? 人工智能的水平测试

人工智能正在快速发展,它的成熟度也在不断提高。Gartner发布了《2022年人工智能技术成熟度曲线》,反映了人工智能发展的现状。

隔着屏幕和你聊天的是不是人类? 人工智能的水平测试

当然,还有许多方法可以验证人工智能的水平,例如图灵测试和温诺格拉德测试等。

一、图灵测试

“图灵测试”是人工智能领域中最著名的测试之一,最早出现在1950年图灵发表的一篇名为《计算机械和智能》的论文中,是判断机器是否具有人工智能的一套方法。

图灵测试是人工智能最初的概念,它早于“人工智能”这个词本身,“人工智能”这一词是在1956年才被提出的。图灵测试的发明者艾伦图灵被誉为计算机科学之父、人工智能之父。

隔着屏幕和你聊天的是不是人类? 人工智能的水平测试

图灵测试的方法其实很简单,就是让测试者与被测试者(一个人和一台计算机)隔离开,通过一些装置(如键盘)向被测试者随意提问。进行多轮次的测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人工智能。

二、温诺格拉德测试

类似图灵测试,旨在评估机器的智能水平的还有多伦多大学提出了「温诺格拉德」测试。

温诺格拉德测试(Winograd Schema Challenge,WSC),也叫威诺格拉德模式挑战。是由多伦多大学计算机科学家赫克托·莱韦斯克提出的机器智能测试,试图改进传统的图灵测试。它通过向机器询问特别设计的选择题进行检测。这些问题都包含一种特殊结构,被称为“威诺格拉德模式”(Winograd Schema),其名称源于斯坦福大学计算机科学家特里·威诺格拉德。

测试中,机器需要指出问题中某一代词的先行词。为了正确回答问题,机器需要要拥有常识推理的能力。

隔着屏幕和你聊天的是不是人类? 人工智能的水平测试

图灵测试是判断机器是否能够思考、是否能表现出与人无法区分的智能。它给出了一个可操作的定义,为判断智能提供了一个套客观的标准。然而,在实际测试中,被测试的机器会故意反馈一些虚张声势、混淆视听的回答。参与测试的程序有的装疯卖傻、有的花言巧语来打断对话者的思路等等,只是单纯为了通过测试。

也是针对这种现象才提出了温诺格拉德测试来替代图灵测试。相较于图灵测试更加注重机器对常识推理和语言细微之处的理解能力。它可以更好地检测机器是否具备更深层意义上的智能。

当然,无论是否通过这些测试,最重要的还是要看人工智能在实际应用中的表现。

且不说它是否通过了测试、是否有了人类的智慧。就现阶段而言,它带来的科技创新、商业应用创新将不断的渗透我们的工作与生活,带来的社会影响也将是巨大的。

#新人小白求关注#

#所见所得,都很科学#

#chatGTP人工智能#

#头条新人#

继续阅读