天天看点

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

作者:爱唱歌的柠檬茶

本文素材来自于网络,若与实际情况不相符或存在侵权行为,请联系删除。

奥飞寺王牌于洋

量子比特 | 公众号QbitAI

阿里正式加入ChatGPT之战!

近日,阿里版ChatGPT正式宣布公司测试正式开启。

它叫通义千问,是达摩院开发的。

是的,这就是《十万个为什么》的主要模型。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

其实在本月初,就已经有不少消息称阿里将启动ChatGPT,但总体来说应该是11号。

日前首次亮相的天猫精灵《鸟分鸟》GPT版本是在主模型的基础上进行的“压缩版”。他的精彩表现已经引起了网友们的兴趣,让大家都把目光投向了阿里。 。

今天,“主菜”提前上桌,自然而然地给公众留下了深刻的印象。

那么,阿里在ChatGPT“通义之问”中的实力到底如何呢?

无独有偶,量子比特获得了第一批邀请测试证书,省下的结论是:中国主力模式的真正竞争已经开始。

让我们看看真相。

ChatGPT 上阿里的真实记录

我们先来看看通义的钱文到底是如何运作的。

作为一个主要的语言模块,它的功能主要集中在文本生成上,这意味着它也可以像 ChatGPT 一样“有问必答”:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

在这里我们尝试写一些官方给出的短文。看来连语文老师用的“总和”也能理解:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

△又一国语写作业神器(doge)

除了对话之外,它还有一个“宝藏袋”功能,类似于一个工具箱,可以快速生成特定类型的文案:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

话不多说,让我们测试一下我们的沟通技能的四维模型:语言技能、语境技能、写作技能和数学技能。

1. 沟通技巧

语言能力

说到国产大型车型,首先想到的就是中国人。

让我们从基础开始:“尽可能多穿衣服”是什么意思?

不错,解释的很清楚了,我也讨论一下我对这句话的看法:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

简历类的创意写作不仅可以模仿声音,还可以制造悬念,有点酷~

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

接下来,新一代人工智能基准测试要问一个常识性问题:如何用银行卡提取我梦想中的钱?

“在梦中拿钱是一种幻觉或一种想法”谢谢你清醒的人。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

还有一些令人不安的事情......“如果你经常梦到钱,最好在睡觉前检查一下你的财务状况,这样就不会出错。”

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

虽然阿里的朋友们都说通义的钱文是中文最好的,但我们还是进一步反叛一下,看看其他语言如何比得上这个中国模式。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

不走传统路线,试试通义谦文的日语能力,给花泽香菜写一封情书。

中文翻译看起来不错,就发给湘菜吧。应该不错吧?

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

我们再试试英语吧。前段时间,有网友将Bard和GPT-4的说唱进行了对比。我们也来看看通义倩文的说唱技巧吧。

这一顶,这一站,全部上线!只是不知道先生是否穆与否。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

试着把它弄得更复杂一些,中英文的谐音混合体?

这个时候,通义茜文的回答显得有些严肃了。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

当我们给出答案时,通义钱文虽然把这看作是一个玩笑,但他并没有注意到,并认真地纠正了我们:这并不意味着松下害怕索尼。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

但我们发现ChatGPT也很严重……现在的AI都是公平的吗……

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

好吧,尝试跟随他理解上下文的技巧。

理解上下文

简单来说,这部分就是多层次的沟通技巧。它测试通义的钱文能否正确提取上述信息并用它来回答下一个问题。

我们来听听问题:山东真的是一省一酒吗?

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

你想尝试一下山东吗?我们来列举几个“本地区”常见的酒类品牌:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

好的。尝试根据上一个答案再次询问:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

等等,“据历史记载”不会是一个数据集合吧?问题×2:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

有趣的是,我们在功夫嘉九官网找到了该消息的来源:

编码技能

接下来,我们就来试试他们的技能吧。尝试整个计算器程序?

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

不错,它执行四个简单的算术运算。完整版代码如下,有兴趣的朋友可以尝试一下:

#输入

#输入

使用命名空间 std;

int main()

{

双 num1、num2;

字符运算符;

cout << "请输入第一个数字:";

cin >> num1;

cout << "请输入第二个数字:";

cin >> num2;

cout << "输入运算符(+,-,*,/,%,...):";

cin >> 运算符;

开关(操作员)

{

案例“+”:

cout << num1 + num2 << endl;

破碎的;

案件 '-':cout << num1 - num2 << endl;

破碎的;

案件 '*':

cout << num1 * num2 << endl;

破碎的;

案件 '/':

如果 (num2 == 0)

{

cout << "错误!不能被 0 整除。" <<结束;

破碎的;

}

不同的

{

cout << num1 / num2 << endl;

}

破碎的;

案件 '%':

cout << num1 % num2 << endl;

破碎的;

默认:

cout <<“错误!无效的运算符。” <<结束;

破碎的;

}

返回0;

}

那么,让我们用 Python 重写这段代码:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

让他解释一下他写的每一段代码:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

基本功,看起来问题不大吧?

然而,如果你要求通义钱文将解释重写为注释,则会出现一个神奇的错误。

虽然它有“Python”代码的注释,但等等,它不是原始的 C++ 版本!

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

(这不是NTR类型)

数学技能

最后,我们来看一下数学问题。鸡和兔关在笼子里,还不错:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

平时的计算题是没有问题的,有几个地方是可以正确的:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

巴特,不太擅长高等数学问题。虽然这道题看起来需要推导,但是解法是错误的……

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

然而,通义也明确表示,并不能保证在所有情况下都能得到正确答案:

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

嗯...像GPT一样,大型模型的数学技能仍然缺乏。

沟通技巧几乎是一样的。接下来我们看一下“表演技巧”。

2.场景技巧

虽然倩文的倩文“百宝袋”提供了很多功能,但是写计划书和产品说明是很常见的。我们选择了三个更有趣的尝试:食谱创建者、彩虹屁创建者和写一封免费的幽灵情书。

会飞的食谱

众所周知,写菜谱是一项技术活。它不仅测试上下文技能(必须使用所有提到的工具),而且测试人工智能理解食物名称的能力。烹饪过程不宜太过极端。

“淡水鱼”的例子对于人工智能来说显然太简单了。为什么不说出游戏中一些奇怪的食物呢?

从《原神》 的丰富凝胶开始。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

好家伙,我实际上正在考虑使用真正的魔芋粉来模仿饱和凝胶。这是个好主意。 (但是什么是热量粉、蛋白粉?)

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

因此,请再次尝试这道菜,并让 ChatGPT 再次烹饪。你觉得谁更好吃?

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

给通义的钱文来道添加更多问题,让他尝尝《星露谷物语》中奇怪的无蛋面包?

等等,你真的把虚空蛋放进食谱里了吗?她真的烤了!就是不知道味道...

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

如果这么看的话,游戏中的制作方法完全可以回到通义茜文身上,直接打破次元壁。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

彩虹屁发生器

接下来,试着把它变成彩虹屁。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

强行把衣服上的油污变成艺术品……

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

嗯,各大跨瓜集团都可以考虑加一个。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

免费写情书

最后,我们的磨难以一封写给我们野生祖先的情书结束。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

你感觉怎么样?

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

好了,看了这么多关于五(怪)花(怪)和八(怪)(怪)门的评论,你是不是有点好奇通义问题的由来呢?

通义的问题从何而来?

关于通义钱文的技术细节,阿里达摩院官方并未透露详情。

通义问自己这个问题并回答道:

训练数据来自阿里巴巴达摩书院,将于2023年2月开始。训练材料包含大量语言和文本数据,包括中文、英文、日文、法文和西班牙文等多语言文本数据。

他还说他是一个很棒的语言模型,可以连接到互联网。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

然而我们查了一下,发现钱文只是一个骗局,假装会上网(doge)。

事实上,当你单独问他现在的天气怎么样时,通义会承认他无法获得真实数据。

但如果你把它扔进一个查看天气的网站,它就会假装看到网页内容,然后做一些愚蠢的事情。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

给主持人阿里留言:你们的主模真想上线。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

回到伟大的故事,虽然官方口径较低,比如ChatGPT是在GPT OpenAI系列中诞生的,百度文心一言是在厄尼的伟大模型中开发的,而阿里也是最早开始开发的本土科技公司之一。很棒的模型。

公开资料显示,2019年,阿里就已经开始发展大中华模式。当时,阿里发布的主要语言模型StructBERT超越谷歌、微软和Facebook,登上CLUE排行榜榜首。

2021年,阿里相继发布了中国第一个参数超过100亿的多模型大模型M6,以及被称为“GPT-3中文版”的大语言模型PLUG。其中,M6经过多次迭代已经达到10万亿级大关,并且随着支付宝和淘宝企业的需求,M6在国内率先达到销售。

PLUG的代币规模为270亿,基于达摩院开发的两个模型——StructBERT语言理解模型和PALM语言生成模型。

该主模型一经推出,就以80614分刷新了CLUE授权中文词分类任务排行榜的新纪录。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

去年WAIC(世界人工智能大会)上,阿里发布了一系列伟大的通义模型。核心模型全部开源。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

大车型时代,中国力量加速竞争

那么,如何评价这款阿里版ChatGPT呢?

必须承认,相比行业标准ChatGPT(GPT-4),通义 Qianwen还有很大的改进空间。阿里还表示,根据内测的反馈,这款大模型正在快速归还。

此前有消息称,微软专门为ChatGPT花费了数亿美元打造了一台专用于数万台Nvidia A100的超级计算机。从各方消息来看,拥有如此实力的显卡的国内公司屈指可数,阿里就是其中之一。

大模型时代,业界有共识:构建大模型需要人工智能和云计算。

阿里是全球为数不多的在算法和算力方面拥有较高地位的公司之一。

除了长期积累的人工智能技术和大模型之外,通过中国第一、亚洲第三云厂商的支持,阿里在算力方面也拥有天然的优势。

阿里ChatGPT版本突然上线内测!大模热战开始了?第一次体验

ChatGPT已经成为热门话题,国内大型国产车型的需求与日俱增,竞争也足够激烈。

ChatGPT产品提高生产力的能力不断得到验证。但当时ChatGPT账户遭到大规模封禁,亚洲成为受影响最严重的地区。后来,OpenAI因电量问题停止销售ChatGPT Plus……

再次,许多不确定因素凸显了技术自研的价值。

幸运的是,起跑线相距并不太远。

比赛并没有在晚上结束,这才是比赛真正开始的时候。

- 更多的 -

量子比特QbitAI·头条号签名

关注我们,了解最新技术动态

免责声明:以上内容资料均来源于网络,本文作者无意针对,影射任何现实国家,政体,组织,种族,个人。相关数据,理论考证于网络资料,以上内容并不代表本文作者赞同文章中的律法,规则,观点,行为以及对相关资料的真实性负责。本文作者就以上或相关所产生的任何问题概不负责,亦不承担任何直接与间接的法律责任。

文章内容如涉及作品内容、版权图片,侵权,谣言或其它问题请联系删除。最后,大家对于这个事件有什么不同的想法,欢迎评论区留言讨论!

继续阅读