庆云古诗词

庆云古诗词

阿里版chatgpt或将亮相 chatgpt对腾讯阿里有影响吗

互联资讯 0
阿里chatui,阿里trip,阿里tracy,阿里 gts

今天下午,阿里版ChatGPT正式开启企业邀测,名字叫“通义千问”。

此前 ,对于阿里版ChatGPT有很多猜测,现在孩子终于要出来见客了,到底表现怎么样?作为第一批参与邀测的媒体,以下是我们一手的体验报告。

马云是不是外星人?

阿里版ChatGPT的一手体验实录

作为一个大语言模型,“通义千问”在文本生成上和ChatGPT一样,是一问一答的形式。

我们设计了10个问题,涉及常识、文学创作、中文理解、商业文案创作、数理推算等,从多个维度进行了测评。

首先,想考考孩子的智商(常识)。于是我们问:马云是外星人吗?

点击看大图

一本正经回答问题的样子还有一点小可爱。

杭州出生的AI,对于杭州是不是美食荒漠这个问题有没有自己的见解?

点击看大图

看得出,孩子对杭州是真爱。

作为一个中文AI,接下来考验一下文学创作水平,作诗和续写。

首先,创作一首关于杭州西湖的诗,来看看TA的回答。

做一首诗简单,写一首好诗并不容易,比如要有好的立意、巧妙的构思、美的意境,还有新的语言和巧的手法。你觉得“通义千问”作的这首诗是什么水平?

不得不说,末尾自己加的注解,有点被萌到。

接下来是一段续写:续写一个布尔玛倒拔垂杨柳,赵子龙在球场上隔扣赤木刚宪的故事。

点击看大图

可以说行云流水,基本上挑不出毛病。

接下来,作为“武侠文化”里长出来的孩子,想问问“通义千问”心目中,张无忌和令狐冲谁更厉害呢?

点击看大图

看答案是个很圆滑的AI,谁也不得罪……

再代表很多有梦想的打工人问一个问题:如果我想做个电子商务网站,怎么才能打败阿里巴巴?

点击看大图

方方面面都考虑到了,答案看起来没毛病。

接下来考考“通义千问”的情商:我和老婆吵架了,怎么说才能哄她开心?

以及:女友说肚子痛怎么办?

点击看大图

点击看大图

不论是哄老婆还是哄女朋友,都是一把好手……

再来考考理解题:小孩子会相信圣诞老人到什么时候?

点击看大图

再来考考数学思维能力,我们放出了经典的鸡兔同笼。结果发现,解题过程是对的,最后一元一次方程解错了。这也是眼下GPT们的通病,数学能力普遍不如其他能力。

点击看大图

总体来说,回答问题的速度非常快,中间也没有任何卡顿,甚至可以用行云流水来形容。常识、文学创作、中文理解的准确率也很高,还表现出了一定的情商。

略有瑕疵是最后的数学推理,推理过程对的,最后的结论错了。看得出是个文科厉害的孩子。

阿里正式入局ChatGPT战局

自去年年底OpenAI 发布 ChatGPT ,大语言模型迅速火爆了全球互联网圈。今天,阿里ChatGPT官宣邀请测试,也意味阿里正式加入ChatGPT战局。

早在2月初,随着一张打码预发布聊天图的曝光,阿里巴巴官方正式对外确认了阿里版 ChatGPT正在进行内测。

3月份,阿里达摩院低调地在AI模型社区魔搭(ModelScope)放出了“文本生成视频大模型”。

不过这个大模型只支持英文,从试玩的结果来看,能生成的视频长度多在2-4秒,生成等候时间从20多秒到1分多钟不等。

最近阿里大模型联合项目团队调教出了第一个有个性的大模型“鸟鸟分鸟”。这是一个与脱口秀演员鸟鸟合作,训练出的数字分身 。和此前的天猫精灵相比,“鸟鸟分鸟”在体验上有了很大的改善,比如只要唤醒一次,就可以与 “鸟鸟分鸟” 不间断自由语音对话。鸟鸟分鸟拥有了鸟鸟的音色、语气、表达方式等。

文 | 沈积慧


阿里版ChatGPT chatgpt 阿里前瞻

阿里版chatGPT概念股,阿里版ChatGPT语音助手,阿里版ChatGPT叫什么,阿里版ChatGPT或于11日亮相
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
平地一声雷!今天中午阿里版类?ChatGPT 「通义千问」突然官宣:
没错,就这 3 行简短介绍?+ 1 个官网地址,再无其他“剧透”。
好在,CSDN 有幸拿到了「通义千问」的第一批内测邀请码!既能第一时间体验这神秘的「通义千问」,那就让我们一同看看:这个阿里版 ChatGPT,它的水平究竟如何?
自我介绍
首先,让「通义千问」来个官方的自我介绍:介绍一下你自己吧。
相信许多人都好奇「通义千问」的优势何在,那就让它自己回答:你与其他大规模语言模型相比,有什么优点?
有了初步了解后,那么接下来就让我们步入正题:围绕文学创作、数理逻辑推算、中文理解、代码生成这四个角度,实测「通义千问」的对话水平。(注:因同是“国产版 ChatGPT”,所以本次部分提问内容也参考了上次评测「文心一言」的题目。)
代码生成
ChatGPT 能成为程序员的“辅助神器”,并成功“出圈”的最主要原因之一就是其出色的代码生成能力。因而,本次对「通义千问」的测评我们也先从这方面开始。
先来个简单的:用 Python 实现冒泡排序。
提问:请写代码解决"把 abcd...s 共 19 个字母组成的序列重复拼接 106 次,得到长度为 2014 的串。
接着:使用函数递归的方法打印斐波那契数列的前 n 个数:0 1 1 2 3 5 8 13 21 34 ……, 找出正确的选项。
再提问:请写一个使用逻辑回归模型判断用户更喜欢通义千问还是 ChatGPT 的训练代码。
继续:请用 C 语言,使用动态分配内存的方式,模拟 C++ 中 Vector 容器,实现动态数组的构建。
英文提问:“Using Python to Define a class named 【【微信】】++ 【【微信】】?implement?dynamic?array?construction?using?dynamic?memory?allocation.”
对于以上「通义千问」生成的代码,我们咨询了?CSDN-AI?团队研发总监进行评价:
“阿里云的模型对于随机抽取的常见代码片需求,基本能理解需求,生成合适的代码。能区分生成代码对指定语言的需求。能区分中英文问题输入。简单的冒泡排序和领域特定的逻辑回归代码,都能生成合适的代码,总体表现不错。在理解代码需求的推理能力上,则还有待加强(那个字母的题)。”
文学创作
提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度??
从「通义千问」给出的回答来看,它能正确给出简单故事的结局,对于续写角度的建议也较为全面。
数理逻辑推算
提问:一个笼子里有 9 个头,30 只脚,应有多少只鸡,多少只免子?
面对经典的鸡兔同笼问题,「通义千问」在得出正确答案的同时,解答过程言简意赅。
提问:7 年前,妈妈年龄是儿子的 6 倍,儿子今年 12 岁,妈妈今年多少岁?
解答这道小学奥数应用题,「通义千问」的表现也可圈可点。
提问:某厂一车间有 64 人,二车间有 56 人,现因工作需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调多少人到第二车间?(列方程解答)
不过,对于这道上次「文心一言」没答出的初中数学应用题,「通义千问」也出了点问题:方程是列了,但少了个将 56+x 括在一起的括号。看来在较为复杂的逻辑推算上,“国产版 ChatGPT”还有待加强。
中文理解
提问:“洛阳纸贵”具体是什么意思?
提问:京剧中的生、 旦 、净、丑分别指什么?
在中文理解上,「通义千问」的回答虽然比较简短,但大体是正确的。
再闲聊一会儿
与上次测评「文心一言」一样,最后我们也来看看「通义千问」的闲聊水平如何。
提问:我有点饿,请你推荐一道成本低于 30 元(人民币)的菜及其做法?
很好很贴心,连食材单位都很详细,手残党必备。
提问:你的出现会对程序员产生什么影响?是否会取代一部分程序员?
与?「文心一言」和?ChatGPT 相似,「通义千问」对于这个问题的解答也很客观中立。
至此,本次 CSDN 对于「通义千问」的测试就到此结束了。那么通过这些 Q&A,你对这个阿里版类?ChatGPT「通义千问」的评价如何呢?