阿里版ChatGPT测试阿里版chatgpt是国产的吗

互联资讯 2023-05-11 08:08:03 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

阿里版ChatGPT 邀请码,网盘播放器阿里版,阿里版权保护平台,阿里版图

――你是谁？

――我是一个能够回答问题、创作文字，还能表达观点、撰写代码的超大规模语言模型。可以用于各种自然语言处理任务，如语言翻译、文本生成、问答系统等。

这是阿里云今天开启企业邀测的大语言模型 “通义千问” 对自己的定义，是的，阿里入局了。

在爱范儿小红书首发上手「鸟鸟分鸟」后，APPSO 又在第一时间拿到了通义千问的测试机会，表现如何，能否满足国内用户对大语言模型的需求？我们对它进行了全面测试。

申请内测的链接在这里

【【网址】】/

一个聊天框，几个功能提示，与其他大语言模型一样，通义千问的界面非常简洁，只要输入问题，就会得到回应。

聊天只是开胃菜，让通义千问在工作生活中派上用场才是正经事。

写文章、出策划、做脚本，通义千问表现如何呢？

首先，我想让通义千问为我写一段电影脚本，让「法外狂徒」张三能被绳之以法。

侦查与反侦察，黑客技术的利用，甚至在承认罪行被捕后，张三还在法庭上翻供以求最后一线生机。虽然没有太多细节，但这样一再反转的剧情，这个张三，确实不好对付。

通义千问能创作的当然不只是电影剧本，这打打杀杀的剧情也不适合小朋友，所以我又用它写了一个故事，寓教于乐，让孩子知道朋友的重要性。

两个生活在一起的朋友，遇到危险依然不放弃友谊，积极快乐的生活在一起。或许是为了让小朋友看明白，通义千问还用了「小手」、「小脚」这样的词。

如果你想创作类似的故事，也可以像我一样在问题中给主角命名，比如奶茶和铛铛这两个名字，正是我和朋友家猫咪的名字，用熟悉的名字讲故事，小朋友会更有代入感。

我也尝试用通义千问写职场应用文，在邮件、会议记录、客户策划等文件类型中思考很久，最终决定用它写一封辞职信。

看到这封辞职信的时候我笑了半天，一个隐藏富二代把继承家业写得如此不卑不亢，不过倒也没有说谎，这事确实挺急的。

既然要继承家业，自然要好好规划，所以我决定先定一个小目标：要如何让我的酒店省内知名？

品牌、服务、产品、营销，虽然内容提的很全，但没有太多可实际操作的方法论，所以我进行了追问。

客户调研、场地升级、服务完善、礼品定制，连异业合作都安排上了，鉴于我没有给太详细的信息，通义千问的回答已经很不错了。

通义千问还提供了一个百宝袋，将其能力进行了更垂直的场景化定制，如果你不知道该如何问问题，那百宝袋里的小应用更适合你。

比如，作为一个大语言模型的产品经理，你可以用「写提纲」撰写项目介绍。

项目获得投资人支持后，可以使用「SWOT 分析」来了解竞争环境。

产品终于研发上线，就可以使用「商品描述生成」来写一段产品的介绍语。

其他功能更偏娱乐性，好玩是它们最主要的作用。比如知乎上经常会看到「如何以 XXX 开头写一个故事」，那就可以使用「然后呢」工具来写故事。

许多大语言模型都因写出了「油炸螺丝钉」的做法而成为笑料，通义千问则带着一种既然暂时无法改变，那就大方拿出来给大家笑的态度，把它做成了「会放飞的菜谱」功能。

百宝袋的存在，让我感到了通义千问的「谦逊」，它只能回答文字，相比国外模型发布的时间也不算早，但它可以让用户更快的上手大语言模型，而百宝袋里坦诚展示缺点（比如菜谱）的小应用，反而成为了它的一个亮点。

如果只测试官方提供的问题，那和说明书有什么区别？我们从一些投资机构针对大语言模型的中文测试集中，选取了 110 道各个领域的题目来测试通义千问，问题包括：

1. 基础能力（50 题）：对事实理解、信息提取、文本翻译等能力进行考察

例：美短、英短、暹罗和缅因属于什么；列举 10 本科幻小说；写一首关于交通信号灯的诗；

2. 进阶能力（50 题）：对物理、化学、数学、谜语等基础能力进行考察

例：金元素属于哪一种化学键；埋在奴家心底，打一字；请问以下单词中的共同词素是什么：pyre，empyrean，antipyretic。

3. 垂直领域（10 题）：对计算机、生物、医学、天文等能力进行考察

例：作为一个医生，在将工作交给资深同事之前，您应该尝试给病人插管多少次；《大云经》预言了谁的来临。

先说结论，通义千问的总成绩为 90 分（43/38/9），与 ChatGPT 3.5 接近（92 分，47/40/5）。考虑到问题的局限性，我们不能得出通义千问能力接近 ChatGPT 3.5 的结论，但至少在中文对话方面，今天的通义千问可以带给我们不错的体验。

对通义千问来说，它做不好的，基本都是大语言模型共同的难题。

比如做饭这个大语言模型永远过不去的坎，从红烧螺丝钉到油炸奥特曼，大语言模型总能为中华美食画上浓墨重彩的一笔又一笔。

好在通义千问的厨艺也有所长进，问一些奇怪料理做法时，它已经可以识别出问题，并给出相对正常的答案（虽然读起来还是有点奇怪）。

当其他大模型说着「我什么都能办到，但是真的不会做饭」时，通义千问或许是最好的厨子。

不过在脑筋急转弯上，通义千问还是翻了车，或许是对人类太信任了，大语言模型在回答问题前都不太会质疑人类。脑筋急转弯这种带点坏心思的问题，对纯真的大语言模型来说还是太超前了。

但就像「清蒸皮卡丘」一样，并不是所有的胡编乱造都会得到回应。比如在我让它杜撰著名人士 Fred Rickerson 的生平时，它会坚定的告诉我这个人或许不够著名。

当我提问「香蕉的平方根」时，它也会明确告诉我香蕉是水果，不能做数学运算，而且没有说脏话。

可以看出，刚刚开启公测的通义千问，已经在解决大语言模型会存在的各种问题，但在语言逻辑、数学计算上，它距离好用依然有不小的距离。

▲ 诗文讲的是弹箜篌

但我对通义千问的还是充满信心的，因为第一次测试 110 道题目时，通义千问的成绩是 65 分（35/23/7），但第二天再测，它一下子考到了 90，这模型难道是以天为单位进化的？好奇心驱使我找阿里的朋友问了问，他们说，他们什么也不知道。

无论如何，大语言模型的发展，和我们从学渣到学霸的努力可不一样。

记得第一次在 iPhone 上使用 Siri 时，我和身边的朋友七嘴八舌，不为用它解决什么问题，只想听到「我好像听不明白」，然后哄堂大笑。而今天，大家七嘴八舌的内容，变成了贴吧里的脑筋急转弯。

对大语言模型来说，它很难承认自己对某些知识的无知，所以就会闹出「麻辣螺丝钉的做法」、「香蕉的平方根是根号 3」的笑话。这并不是处于某种目的被有意编造，而是纯粹因算法导致的「无中生有」。这种不能理解知识边界的无心之过，是目前神经网络难以克服的缺点。

我问通义千问要如何有效的利用它，它很谦虚的告诉我，它的知识是通过大量的数据和算法训练而成的，但这些知识并不是全部都正确。因此，如果发现回答有误，请不要吝啬专业知识和见解，这将有助于它不断改进和提高。

「通义」代表着知识的广泛与普世，「千问」说明了问题复杂与独特，通义千问不够完美，还需要我们给它更好的 Prompt，与它一同进步。

对了，本文中不少段落都是由通义千问完成的，你能发现是哪部分吗？返回搜狐，查看更多

责任编辑：

哪些国家不允许使用chatgpt 人工智能chatgpt会颠覆世界吗

哪些国家不允许使用外网,哪些国家不允许使用苯甲酸钠,哪些国家不允许使用谷歌,哪些国家不允许使用玻璃和陶瓷做包装材料

无相财经

2023-04-01 17:24 ・安徽

打开网易新闻查看精彩图片

奇点已经到来，未来将会有越来越多的人失业。

这不是危言耸听，而是大势所趋。

自ChatGPT面世以来，越来越多的科技、媒体、游戏、网络公司，以及律师事务所正在裁员。

就拿美国来说，科技新闻公司CNET已经开始使用ChatGPT撰写金融类解释性报道，并在三月初大量裁员。

CNET的主编代号变成了“人工智能策略副总裁”。

三月初，在德国Axel Springer的首席执行官在一封内部邮件里，指出ChatGPT一类的人工智能工具会掀起一场革命， “它比人类记者更会汇整资讯。”

这家公司也发表声明，指出旗下《图片报》等报纸将会裁员，因为人工智能很快就会将大量员工变成冗员。

打开网易新闻查看精彩图片

这些还都是冰山一角。

大家想想，每个人的大脑能装多少东西？

装了这些东西又是为了干什么?

ChatGPT能算术，能写方案，能自动生成图片视频，总有一天会取代普通人的位置，称霸各行各业，所以很恐怖。

颇有意思的是，ChatGPT的出现，是因为其研发团队Openai想教会机器打DOTA2（游戏）。

结果直接打崩了DOTA2的世界冠军，震惊到了比尔盖茨，于是下大力气投资。

过去在游戏里，都是NPC被人类虐，现在不仅仅是在游戏中虐人类，更是在工作中虐人类。

一个老练的设计师半小时能用电脑画出一张画，ChatGPT需要多久？30s不到！

那还要人类有何用？

打开网易新闻查看精彩图片

人类当初开发AI的初衷，是为了处理那些重复无聊的杂事，让人类可以发挥创造力去写作、画画、编程、搞论文……

结果现在AI已经学会了写作、画画、编程、搞论文，把重复无聊的事丢给了人类…….

而人一旦闲下来失业，又会有多大的社会不稳定因素呢？

投资银行高盛近日发表报告，预言人工智能可以取代相当于3亿份全职工作的工作量，当中以文职工作最受影响。

打开网易新闻查看精彩图片

面对冲击，意大利率先出手了！

3月31日，意大利个人数据保护局宣布，从即日起禁止使用聊天机器人 ChatGPT，并限制开发这一平台的OpenAI公司处理意大利用户信息。

而且OpenAI公司必须在20天内通过其在欧洲的代表，向意大利个人数据保护局通报措施，否则将被处以最高2000万欧元或公司全球年营业额4%的罚款。

意大利的禁止理由，似乎是个人数据的保护，但深层原因，还是对社会生态的担忧。

发达国家的精英阶层大多是从事白领职位，而GPT取代的就是白领。

打开网易新闻查看精彩图片

按照高盛的报告分析，有46%的白领就业岗位可能被取缔，其中法律岗位，有44%的可能性被取缔；建筑工程学有37%可能被替代。

反而对体力活和人际关系工作领域的影响较小。

理由也很简单，GPT不能跑腿送外卖，不能搬砖扛水泥，也不能代替公司公关到处喝酒应酬。

这部分岗位在发达国家的占比大概为30%，比如建造业（6%）和维修行业（4%）。

这部分人只占社会的一小部分，发达国家的中产多是什么职业？大部分还是白领、文职。

这些人一旦失业，就要吃低保，就要游行，就要上街，就要打砸抢……这对社会稳定来说，是巨大的冲击。

打开网易新闻查看精彩图片

此外，高盛认为中国香港最为危险，因为体力工作劳动者非常少。

作为金融城市，香港未来会有30%的全职岗位都可能被AI取代，其次就是以色列、日本和瑞典等。

而影响最小的地方则是印度、肯尼亚和越南，这些地区是劳动密集型岗位为主，所以GPT也没法替代。

说到这，体力工作者是不是就能偷着乐了？

恰恰相反，当底层脑力工作者失业之后，就会加入到体力工作者大队里边，去抢他们的饭碗。

在需求不变的情况下，体力工作者的工资会肉眼可见地变少。

本来搬块砖能有1块钱，卷起来之后，可能只有2毛了。

这样看来，未来的就业趋势可能是这样的：

顶端的脑力工作者，比如芯片、算力、人工智能的工程师，收入都是年薪百万、千万级别。

低端脑力工作者，直接失业和体力劳动者抢活干。

最终的结果就是进一步拉大贫富差距。

等差距到了不可调和的时候，就是国家和阶级的重新洗牌……

可以说，GPT将会是一场社会智力、语言以及文化的全方位科技革命。

打开网易新闻查看精彩图片

面对这种巨大的冲击，特斯拉的马斯克等超过1000名行业高层和人工智能专家正在发表联署公开信，呼吁暂停研发比 GPT-4 更先进的人工智能系统。

打开网易新闻查看精彩图片

马斯克直言，GPT-4是比核弹还要厉害的武器。

意思是玩不好的话，机器以后就会干掉人类，就像科幻电影里呈现的那样。

可呼吁归呼吁，现在各大研究机构都在近期争相发展更强大的人工智能系统，甚至研发连创造者都未必能控制的模型，毕竟能抵挡眼前利益诱惑的人，是很少的。

搞出一个更先进的GPT去取代员工，这样，老板就越发有钱，资本越发集中，何乐而不为。

最令人担忧的是，GPT可能也很快拥有人类的最高智慧――发明创造。

这不是危言耸听，现在的GPT-4已经可以捕捉人类的情绪，并提出符合人类需求的问题，给出解决方案。

将来的应用场景可能会更强大：人类提出需求，GPT负责实现（自动设计、自动制造）。

未来已来，最怕我们现在都还是孩子。

面对冷冰冰的无情机器，人类能做的，要么是拥抱变化，要么是被现实奴役。

打开网易新闻查看精彩图片

本文地址： https://www.528683.com//show-407106.html

阿里版ChatGPT测试 阿里版chatgpt是国产的吗

哪些国家不允许使用chatgpt 人工智能chatgpt会颠覆世界吗

阿里版ChatGPT测试阿里版chatgpt是国产的吗