庆云古诗词

庆云古诗词

chat gpt真的是人工智能吗 chatgpt人工智能有多厉害

互联资讯 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】


导读:
以ChatGPT为代表的新的人工智能语言模型的出现与更迭,引发人们极大的兴奋和关注。
物理学家祁晓亮从信息动力学的角度分析,认为AI革命的标志是信息处理复杂度的临界点。AI还没有真正学会思考,但它的迅速发展会给科学研究和人类社会带来深刻的改变。

祁晓亮 | 撰文

过去几个月,人工智能的新闻目不暇接,我感到自己好像是三体世界的一个居民,在看着地平线上的朝霞,知道一定有什么要发生,却不知道将要升起的是一轮还是两轮太阳。

在这样一个时刻,个人的思考也许没什么用,但是却不能不思考,这也算是人类的本能。因此,我在这里把一些粗浅的想法写下来,以供抛砖引玉之用。需要提醒读者的是,本文不是广为接受的科研成果的介绍,而是只代表个人看法,观点谬误在所难免,欢迎读者批评指正。

ChatGPT是怎样的临界点?

许多人都认为ChatGPT的横空出世是一个大事件,人工智能可能带来一场科技革命,但这究竟是一场怎样的变革,用什么样的判据来断言这场变革有多么重要?例如农业的发明、工业革命,是在能量利用的意义上,成为人类文明的里程碑。相比之下,人工智能显然是在信息的层面上发生的革命。这一点本身已经是老生常谈了,但这里有一个我想深入讨论的问题,就是大语言模型的诞生究竟是一个什么意义上的临界点?

我认为,重要的并不是ChatGPT能够实现多少功能,能够比之前的AI多做多少事情,问题的关键不是能力,而是复杂性――我们今天所看到的,是AI的信息处理复杂度的临界点。

我们先来谈一下什么是信息处理。从信息的角度来看人类历史,一切事件本质上都是信息的处理过程。比如轮子的发明,需要有人(或者很多人)想到这个主意,摸索出制作方法,再把这个方法传下去。轮子发明以后的人,在基因上和以前的人是一样的,但是他们可以享受轮子带来的便利,因为这条信息传了下来。张良“运筹帷幄之中,决胜千里之外”是信息处理,他的传令兵把这个命令传给前线也是信息处理。因为“处理”这个词给人一种信息是被动的、静态的感觉,我认为对于信息的传播和演化更准确的描述应该是“信息动力学”(information dynamics)。人类历史本身就是信息的动力学过程,而具体的个人就是信息动力学演化的媒介和载体。不同的信息处理有不同的复杂度,比如张良的决策复杂度显然要高于传令兵传令的复杂度。粗略地来讲,复杂度量的就是最少需要多少个简单的步骤来实现一件事情。这个复杂度有三个方面,一是输入信息的复杂度,二是信息处理本身的计算复杂度,三是输出信息的复杂度。如果张良面对前线传来的复杂混乱的信息,考虑了方方面面的问题,最后让传令兵发了两个字“撤退”,那么在这个例子中,输入和处理的复杂度是高的,输出的复杂度是低的。

现在让我们回到现代。在人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)之前的世界里,电脑、互联网、智能手机的发明已经极大地改变了人类社会,但从信息动力学的角度来看,你会发现机器做的事情非常简单,只有三种:复制,粘贴,排序。互联网、社交媒体是通过一个网络,让人与人之间的信息传播(也就是复制粘贴)变得更加便捷。【【微信】】搜索、各种推荐算法是排序。这个时代的信息动力学可以用图1(a)中的网络来代表。从复杂性的角度来看,可以说所有复杂的信息处理都发生在人脑中。机器除了复制粘贴以外,只有排序是复杂的运算,但是排序虽然可以是很复杂的算法,最终的输出却是简单的,只是一个序号,所以这个复杂运算一步之后就终结了,机器下一步只能把这个序号返回给人类,而无法自行迭代运用它的运算能力来完成更复杂的任务。当一个中学生看到一个事件,发一个150字的微博表达自己的意见,这对于信息的处理就已经比ChatGPT以前任何的机器更复杂了。

图 1:(a)大语言模型出现之前的信息动力学。电脑的工作局限于简单的复制粘贴(浅蓝色)或提供排序(深蓝色)。(b)大语言模型出现之后的信息动力学。AI可以和人一样进行复杂信息的处理。

当然,在GPT之前,人工智能在一些特定目标上的表现,例如围棋、作画,已经相当惊艳,但在信息处理的意义上,这些人工智能模型有着跟排序算法一样的问题:输出的信息形式比较简单固定,因此无法通过多次迭代运用这种信息处理能力来实现更高的复杂性。换言之,信息动力学的复杂性取决于输入、处理、输出这三者中的瓶颈。

ChatGPT带来的革命,正是由于它在这三个步骤中,都达到了与人类匹敌的复杂性。GPT可以接收模糊的指令,各种语言、各种程序代码都可以;面对各种输入都能给出比较合理的输出,而输出本身也和人类一样复杂,比如写文章,写代码。在GPT诞生之后,信息动力学的图示变成了图1b的样子。即使最新版的GPT-4也还存在着很多问题,对于不熟悉的事情经常犯错甚至胡说,但在复杂性方面,我认为:它已经达到了人类水平。问题的关键是复杂度而不是具体问题上的表现:一旦处理信息的复杂度达到了人类水平,解决准确度和其他方面的问题已经没有本质的障碍。以AI的进化速度,一旦它达到人类水平,很快就会远超人类。

为什么是语言模型?

正因为复杂度是关键,AI的这场革命才会出自大语言模型,而不是其他的AI领域。

《圣经》第一句说,“太初有言”,《老子》第一句说“道可道,非常道”。在地球的历史中,人类语言的涌现是一个标志性的事件,从那之后,这个星球上最重要的信息动力学不再是DNA的遗传和变异,而是语言的传播和演进。从信息动力学的角度来说,ChatGPT出现以来的人工智能迅速进化,可能是在人类语言出现之后第二个如此重要的事件,它标志着这个星球上起决定性作用的信息动力学过程不再由人类脑中的化学过程垄断,而越来越多地发生在芯片上的电子过程中。

为什么语言如此重要?人类语言不是像蜜蜂的舞蹈那样传递固定信号的工具,而是可以用来描述从具体到抽象的任何东西。我们不仅可以谈及世界上的事物,还可以描述它们之间的关系,以及关系的关系。现实世界中只有苹果、桔子、香蕉,人类却可以从中创造出“水果”这一抽象概念。水果、蔬菜等不同的概念,又同属于“植物”,以及“名词”这两个更概括的概念。这些不同的概念属于不同的层级,因此一个图像识别的人工智能可以通过训练学会从具体的图像中识别出“水果”这个概念,但是如果要让它再明白水果和蔬菜属于植物,就又需要重新训练。语言的魔力在于,一旦我们把这些概念都看成词语,它们都是平等存在的,不管是“苹果”还是“植物”,还是“量子力学的非定域性”,都一样可以成为思考的对象。有了语言,我们脑中的世界不只是外部世界的一个映像,而是多了一个拥有无限可能的新维度。有了这个新维度,世界的结构变得扁平,原来一层叠一层的抽象结构,全都变得和一只苹果一样可以被我们思考。运用语言,我们可以理解直线和三角形的概念,总结出欧几里得几何的公理,并且应用它们去证明勾股定理。一旦证明了所有直角三角形都满足勾股定理,我们不再需要任何数据就可以掌握和运用这个知识。

语言的界限并非人类能力的界限,但却是思考的界限。人类可以通过训练学会一些技能,例如骑自行车,这并非通过语言和思考来达成,但不通过语言的技能,就无法通过思考来改进,也无法通过沟通来传播。例如我们可以写一本骑自行车教程,但读教程不能让我们学会骑自行车,而必须通过实践训练才能学会。所以我们能够理解和告诉别人的世界的复杂度,最高不会超过语言所能描述的范围。因此维特根斯坦说:“我的语言的界限意味着我的世界的界限。”[1]换言之,对于人类来说,信息动力学也就是语言的动力学。这种动力学既包括严密的推导和论证,也包括跳跃的灵感,甚至白日梦和幻觉。

正是因为语言在我们的世界中具有这样核心的地位,它在AI的发展中也具有独特的地位。我们今天看看ChatGPT的发展,不难想象语言模型可以有一天学会自动驾驶,但是反过来一个做自动驾驶的AI很难有一天学会语言。特德 ・ 蒋说ChatGPT是“整个互联网的模糊图像”(a blurry jpeg of the web)[2]。我觉得他说的有些道理,但这个比喻过于静态了。比起静态的知识来说,更重要的是时间的维度:可以说ChatGPT是对于人类语言动力学的模糊印象。也就是说,它还没真正学会思考,但是它学会了大略地模仿人类的思考过程。例如数学家Terence Tao介绍过如何让ChatGPT来建议定理证明,虽然它说的有错,却可以提供新的思路[3]。这就是因为虽然这个定理在数学中是未知的,但ChatGPT懂得如何把以前看过的其他证明的思路或套路应用到这个定理上来。有一种常见的观点,认为人工智能只会模仿,不会创造,但我认为模仿和创造之间并没有绝对的鸿沟。其实人类那些最具创造性的想法,也不是无中生有的,而是在已知的思路和知识背景的基础上生发出来的。牛顿从苹果落地想到引力,也是已知和未知的类比。这种类比的过程跟GPT对于定理证明提供的新思路并无本质的区别。

作为一个例子,我让ChatGPT猜想未来量子引力的研究可能有哪些意想不到的突破,下面是它给我的一个答案。虽然这不能说是什么特别令人激动的想法,但猜测的方向是有一定道理的。可以说ChatGPT在开脑洞方面的能力并不弱于人类,甚至可能因为它渊博的知识而强于人类,但它的问题在于不能从很多的想法中去自行验证哪个方向更可行和准确。

图 2 ChatGPT对于量子引力研究方面发挥想象力的一个示例。

AI能否真正学会思考?

说到ChatGPT无法区分正确与错误的弱点,我们就可以来讨论一下今天的语言模型和人类之间最本质的差别是什么。换句话说,GPT-4和通用人工智能(Artificial General Intelligence, AGI)的本质差距在哪里。

丹尼尔・卡尼曼在《思考,快与慢》[4]这本书中指出,人类的思维活动有两套系统。系统1是我们的快速、直觉式、自动、无意识的思维方式。它处理日常生活中的大部分任务,如识别物体、表情、语言理解和做出简单的决策。系统1常常以经验为基础,通过关联和模式识别来实现快速决策。然而,这种快速决策往往容易受到认知偏差的影响。系统2是我们的缓慢、分析式、有意识的思维方式。这个系统需要更多的注意力和努力来运作,因为它负责处理复杂的问题、逻辑推理、规划和长期决策。系统2可以纠正系统1的错误,但它的运作速度较慢。今天的大语言模型本质上是系统1的模拟,它根据输入的文字直接按照一个概率分布来输出文字,这很像是人类凭直觉作出判断时的操作。比如一个数学运算,GPT-4可以根据你的指令,给出推导过程,但是如果你直接让它给出结果,它并不是自己在“脑中”进行这个推导过程再给出结果,而是直接凭“直觉”给出结果的。这就是为什么在给GPT-4下达“写出推导过程”的指令时,它的计算准确率会明显提高[5,6]。从这个例子我们可以看出,GPT-4已经懂得运用语言,但它只是用语言跟人类交流,而没有用语言来思考。用语言来思考,就是系统2和系统1的最主要差别。

图 3 具有系统1(直觉判断)和系统2(用语言思考)的人工智能系统的简单示意图。

要想让语言模型学会思考,需要两个前提:

(1)它需要有长期记忆。现在的GPT-4对于对话的上下文会有一定的记忆,但在开始一个新的对话时这些记忆就清除了。它虽然“记得”大量的知识,但那些并不是在对话中获得的记忆。如果和人类类比,GPT的知识更像是人类先天自带的能力,例如婴儿知道哭和吃奶。如果想让语言模型能够像人类一样在经验中学习,首先必须让它对于自己的历史有长期的记忆。

(2)语言模型要能够对于长期记忆进行处理,吸取经验为自己所用。人类如果一道数学题做错了,学到正确解法之后就会改正,因为正确解法已经存在记忆里,并且知道在下次遇到类似问题的时候调用出来,而GPT虽然也会改正错误,下次却仍然会再犯[6],除非通过进一步的训练来改变模型的参数。

最近已经有一些研究工作尝试为语言模型加上长期记忆和调用记忆的能力。例如[7]提出了一种名为reflexion的架构,将GPT尝试解决一个问题的过程记录下来并且让另一个语言模型进行“反思”,根据反思的结果告诉GPT下次如何改进。在一些任务上这个架构可以将成功率提高30%。在另外一个工作[8]中,作者设计了25个人工智能角色的虚拟小镇,每个角色都有他们的不同人物设定和记忆。比如两个人第一次见面,会在记忆中留下记录,下一次见面时就会记得之前见过。在遇到一个新的事件时,一个角色会从自己记忆中搜寻最可能与此相关的记忆,作为参考来决定当前的行为。这样的架构使得多个角色之间的复杂互动(例如聚在一起办一场生日庆祝会)成为可能。

五一出游不知道怎么做攻略?我问了问讯飞版chatgpt讯飞cbg,讯飞平台,讯飞501,讯飞的游戏在哪
关注

今年生成式人工智能技术(AIGC)火爆全球,它能以类人口吻回答问题,同时生成文本和图像,被誉为数字时代的新生产力工具。而在中国,继百度文心一言、阿里通义千问之后,专注AI赛道的科大讯飞携“星火认知大模型”官网突然上线,并可以抢先体验,再一次引爆了行业的关注。在4月24日官宣内测的首日,我第一时间注册使用,结果还挺出人意料的。

在讯飞星火认知大模型内测的官方页,它自诩为“我是你的知识宝典、灵感引擎、创意搭档、智能助手”。显然,讯飞星火认知大模型擅长知识问答、点子构思、创意生成与工作辅助。这不马上就要到五一劳动节了,我和家人都想出去旅游,有北京、三亚、厦门三个地方备选,问问“星火”看它如何回答。

首先北京必去故宫打卡,但五一人山人海,我让“星火”帮我合理规划故宫游玩行程,它给出了六点建议,分别围绕游览路线、主要景点和注意事项展开,还在后面补上了与*紧邻的*广场和景山公园的游玩推荐,个人觉得比较全面了。

五一去三亚的人肯定特别多,一些景区的“天价海鲜”让人望而却步。讯飞星火给了我五个在三亚省钱吃海鲜的点子,一是去海鲜市场买更便宜,二是尝试当地的小吃摊,三是选择价格固定的海鲜自助,四是避免景区附近用餐,五是与朋友分摊成本。对于这样的回答我很满意,你们觉得呢?

如果去厦门玩,我会考虑交通成本与时间成本,问了一道“去厦门该坐火车还是飞机”的问题,讯飞星火应该是暂时无法调取航程信息,因此只能从火车和飞机两种交通工具的优劣去分析。这个对我的参考价值一般,期待讯飞星火日后能改善吧。

假设我最终选定了五一去厦门,肯定会在朋友圈疯狂输出美景与美食,到时候让“星火”出文案岂不美哉?我尝试让它来一段鼓浪屿的唯美介绍,它不再是数字排列句式,而是像写小作文一样描绘了鼓浪屿的人文风光和水上活动,那句“东方夏威夷”瞬间勾魂,让我心驰神往。

虽然讯飞星火还处于内测阶段,但我可以感受到它的开发完整度已经很高了,回答的速度跟问题的难易度相关,简单的问题可以在几秒内作答,复杂的问题需要更长时间。恰逢马上五一劳动节就要到了,借助讯飞星火来制定出行计划或旅游攻略非常省事省心,大致的信息基本都能囊括,表现出了较强的信息整合与逻辑推理能力。

据了解讯飞承建认知智能全国重点实验室和语音及语言信息处理国家工程研究中心,多年来已经在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术、算力支撑等方面积累了大量成果。因此讯飞投身认知大模型领域是水到渠成的结果,也是众多技术集大成凝聚的结晶。

如果大家对讯飞星火认知大模型感兴趣,不妨关注5月6日的发布会,届时讯飞不仅将正式发布“星火”,或将同步带来N款应用于教育、医疗、办公等领域的专用大模型版本,让大模型技术规模化应用尽早实现,当然如果等不及,现在就可以提前去官网感受一番。

(来源:看头条网)