对话算想未来创始人(前 Google AI 算力平台工程师)赵亚雄:希望未来中国AI IaaS Cloud上长出像Netflix这样的现象级应用
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
ChatGPT爆火,引得全世界为之疯狂,恍惚中一夜之间,人人都在讨论ChatGPT,所有大佬和资本纷纷涌进大模型。
上一次如此热闹还是Web 3,不过相对前者是少部分人的自娱自乐,大模型则像魔法,引得全民为之着迷,短短 2 个月内 ChatGPT 就收获 1 亿用户,币圈甚至认为过去3个月内AI创造的价值,超过了虚拟货币历史上创造价值的总和。而创业者和投资人对大模型更狂热,更加充满信念感,坚信大模型的历史意义将不亚于电力的发明;而争夺大模型技术的领导地位,则像“研发核武器”。
“全球最聪明的人都在大模型创业,没人会禁受得住它的诱惑。”前极狐(GitLab)创始人陈冉这样对雷峰网说。
一个资深技术极客赵亚雄博士亦是如此。2019年从工作了六年的谷歌离职后,便一直奔赴在创业前线,最初加入创业公司Pixie小试牛刀,2022年他决定回国,因为国内涌现出的创业机会深深吸引着他――中国正在发展独立自主技术体系,中国要做自己的IT技术栈,发展自己的技术生态。对他来说,脑海中有无数诱人的技术创新点子,但是在美国成熟的技术生态中,这些想法都显得过于激进。
对他这样一个在国外科技大厂经受过近十年技术训练的人来说,这是一个难能可贵的机会。从2008年到2019年的十年里,赵亚雄博士分别在Amazon、Google工作,在基础软件领域已经成为一名资深的技术极客。
懂技术有国际视野还心怀一腔热情,这是支撑他在人生的舒适期,从大厂离职出来完成自己创业梦想的基础。
2022 年 10 月回国后,赵亚雄博士获得奇绩创坛创始人 CEO 陆奇博士的天使轮投资,开始了每周工作 100 小时以上的硬核模式。他长期关注 OpenAI 及硅谷创投生态,看到在自动驾驶长期无法获得突破、AI 创业领域一片低迷的情况下,ChatGPT从 11 月底横空出世后,重新激发了全球范围内对 AI 的狂热。
“未来一定是AI的世界”,赵亚雄博士的商业猜想转移到大模型。但他的商业方案“算想未来”不直接参与做大模型,而是要做大模型和AI应用的基础设施。未来“算想未来”要做AI的基础设施―― AI IaaS Cloud,区别于传统的云计算厂商,即一个以AI为导向的云计算厂商。
赵亚雄博士基于自己长期在Google 为 Google Brain、DeepMind 构建的大规模高性能机器学习计算平台上的经验,敏锐地意识到中国大模型的研发,受制于基础设施软件薄弱、人才稀缺、以及 GPU 芯片禁售的风险。他坚信,接下来将迎来大模型大爆发,对算力的需求随之会暴涨,“算想未来”就是要承接住大模型带来的这部分机会。
以下是雷峰网与赵亚雄博士的对话,讲述了他对大模型的认知,对国内云计算、SaaS产品发展的分析以及“算想未来”的规划。
雷峰网:是什么时候关注的大模型?
赵亚雄:2018 年我们就关注到来自 OpenAI 的博客 “AI and Compute”(【【网址】】/research/ai-and-compute)的一个结论:大模型的算力需求每 3.4 个月翻一番。我还在 Google 时,Google就一直保持对大规模机器学习、深度学习的投入,我这边所在的 Borg 团队一直有专门的小组支持 Google Brain、DeepMind ,负责在大规模 GPU、TPU 集群上的资源管理和调度。
我们一直关注Transfomer、GPT 的进展,但是 ChatGPT 的诞生确实完全出乎意料,的确完全超出了我们之前脑海中固化的“线性发展”的能力曲线。也从前同事了解到ChatGPT对Google的冲击,感到非常震撼。
2018 年我们尝试了 GPU Cloud 的创业方案,2020 年又尝试了 Compute Infra with AI Chips,都没有成功。当时最大的阻力在于,大规模的 AI 算力需求仍然只是头部大厂的小众需求,市场空间有限。真正重新唤起我们对 AI 基础设施的热情,是在 3 月 27 日陆奇博士在奇绩创坛得宣讲会上,他认为大模型已经带来划时代得变革。
3月 27 号那天,陆奇博士召开了一个奇绩创坛内部成员企业的转型研讨会,主要是有关AI、大模型。我们都知道陆奇博士他对AI领域的贡献:作为AI的一名布道者,他很早就参与过 OpenAI 的早期工作,在微软也一直在做搜索及人工智能方面的技术管理,百度的“All in AI ”战略也是他制定的。
在这个研讨会上,通过陆奇博士的视角,让我从整个人类社会经济历史、社会发展以及大模型带来的机会,对大模型有了更加深刻的认识。
我们意识到 AI 基础设施软件,对中国大模型团队追赶 OpenAI 至关重要。基于我们跟 OpenAI 基础设施团队过往的交流,我们认为中国没有可以匹敌 OpenAI 的基础设施软件技术团队,这是“算想未来”的起点。
雷峰网:也就是我们要做AI的云,但是现在国内公有云竞争已经是一片红海了。
赵亚雄:传统 Cloud 市场确实是红海。但是大模型和 AI 应用的需求,完全不同于传统 Cloud 所服务的软件系统。在大模型和 AI 应用领域,大家的技术积累没有质的差别。
首先我们看到中国现在有个最大的机会,就是中国正在发展独立自主技术体系,也就是常说的国产替代,从政府到公众、以及企业都推动。如此一来,从芯片,到服务器等基础设施,再到上面的模型应用,都有机会完全独立自主。每个层面都有全新的机会。
另外,因为 AI 大模型带来的AI算力的需求,包括AI的训练和AI的应用研发,这些场景衍生出来的公有云需求,会持续快速增长。我们有一个非常有名的统计数据――OpenAI 在 2018 年写的 AI and compute 的一个blog,里面介绍了他们统计的每个时间阶段最大的深度学习模型,它训练所需要的算力总额,每3.4个月就要翻一翻。那可想而知,随着未来 AI 持续地被更多人使用,算力以及从算力衍生出来的大数据还有 AI 应用研发,对基础设施的需求会很快地超过传统的云计算。
雷峰网:能具体讲讲怎么做AI、大模型的基础设施吗?
赵亚雄:我们要做一个操作系统,或者说一个管理 AI超级计算机的基础设施软件平台。
这个操作系统将 GPU(以及其他定制化的AI芯片)的算力,充分释放给上层的 AI训练和推理,特别是大模型的训练。我们现在要做的这个 GPU 计算平台软件,实际上就是让大模型训练,可以高效地扩展到GPU集群所能允许的最大规模,提升训练过程中对硬件的使用效率,加速大模型训练的迭代速度,最终达到快速追赶 OpenAI 的目标。
通过扩大规模来提高硬件使用效率,缩短模型训练的时间周期,原来可能要两个月训练,我们现在可以三个星期完成,快速地进行模型研发、迭代,从而加速去追赶 OpenAI ,尽早达到OpenAI GPT 3.5 或者 GPT 4 的能力。
“算想未来”第一阶段关注提升分布式大模型训练的规模;第二阶段,我们会寻求国产 AI算力的硬件,即GPU和其他 AI芯片的合作,为大模型及AI应用提供最具性价比的AI推理算力,并推出算想未来自己的AI算力基础设施解决方案,来为大中型企业建立私有AI云。
“算想未来”的最终目标,是在第三阶段,集合大数据、训练、推理以及其他 AI 计算相关的基础设施能力和服务,立足中国、服务全球,成为中国领先的 AI IaaS 云服务提供商。
雷峰网:上面提到超级计算机,是类似Meta的RSC(【【网址】】/blog/ai-rsc/)?
赵亚雄:AI 超算的这个概念,现在指的是一类专门来服务大规模机器学习和深度学习,还有其他 AI 训练的一类集群式的计算平台。我们说的超算跟你提到Meta的RSC,其它的系统还有Google TPU Pod(【【网址】】/tpu)、Tesla Dojo ExaPod(【【网址】】/AI)这些都是同一类型的硬件系统。
AI超算的硬件之上还有软件层,那这个软件层我们可以把它想象成, AI超级计算机的操作系统,它最核心的是要提供一种能力:可以把底层硬件的算力资源,通过软件的 API 形式,更容易地让模型这些框架性的软件高效率地对接起来,从而让机器学习和人工智能的研究人员和 AI 应用的开发者,可以用尽量小的研发投入,来使用 AI 超级计算机下面的硬件计算能力。
雷峰网:国内做AI公有云的,有百度百舸、火山引擎,我们是对标他们吗?
赵亚雄:是的。百度百舸,是针对客户自有硬件之上的私有化部署的软件产品。“算想未来”在第二阶段推出的私有 AI 基础设施解决方案,就会包含一个与百舸类似的软件平台。而火山引擎中针对 AI 的基础设施云服务,包括网络,相关大数据产品,也是我们未来要尝试的方向。“算想未来”的优势在于,拥有来自硅谷一线大厂中核心 AI 基础设施团队,从事 AI 超算系统研发的实践经验。
另一个区别在于大家聚焦点不同,“算想未来”平台聚焦底层硬件资源的管理、优化、调度。而以上的产品专注在提供软件工具来帮助机器学习研究者、AI 应用开发者,来更快速完成机器学习模型代码和AI 应用代码的编写。换言之,“算想未来”关注的是如何将硬件资源以软件 API 的形式呈现给机器学习研究者、AI 应用开发者,让模型训练、AI 应用能更高效地使用硬件资源。
此外,我们的平台将聚焦在支持国产 GPU,目标是基于国产 GPU 构建媲美 nVidia 芯片的算力平台解决方案。以上百舸、火山引擎也支持其他非 n【【微信】】,但只是将其作为补充、并非核心。从技术独立自主这个角度看,百舸、火山引擎并没有优势。
雷峰网:前面提到“算想未来”是基于大模型做基础设施,提供公有云服务,那您怎么看待国内这群做大模型的人和公司?我们听到的有一种观点是,目前国内这些做大模型的企业大多都是白费力气,他们用的都是很老的算法,您为什么不直接切入做大模型,而是要做大模型的基础设施?
赵亚雄:首先我认为这些投资和大模型团队的出现都是非常好的,对中国的AI发展有积极作用。
这一次,在人工智能方面,中国和美国的差距通过 ChatGPT 放大出来。以前官方报道的中国人工智能的水平,很多是通过专利、论文,还有毕业工程师和博士的数量等等,这种量化指标来体现。那这些量化指标有个很大的缺陷,就是没有关注AI 理论研究的实际水平,以及支持 AI 理论研究和应用软件系统的基础设施(包括硬件、软件)的能力, AI 应用实际落地的商业闭环和对 Ai 技术生态的飞轮效应。
ChatGPT让我们看到美国整个生态是有更深的“内功”,以前不过是发“大招”之前的蓄力,看上去平平常常,一爆发就震惊世界。
当然差距没有想象中那么大。相比之前各个轮次的创业热点来说,这次的热点是一个完全由技术驱动的创业热潮。上一轮技术驱动的热潮是无人车,但当时的问题是它是以美国的团队为核心,像小马智行、文远知行等,实际上都是美国的人才在美国的土地上来做这件事情,虽然接受了大量中国风投的资金,但是它整个还是美国公司。
这一次大模型的创业有一个非常好的变化,就是中国本土的人员搭上本土的资金,然后也是完全关注中国本土市场,而且完全由技术驱动。
以技术驱动的创业,最后能取得好的商业成果的概率都是很低的。这是毋庸置疑的。但是,技术驱动的创业所积累下来的技术成果,在未来都是有更大机会在新的场景下发挥价值,这跟以往的商业模式驱动的同质化创业竞争区别就在这儿。商业模式同质化竞争的失败者,他所积累的东西本身几乎没有复用价值,至多就是提供给后来者如何规避商业竞争中的同类风险。
“算想未来”的信心在于,我们能搭建一个世界一流的工程团队,拥有在硅谷头部企业研究团队中实践大模型训练的技术经验,根据我们在美国的技术经验和技术的实践成果,把这些技术能力转移到国内来做第一批早期客户。
我们最近也是跟国内的大模型团队,还有其他的历史更长的一些人工智能公司做交流。我们很明显地感觉到,大家对基础设施方面有一些共性的技术问题,都是我们之前在 Google 还有其他的公司都已经解决过的。所以在技术解决能力上我们很有信心。
雷峰网:您说我们正在跟很多大模型团队有过讨论,能透露一下接触过哪些团队吗?
赵亚雄:所有中国过去一段时间出现的大模型团队,我们都在接触中。另外还有一些传统的 AI 应用厂商,大家耳熟能详企业,我们也在积极地做业务拓展,具体的信息在“算想未来”后期有了阶段性成果之后,肯定会公布出来。
雷峰网:既然您同意国内大模型创业公司只有30+家,竞争激烈,后期活下来的也不会很多。那么,“算想未来”闯进AI的基础设施领域,市场空间有多大?
赵亚雄:首先要明确一点,我们的AI IaaS Cloud只是从服务大模型团队做切入,实际上我们的愿景是AI 基础设施的云服务,它无论是大模型、中模型,还是小模型,甚至是边缘的,甚至是嵌入式移动端的,都会有相应的需求。我们会为所有的企业提供相应的训练、推理,还有大数据以及其他支撑性的软件服务,像 MLOPs、AI 应用框架、Ser【【微信】】 等等这些。
目前大模型创业,是争夺大模型市场的领导地位,其中绝大多数企业都会在竞争中被淘汰,从而消失,或者只享有极小的市场份额。但是这不意味着未来只有极少数几家大模型团队。实际上在主流投资圈关注的视野之外,有很多大模型团队都在默默地自由生长着。最后的格局应该是少数几家头部,后面跟了大量长尾的大模型团队服务各个行业客户。
另一个方面,大模型训练也不是少数企业才会有的需求。因为大模型开启了 AI 经济的序幕,意味着一般意义上的 AI 模型即将被大多数消费者、软件厂商所接受。
此外,虽然大模型与传统手工编写的软件,采用了完全不同的生产方式,但大模型仍然是一种软件,仍然需要在使用过程中不断进行重新训练、微调来满足用户的具体需求,这导致需求会源源不断。
正如用户在使用开源软件,都或多或少会进行相应的定制,因此不会出现由少数几个大模型公司垄断模型训练、推理的情况。
综上,我们认为以大模型训练为开端,逐步扩大和深入的国内AI经济,将会是一个多元多维度不断发展的市场,不会是单一的,也不会是停滞的市场。
雷峰网:大模型会给中国软件产业带来什么样的影响?
赵亚雄:鉴于中国经济的独特结构,国有企业主导的、以公有制主体的经济格局,要有美国模式的 SaaS 产品出现,成本太高了。
大模型的出现意味着以 AI 为主体的软件服务,会给中国软件产业带来跳跃式发展。如同中国跳过 PC 互联网的成熟而直接进入移动互联网,中国的软件服务业也会跳过 SaaS 进入 AiaaS 阶段,这意味着绝大部分软件应用都会用AI 模型来支持其功能,也意味着更广泛的 AI 算力需求,这正是“算想未来”最关注的市场空间。
如此一来,国内的 AI 基础设施市场有机会出现一个“为中国 AI 经济而生的 AWS”,在AI云上也随之能长出如Netflix这样的现象级SaaS应用。这是“算想未来”的机会和目标。
但国内这些以大模型为核心的公司,不会成为像AWS那样的大公司。我们当然是希望王慧文这样的成功创业者,能走出一条出人意料的商业化路径,这也是我们愿意跟所有的大模型团队,一起来琢磨在更大的集群上跑更大的模型的办法,首先完成对 OpenAI 的追赶,然后大家再厮杀角逐出最强的团队,跑出最好的商业模式。
雷峰网:为什么国内这批以大模型为核心的创业公司,不会成为像AWS那样的大公司?
赵亚雄:假设这些大模型公司,打算以大模型构建公有云平台,那这意味着大模型要具有广泛的应用能力,来为其他 AI 应用团队提供一种等同于(现有公有云上的)IaaS 能力,换句话说,AI 应用团队要能够使用大模型来搭建自己的 AI 应用。
这就存在两个问题:1、大模型的泛化能力有待验证。现在仅仅依靠文本语言作为媒介的大模型,虽然表现出了类人的能力,但是难以想象这种能力如何作为基础能力,来嵌入其他应用,即商业化场景模糊。
2、大模型的技术壁垒有限。llama 意外开源之后,其能力已经接近、或部分超越 GPT3,虽然 GPT4 的能力大幅提升。但是在大厂之间,模型的能力差距在 3 年之内(以两者发布时间为对比, llama 2023年对比 GPT3 2020 年),并且这个差距是在 meta 等企业无意持续扩大模型和训练数据规模的情况下产生的。OpenAI 尚且可以凭借先发优势,保证市场主导地位,而国内公司由于均处于同一出发点,而且在技术路线上完全跟踪 OpenAI,因此并不存在一家独大的现实基础。
当然一切仍需由市场、时间给出答案。美团诞生之初,恐怕也很难以预测其能成长为 O2O 的统治者吧。
雷峰网:回到“算想未来”,名字是您取的吗?有什么样的含义或者寄予了怎样的意义?
赵亚雄:一开始项目名字叫初芯,大概意思就是说 AI 的计算,但是很多人反映听上去像一个做芯片的公司,就换成了“算网”。
因为我们是一个云计算公司,这是“网”代表的含义。那“算”则是对计算需求的体现。算网加在一起,代表我们就是一个做计算的、一个云的提供商。因为在未来比较长一段时期里面,我们相信AI算力需求会成为人类所有的算力需求里面最主流的、最重要的这一部分。算网这个阶段正是要服务 AI 计算的需求。
我们觉得“算网”非常顺口,但很快因为这个名字注册不到公司和商标。团队一起头脑风暴后有了“算想未来”这个名字。
“算想未来”表达了我们对未来 AI 算力需求的愿景,算、想这两个字代表以计算为基础,通过 AI 技术服务人们的想象力、创造力。“算想未来”代表用计算将人们想象中的未来,变成现实的使命。
雷峰网:以前的职业生涯对您此次创业有什么启发和帮助?
赵亚雄:我在 Amazon Kinesis 待了 1 年不到,Google 做了快 6 年,后来以早期员工身份加入 Pixie 并被 【【微信】】 收购。这些年里我一直在做云基础设施、AI基础设施相关的工作,积累了很多经验。
例如,参与过Amazon一个很有名的云产品 Kinesis;2015年加入Google的Borg团队,负责 Google 内部所有服务器集群,它类似一个 K8S 的平台;2018 年之后,以我为主在Borg内部开启了一个新项目,即让 Borg 上面的应用开发者,可以更容易地开发管理他自己的业务,这个系统用到了机器学习来优化集群管理和资源调度,同时也提高了Borg 平台上的底层硬件资源的使用效率。
Borg后期的工作,主要的重点都是来支持机器学习和人工智能,就像网络层的话,我们给机器学习这些算力芯片都专门设计了高性能的网络。我也直接参与和领导了 Google 内部全球化 GPU 算力池的项目,目的是让 Brain、DeepMind 的 AI 研究者和工程师,非常容易地把机器学习训练任务跑在全球各地的数据中心里。
2019 年作为第四号员工,正式加入 Pixie初创公司,这个公司的软件工程体系是我跟创始人一起,按照 Google 的实践经验来搭建的。
具体来说,Pixie算是我第一次正式创业,它是一家硅谷初创公司,产品是面向 Kubernetes 的微服务观测平台,创新点是用 eBPF(Linux 内核中的可观测性 API)实现无侵入式的数据采集。Pixie 曾获得顶级 【【微信】】 & GV的投资,并于 2020 年 12 月被应用性能监控领域的老牌厂商,同时在纽约证券交易所上市公司 【【微信】】 收购。
其实,Amazon和Google的经历,除了让我在技术上得到历练和积累,更多的是对我创业精神的影响。Amazon和Google都是极具创业文化的公司,在Amazon,内部每个团队都可以作为一个小的创业公司,来定位自己的业务方向;而Google鼓励员工创业,在员工离职创业后,想要再加入Google并不需要面试,这给了员工很大的心理保障和激励。
雷峰网:作为初创公司,我们怎么与百度百舸、火山引擎这些大厂的产品来竞争?
赵亚雄:这是一个很重要的问题,也是我和COO李静,包括其他创始团队成员每天都在花时间思考的一个问题。
技术角度,最大的优势在于我们有后发优势,这是在出现一次巨大技术变革之后,新入局的玩家共同具有的一个优势。
在大模型带来的 AI 计算需求之前,在所有主流平台上的AI需求都不是主流的需求,所以大家对该问题的研究都是很有限的。换句话,今天我们跟他们其实是处在同一个起跑线上。
对比大厂有钱有资源,初创企业胜在小而精悍,整个团队凝成一股劲之后的战斗力,是很多大厂比不了的,对此我在Pixie深有感触。这也是我创业“算想未来”的动力和信心来源之一。
当遇到一个非常难的一个技术问题的时候,创业公司往往整个团队更加执着,以及整个团队的紧密合作最后得出来的解决方案,其质量远高于大厂。
这可以用“木刀”和“钢刀”来比喻大厂和初创企业,相比木头,钢铁更锋利是因为它的元素更紧密地贴合在一起,密度大。大厂更像是一个木质的机构,自然会面临组织能力涣散、退化。所以“算想未来”要解决的就是如何长期拧成一股绳,保持高战斗力,跟大厂对抗,如何能始终保持这种凝聚力,这是我们最核心、最关键要考虑的问题。
具体到正在做的事情。我们的核心团队成员都是来自国际大厂的infra技术专家,同时我们能时常与 OpenAI、 MSR 、Google、DeepMind这些AI先进团队保持密切交流、合作,从而从各个层面了解世界前列对 AI 的趋势判断。这是国内以业务驱动的 AI 团队所不能比拟的,因为我们所
对话 | 杨晓哲-王晴晴:以ChatGPT为代表的人工智能对教育的影响
对话嘉宾
日新月异:人工智能的无限畅想与有限能力
王晴晴:杨老师,您好,很高兴今天能和您共同探讨人工智能的教育影响这一话题。最近,有一款叫做ChatGPT的人工智能产品引发了广泛讨论,这款由OpenAI公司开发的智能对话机器人在发布后受到了广泛关注和赞誉。许多科技媒体和评论家对它表现出色的自然语言处理能力以及在生成连贯、自然的文本方面的能力表示赞叹,认为它代表了人工智能领域的一个重要里程碑,是“人工智能的一个重大突破”。您一直深耕教育信息化领域,对人工智能+教育领域有很深的见解,您怎么看待ChatGPT类产品引发广泛讨论的原因?它与以往的人工智能产品的最大区别是什么?
杨晓哲:ChatGPT在短短一周内的注册量超过一百万,并在短短2个月的时间里创造了过亿月活跃用户,是一个现象级的人工智能。它与以往我们所接触的人工智能最大的不同点在于,过去我们所接触的所有智能都是弱人工智能,都是细分领域的智能,无非是下象棋下得更好,下围棋下得更厉害,但没有办法跨领域,而ChatGPT在某种程度上正在接近跨领域的通用人工智能。这种跨领域能力基于多方面技术支持。达千亿的庞大文本数据训练使它具有了丰富的知识储备和广泛的语言理解能力,自然语言处理能力使它能理解和生成自然语言文本,用户与其能进行流畅的对话,它可以理解用户提供的上下文信息,回应用户的问题和需求。此外,多语言支持使其能够为全球各地的用户提供服务。更重 要的是,作为生成式人工智能模型,ChatGPT可以不断地学习新的知识和技能,以适应不断变化的世界。
人类其实对未来的人工智能有很多想象,如:希望它能与人们无缝沟通,成为融入生活、提供建议的语音助手;设想未来的机器人具有高度的自主性和适应性,能够在各种环境中自主地完成艰难的任务;设想未来人工智能通过脑机接口与人类大脑实现深度融合,实现对人类思维、意识、记忆等方面的拓展和提升,乃至期待未来的人工智能能够协助人类解决诸如气候变化、能源危机、传染病等全球性问题,为人类的可持续发展提供智能支持……这些想象都对人工智能的跨领域问题处理能力提出了很高要求,ChatGPT的出现,让人们看到了这种想象实现的可能性。
王晴晴:您刚才提到,ChatGPT是现象级的人工智能。在每一次人工智能的技术变革浪潮中,“人类是否会被机器取代”这一问题总会被提及,我们也听到了一些这样的声音,ChatGPT展现了各种惊人的强大应用,您认为它的能力水平足以“取代人类”吗?
杨晓哲:的确,ChatGPT的进步随着算法的不断迭代,从量变积累到了质变,但它并非无所不能,也不足以“取代人类”。我们团队对它的逻辑思维能力和批判性思维水平做了测试,刚刚发布的ChatGPT4.0版本,在批判性和逻辑思维能力测试中的正确率是82.5%,而在以往的相关研究中,美国大学本科生的平均正确率是67%~75%,也就是说,ChatGPT在逻辑思维和批判性能力上是稍高于本科学生的。当然,它也有出错的时候。例如,我这里有一道它做错的题目,这道题目是:“马克去办公室最快的路程大约需要75分钟,这段路程单程花费4.5英镑,那么马克的路程总是花费他至少2英镑,这一假设是否正确?”作为人,我们慢慢推理,应该是可以知道的,正确答案是信息不足,马克可以不选择这条最快的路程,它可以选择别的方式到达办公室,每种方式的花费都有可能不同,所以通过题目所提供的信息是没办法判断假设是否成立,但ChatGPT给出的答案是正确,当然,再试一次,它可能还会给出一个“可能正确”“可能错误”的答案选项。所以,尽管ChatGPT4.0版本已经对相应能力进行了提升,但在稍微复杂的逻辑下,它还是没有办法很好地进行逻辑推理。当然,其实这道题对于人工智能来说有点刁钻,但如果有一天它开始把握这些细枝末节之间的逻辑,连非常刁钻复杂、非常细微的逻辑都能够把握的话,就意味着它对复杂信息的推理能力又上了一个台阶。
我们团队还在教育教学能力方面对ChatGPT进行了测试,让它回答高中语文教师资格证考试的笔试题目。ChatGPT3.5的平均正确率大约是51%,而4.0版本三门科目的正确率分别是69%、74%和70%,平均正确率达到了70%,按照教师资格证考试的规则,它可以一次性通过教师资格证笔试部分。不过,ChatGPT也有很多的不足,如它不了解新课标新的数据以及中国的一些教育法律法规等。
因时而变:人工智能的教育应用前景
王晴晴:很多研究者对ChatGPT进行了测试,它能通过美国的司法考试以及商学院考试乃至医师执照考试,经您团队的测试,它已经能通过高中教师资格证笔试,对于ChatGPT类的人工智能,您觉得它们会对教育产生哪些影响?又有哪些前景与应用呢?
杨晓哲:除了ChatGPT,国内也发布了对标ChatGPT的产品“文心一言”,这类人工智能在教育领域初步展现了各种潜在的应用,并在教育工作者中引起了截然不同的反应。
支持者认为,人工智能可以提高教育效率,帮助教师更高效地处理大量的学生作业、测试和反馈,从而让教师有更多时间关注个别学生的需求和进步;人工智能 还可以根据每个学生的学习进度、兴趣和能力提供个性化的学习资源和建议, 提高学生的学习体验和效果; 可以作为教师的助手,在线回答学生的问题,为学生提供随时随地的学习支持; 可以协助开发和改进课程,提供基于数据的教学策略和建议。
持反对观点的教育工作者则认为,在教育领域使用人工智能可能会涉及学生的敏感信息,如学习成绩、行为数据等,如何确保这些信息的隐私和安全是一大挑战;过度使用人工智能技术可能导致学生和教师失去包含批判性思维、沟通和人际交往能力等在内的一些重要的技能和能力;倘若人工智能产生不准确、具有偏见或不合适的建议和反馈,会对学生的学习产生负面影响。此外,在教育领域广泛使用人工智能技术可能加剧贫富差距,因为有条件的家庭和学校能够获得更好的教育资源,而贫困地区的学生则可能无法享受到这些优势。
就作为教学助手这个功能来说,当智能成为一种助手的时候,我们需要仔细推敲这样的助手到底对我们有怎样的价值。例如,在写教案方面,在教师资格证笔试测试题中类似题目还挺丰富,还有教学设计、评价学生的作品、作业批改等,ChatGPT在这些方面能答个八九不离十,虽然确实很容易犯一些逻辑性错误,如教学评不一致,看上去像是正确的,但其实没答对,我们团队就给它扣分,但最终它还是能达到70%的正确率,这意味着人工智能确实可以在这些方面给我们带来一些帮助。它可以作为资源的助手,可以作为备课的助手,可以作为学生自学答疑的助手,可以作为推送资源的助手,可以作为作业批改的助手,教师甚至可以在课堂中加入ChatGPT展开进一步的讨论。
王晴晴:的确,如果能够将人工智能融入教学,与各种要素紧密结合,那么将产生全新的教育生态,给教师教学带来颠覆式的影响,在这个过程中,教师应该如何适应变化呢?
杨晓哲:这是一个很关键的问题。我想再举一个例子,物理教学里非常经典的一个场景就是火箭上升的过程。火箭通过这样的方式飞到外太空去,那么,我们到底如何来解释它是可以往上不断飞翔的?这道题大多数高中生在考试中都能够答对,但这并不代表他们真正理解。火箭上升的过程跟地面有没有关系,是不是地面给它一个很大的力气把它往上推呢?如果是地面给它一个作用力,那火箭离开了地面,它就不往上飞了吗?显然不是。那么火箭上升的过程跟空气有关系吗?如果是,那火箭到达没有空气的外太空,它就没有办法自主飞行了。离开了地面,火箭依旧能飞,在外太空没有空气,火箭依旧能飞,这是一道很多学生和老师不理解本质但可以大概做出来的题目。
其实这道题的原理是:火箭发动机喷出了高压的气体,火箭与这个气体产生了作用力与反作用力,这才是牛顿第三定律中作用力与反作用力原理的应用。ChatGPT在这道题上回答得就非常不错,它分析出了一些要点,我们再继续追问,在回答这道题的时候是否会出现一些常见错误,它也能罗列出一些常见的错误,所以其实在这方面ChatGPT很厉害,它不仅能够正确地回答这道题,还能够进一步罗列出学生常见的错误,并且你请它基于相同原理换一个不同的情境再提问,它也能够实现。但我想说的是,这样的解释是否正确,可能反过来要教师自己去提升判断力,判断是否要采用人工智能提供的信息和资源,使用多少,如何使用。可能教师最终会面对这样的考验。智能在为我们提供帮助的同时,也在促进每一个人进一步地成长。如果教师本来已经很熟练,能力水平很高,人工智能给出的答案就能够让教师更快速地达成教学目标;如果教师本身就不懂一道题的本质原理是什么,即使人工智能提供了答案,也没有办法进一步帮助学生。这是一个很矛盾的地方,但又是一个很微妙的地方,智能好像能够帮你,但又好像没有完全帮你。所以,在这样的一个微妙的阶段,我们还要走很长一段路。
走向何方:人工智能与未来教育
王晴晴:您认为人工智能的发展可以启示我们更关注未来教育中的哪些关键要素呢?
杨晓哲:首先,随着生成式人工智能乃至更高阶通用人工智能的不断迭代和完善,人工智能必然会以更灵活、多样的形式嵌入到学习与教育的应用场景中,并逐渐改变教师的日常教学工作,影响师生关系,乃至重塑教学生态。因此,其实我们探讨的也不仅仅是人工智能对教育单方面、单向施加的影响,我们更期待一个多元协同的“师-生-机”关系能够形成,这其中不仅有智能对教育的赋能,还有师生的成长适应过程,以及教师创新教学方式、学生改变学习模式对智能发展的推动,最终形成人机融合的教育新样态。所以,今天我们看到的无论是技术还是智能,当它指向学生的课程学习的时候,我想这几者之间应该是这样的一种关系:在教师和智能或者说广义的技术促进学生展开学习的过程中,学生能更加自主地面对课程的学习,包含课程学习的目标、学习的任务、学习的评价等。
其次,我想说的是情感,虽然我们一致认为智能没有情感,但是它已经可以产生共情。智能本身是没有情感的,但一旦它能看得懂我们提的问题、给的任务、想要达到的目的,它给我们的答案中就能体现其共情力。我们不能否定这种共情的存在,并且这种共情在未来甚至短期内会变得更强。今天我们使用的ChatGPT是网页版本,相信用不了几个月时间,我们每一个人使用的ChatGPT将是一个长期伴随的、能够积累个人数据的生成式的人工智能应用,当你与它进行长期的对话后,它将能结合之前与你所有对话的信息记录给出答案。想象一下,作为一个校长,你可以把它作为一个能共情的强大助手,你能和它一起挖掘过去对话的经验,再进一步讨论。要知道,在自然语言处理上,这是我们第一次看到有智能能够接近乃至实现共情。所以有人说“师-生-机”产生更多样的关系,过去不太可能,但今天的人工智能确实可能并且已经在实现的路上。不仅是教师在和智能共情,学生也正在和智能产生共情,当学生们有一天更愿意向智能询问答案的时候,就是更进一步共情的开始。我们在与大自然的交互中或者在日常的人际交往中都能获得很多情感的共鸣,但我更想说的是,我们今天跟智能的深度接触,也在给我们带来更进一步的情感的能量。我们要强调与智能深度的融合所带来的无限的能量,相信在智能的赋能下,我们可以更关注人的情感、动机、意识、合作和幸福。
已经有很多人说人越来越像机器,机器越来越像人,恐怕现在的课堂确实有越来越机械化的倾向,这也是我们必须面对的问题。我们的课堂分析团队对1000节中小学常态化课进行了基于人工智能的分析,发现在这1000节课中,课堂的总合作时间平均只有90秒。当然这其中有些课是35分钟,有些课是40分钟,但平均的合作时间只有90秒,课堂中学生开放式表达的平均时间也只有105秒,也就是说,在常态化的课堂中,教师留给学生进行小组合作的时间非常有限,给学生开放式自由表达的时间也非常有限,这是当下课堂的现状。所以,目前不断地追求与强调素养导向,从课时到单元,从竞争到合作,以素养为导向的倡导是否能够在常态化课堂里实现,依旧值得我们去思考与实践。因为我们发现,常态化的课堂离愿景确实还有很长的距离。
王晴晴:立足未来,您觉得我们需要智能、拥抱智能的终极原因是什么?
杨晓哲:在智能的时代,不仅是每一个个体,我们希望的是全人类可以成长。因此我们需要有更远大的愿景、更美好的希望、更宏伟的事业追求,这是我们需要智能的终极原因。从个体的层面来说,所有的技术包括智能技术都能成为每一个人成长的关键契机。例如,当你在一个重要的时刻读到一本书、遇到一个人、做成一件事,都可能成为你成长的重要转折点。今天我们获得了很多技术,这些技术的使用也可能成为每一个学生重大转变的契机。以往没有机会遇到,但遇到之后,他就有可能成为不一样的自己,这就是智能赋予每一个人成长的空间。
王晴晴:虽然我们提到了很多未来美好的愿望和愿景,但面对人工智能,我们虽满是欢喜,却同时又充满担忧,越是期待却越是禁止。一些学校已经严令禁止ChatGPT进入校园,您怎么看待这种现象?
杨晓哲:我们可以看到学校禁止过圆珠笔,禁止过牛仔裤,禁止过电视机,现在还在禁止智能手机。我相信不仅仅是个别学校,在短期内我们还会见证一股禁止ChatGPT以及生成式人工智能在教育领域的应用的浪潮。这似乎不可避免,如此矛盾,我们可以用合理的视角去观察这种矛盾,思考我们如何既禁止又接受,又如何在适当的时候快一点拥抱、快一点开放。
正如我们一直在讨论智能设备在学校内的常态化使用,我10年前在上海嘉定调研,那个时候嘉定实验小学就已经允许学生自带终端进学校,当时我们期待两三年之后,所有学校都能实现学生自带终端学习,因为这不难,我们每个人家里都有设备,我们每个人都对使用网络得心应手。但10年后的今天,在终端进校方面发展依旧举步维艰。这既涉及智能终端的使用分层分类,还涉及教育资源的分配和模式的构建,如小组有终端,人人有终端,但回到家里没有终端,这又成了问题。组建不同的教育教学模式是一个非常漫长的过程,智能赋能是一个非常漫长的过程。虽然我很乐观,但我依旧觉得这不能一蹴而就,可能我们的教育领域需要感受到更大的冲击。
举个例子,互联网在日常生活中使用很频繁,但在教育领域其实还不怎么被提倡使用,这样的一个冲击是我们当下所面临的。紧接着我们可能面临的是整个社会都在使用智能的现实情况,但教育对使用智能还是持比较保守的态度,这样的反差带来的冲击可能会更大。我们如何去面对冲击,在冲击下我们的认知能否紧密地融合智能,融入到人的学习的历程中,这很值得思考。
王晴晴:您认为,面向未来,人工智能和人类的关系最终将走向何方?
杨晓哲:其实从近一百多年的进程来看,我们都在思考这样的一个问题:“人如何产生认知?”只不过今天我们要思考的命题将更进一步,这一步无论是行为主义、认知主义还是建构主义都还没有作出解释,也就是当认知产生的过程不只由人类单独建构,而是人与机器成为一个共同体一起去探索、建构时,哪些是可以外部存储知识,哪些是可以内部联通的认知?这是一个面向未来的新的命题。所以人机共存的新的学习模式也是我们要不断探索的最核心的话题。
人机协同乃至人机融合在生活中已经无处不在,使用智能导航可以更从容地前往目的地。如果离开了智能导航,我们在很多地方可能都不敢走路、不敢开车,但使用智能,人生是否也可以更从容地前往终点、更有意义地度过,可能是需要思考的问题,也是当下人机融合的立足点――我们要善于使用智能产生融合,正如使用智能导航一样。在技术发展领域有一个非常著名的定律叫摩尔定律,摩尔定律指出,每18个月算力会增强一倍,成本也会降低一倍。现在有人说可以从摩尔定律迭代到智能摩尔定律,即每18个月智能会有一轮新的迭代,在这样一个变化的过程中,有人预测了奇点来临的时间是2045年。届时,人工智能将超越人类智慧的总和,未来很多事情将由人和人工智能一起去探索和完成。当然,也有很多事情可以完全交付给智能,人类需要有更广阔的胸襟与智能展开更密切的合作。人工智能的发展为我们带来了放弃简单工作的契机,现代人已经逐步从传统农耕或工厂里流水作业的工作中解放出来。放弃能被机器与智能取代的工作,去获得一个在更广阔天地中实现的完整人生,这或许将为我们和学生带来更美好的生活和更有意义的追求。
王晴晴:杨老师,感谢您今天和我们分享了很多关于人工智能的现状以及人工智能如何影响教育、影响未来的话题,也希望未来能有机会与您就人工智能与信息技术的话题进行更多的探讨。
杨晓哲:很高兴能借这次机会分享我对人工智能对教育的影响的一些看法,期待在教育逐渐转向智能时代的当下,能够见证智能与教育的进一步融合创生。
文章刊登于《中国信息技术教育》2023年第8期
阅读本期完整内容
欢迎订阅
纸质版订阅
电子版订阅