逐浪AIGC丨国产版ChatGPT打响“第一枪”:文心一言终亮相
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。
2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。
时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。
经过长达一个多月的内测后,3月16日,国内首款对标ChatGPT的产品“文心一言”正式现身。
从现场氛围可见外界的期待。早在发布会正式开始前半小时,容量超百人的现场已几乎座无虚席。一天之前,OpenAI正式发布王炸产品GPT-4全面“秀肌肉”,人们都很好奇,百度的文心一言究竟是怎样的产品。
“我自己测试感觉还是有很多不完美的地方。”在文心一言的发布会现场,百度公司创始人、董事长兼CEO李彦宏坦言道。但他同时指出,文心一言对标着ChatGPT甚至GPT-4,门槛是很高的,“全球大厂还没有一个做出来的,百度是第一个。”
作为国产ChatGPT“第一枪”,文心一言在百度内部的地位不言自明。从李彦宏“代言”的态度也可见一斑。发布会结束后,李彦宏罕见地专门预留出时间接受现场提问――上一次他与媒体公开交流的时间点,可回溯至6年前陆奇的入职。
之所以文心一言让李彦宏如此兴奋,源于他对人工智能行业拐点的判断。“过去这一年多的时间内,人工智能领域发生了比较明显的变化,从过去判别式的人工智能转向了生成式的人工智能。”在接受包括21世纪经济报道在内的媒体采访时,李彦宏透露称,百度已经看到在生成式AI领域的强烈市场需求,这也是百度积极研发、迭代并推出文心一言产品的原因。
文心一言来了
“前几天我拿到了内测账号,测试后觉得整体大大超出了我的预期。”在接受21世纪经济报道记者采访时,体验过文心一言内测的百度员工如是说。
对于该员工而言,文心一言的面世,更像是从0到1的过程。而超出他预期的部分,首先在于这款产品本身的问世,其次在整体效果。“要真正追上ChatGPT确实存在难度,但国内能在短时间有这样的产品出来,就已经很不容易,先上桌,才能进入快速迭代的飞轮。”
从发布会现场来看,通过在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的能力展现,文心一言也确实在一定程度上具备对人类意图的理解能力,回答的准确性、逻辑性、流畅性也都逐渐接近人类水平。
例如,在文学创作场景中,李彦宏以著名科幻小说《三体》为例,围绕小说核心内容、内容续写提问文心一言,在几秒时间内,文心一言给出综合性强、内容提炼度高的回答;在数理推算能力展示中,文心一言对“鸡兔同笼”问题进行作答并纠正了题干给出的错误信息。
此外,文心一言还具备文本、图片、音频和视频的多模态生成能力,在音频方面甚至能够生成四川话等方言语音。“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
一位业内观察人士向21世纪经济报道表示,文心一言看似简单,其实背后具备很高的技术门槛。“能做应用题,意味着对长文本的理解能力要求很高,整体文生图、文生视频这些多模态生成能力也需要大量的技术积累。”
该人士同时指出,此前ChatGPT给他最大的震撼点在于它是一套通用人工智能系统,这是对于行业的颠覆。“过去的AI深度学习更多是将任务进行拆解和细分,任务拆得越细就越简单,AI就容易处理并达到较好的效果,如今则是一套模型打天下,通过零样本学习具备深层次的通用能力,这件事情是非常难的。”
不过,从整体而言,文心一言这类大语言模型还远未到发展完善的阶段。“作为普通用户来说(与ChatGPT)可能差距不大。”一位参与文心一言测试的用户向21世纪经济报道记者表示,“但作为专业创作者,包括作者、码农,文心一言生成的答案就没那么精准。”
而这背后,有赖于通过真实的用户反馈而逐步迭代,这也是此次文心一言对外发布的意义所在。“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”李彦宏表示。
本土化或成优势
尽管目前暂无法与ChatGPT同日而语,但文心一言也有自己的优势。
在发布会现场,李彦宏特别对文心一言的中文理解能力进行了展示。在展示过程中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
“‘洛阳纸贵’、‘藏头诗’,这很考验AI对中文和中国文化的理解。”李彦宏指出,“作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。这个例子就比较清楚的展示了我们在中文上的优势。”
“当前ChatGPT的强大是有目共睹的,但在中文领域ChatGPT的成熟度略低。”在接受21世纪经济报道记者采访时,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林指出。事实上,作为高度本土化的生成式AI产品,文心一言更加匹配国内用户的中文使用习惯,表现出较高的中文语言和中国文化的理解能力。
对中文的准确理解,离不开高密度的中文数据训练。此前在接受21世纪经济报道记者采访时,IDC中国研究总监卢言霞认为,文心一言有中文语言优势,有国内领域相关数据积累。据了解,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。
在盘和林看来,文心一言的另一个优势则在于易得性,相较之下,ChatGPT在国内的使用难度明显较高。
也正是在这种种优势下,大量的企业对文心一言保持着超高的热情。据李彦宏披露,自2月7日百度官宣文心一言后,已有650家企业宣布加入文心一言生态。
而本次发布会上,百度同时公布了文心一言的邀请测试方案:3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。
此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。
据21世纪经济报道记者了解,在文心一言发布会后一小时内,排队申请文心一言企业版API调用服务的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。
不过需要看到的是,与国外对标下,文心一言仍有提升空间。“当前百度的文心一言面临的是一个强大的对手,一步到位追平的难度很大。”盘和林直言道,“借助中文和应用易得性两项,百度应该会有个不错的开始,但维持优势、提升应用广度还需要很长时间。”
(文章来源:21世纪经济报道)
ai产品经理视角的chatgpt全解析 ai产品经理视角下的chatgpt全解析
ai产品经理是什么,产品经理进化论:ai+时代产品经理的思维方法,ai产品经理面试经验,ai产品经理面试题编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。
2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。
时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。
21世纪经济报道记者白杨 北京报道
在ChatGPT出现前,有人悲观地认为,AI领域已经形成巨大泡沫。但眼下,AI又呈现出了全新的价值,行业重现百家争鸣的热闹景象。
近日,OpenAI的GPT-4、百度的文心一言等大模型相继发布,更是将AI产业推入了新一轮军备竞赛。
那么,科技巨头们到底在竞争什么,是大模型吗?肯定不是,因为单纯比拼模型参数量的大小没有太大意义,并且这是一个无底洞。而创新工场董事长兼CEO李开复近日抛出的“AI 2.0”概念,或许能够回答这一问题。
李开复认为,AI 2.0是绝对不能错过的一次革命,“网上都在谈一些很酷的国外产品,但那些产品只是冰山一角,以后的机会更大,并且它会是一个平台级别的趋势。”
创新工场董事长兼CEO李开复 白杨摄
什么是AI 2.0?
如果把过去的AI看作是1.0阶段,可以总结出它的落地需要五大必备条件,分别是海量数据;精准、自动标注数据;单一清晰领域;大规模计算能力;顶尖AI科学家。
事实上,得益于AI 1.0阶段的发展,人工智能在很多领域都已经超越了人类,比如AlphaGo曾打败人类。但是,AI 1.0的发展也开始遇到瓶颈。
比如对AI训练来说,数据肯定是越多越好,但这也意味着更高的成本;另外AI技术的应用,都是单一领域数据集,所以每次都要重新收集、清洗、标注一套数据,然后训练一套模型,这导致每个领域和应用的优化都是割裂的。而这,也是很多公司虽然具备单场景的解决能力,却无法规模化复制的核心原因。
更重要的是,在AI 1.0阶段,人们感受到的人工智能并非真正的智能,它还欠缺抽象概念、分析推理、创造等能力。
在李开复看来,AI 2.0最大的不同,就是克服了AI 1.0单领域、多模型的限制。“通过自监督学习,AI可以将全世界的数据拿来自己教自己,不再需要人工标注,而且最后形成的基础模型,也是覆盖各个领域。”
比如GPT,就是这样一个基础模型,所以它能让ChatGPT表现出无所不知。“现在的局限性在于存储性能,未来2-3年,数据只要能储存起来,都可以放到模型中去训练,届时也一定能做出更伟大的基础模型,”李开复说。
另外,李开复认为AI 2.0已经具备了平台能力。“深度学习是非常伟大的AI技术,但它不是一个平台。平台需要能大大降低开发应用的成本,如果做不到这一点,那就只能是一个技术。就像电,是伟大的发明,但如果没有电网,其他电子设备也无法用上电,所以电网才是平台”。
李开复表示,AI 2.0时代的来临,将带来巨大的平台式机会,这个机会将比移动互联网还大十倍。
不能盲目求“大”
大模型,是AI 2.0时代的产物。澜舟科技创始人兼CEO周明在接受21世纪经济报道采访时提到了AI能力的涌现现象。“随着AI模型达到一定程度,往往会让已有的能力产生跃迁,并且会迸发出一些从未见过的能力,所以一定要关注AI的涌现能力。”
其举例称,“我们做小模型的时候,多轮对话就是出不来,但在模型增长了10倍之后,多轮对话的能力自然就出现了,这就是一种涌现。所以如果模型再大一点,有些没有设计的功能也会自己出现。”
不过,AI的涌现仍是未解的现象,也具有很强的随机性,不同的人可能在不同的阶段都有模型的涌现,或者没有涌现。但目前来看,都是在模型规模变大之后才出现的,所以周明认为,未来需要尽量把模型做大。
目前,只有少数科技巨头具备实力打造更大规模的大模型。
另外在AI 2.0时代,还有很多待解的难题。李开复提到一点,即AI会犯错,而且它还不知道怎么能不犯错。“AI 无法保存全世界的数据,只能通过压缩形成抽象的概念,因此会出现‘一本正经地胡说八道’的现象。更重要的是,AI 目前还无法分辨真伪和辨别是非,如果被恶意利用将会带来无法衡量的负面后果”。
因此,面对大模型这场无底洞的全球军备竞赛,周明认为,中国公司还是要审时度势,第一,要拥抱大模型;第二,要在涌现出现的前提下,把AI模型做的更好、更精致;第三则是要注重落地,不要总想着把边边角角的智能都体现出来。
对于AI的产业落地,腾讯云副总裁、腾讯云智能平台负责人李学朝在接受21世纪经济报道采访时指出,通过“预训练大模型+下游任务微调”的模式,一定会让AI应用变得更加通用化,在此基础上,原有的AI应用场景会做的更深,同时,AI也会渗透到更多场景当中去。
不过,AI应用是以解决问题为优先的,所以现在很多场景,用原来的AI模型能解决问题,就没必要去追赶热度,毕竟采用大模型对客户来说也会带来额外的成本。但是对于一些场景,比如智能客服,借助大模型能带来直接的效果提升的,则可以在权衡好性价比的情况下,去进行尝试。
掘金新万亿美元市场
对于AI 2.0时代,李开复认为,AI的自监督学习,依靠的是生成式AI(Generative AI),而这,也将是AI 2.0时代的第一个现象级应用。
李开复表示,目前AI 2.0的技术水平,对内容领域的风险是最小的,所以第一批应用也会在这个领域诞生。“AI 2.0对内容创造带来的颠覆将是巨大的,它将产生完全不同的工具,使用者、用户体验以及商业模式都会变得不一样”。
在其看来,AI的应用将从“辅助”人到逐步“替代”人工,第一阶段是人类与AI协作;第二阶段是局部自动化;第三阶段则是全自动化。
李开复认为,在AI 2.0时代,第一个阶段和第二个阶段都将得到实现,而这俩加起来会是一个万亿美元级的市场。至于第三阶段,让AI不再犯错,那将是更未来的3.0时代。
对于未来,李开复也给出了他的预判。其认为,会有更多革命性产品出现,也会有少数AI 2.0平台公司浮出水面,并加速新一代AI 2.0应用的研发和商业化。但是,AI 2.0 不会是通用人工智能(AGI),人类具有诸如创造力、策略思考、跨领域常识、自我意识、同理心和爱等等与生俱来的关键能力,这是AI 2.0也无法全盘复制的。