庆云古诗词

庆云古诗词

百度的初心李彦宏演讲 李彦宏百度愿景全文

淘文章 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

百度百科初心,初心百家号,初心创始人,初心的原型

来源:猎云精选,文/王非

十年磨一剑,“文心一言”终于利刃出鞘。

3月16日下午,百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

据介绍,百度文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革,最终“革新生产力工具”。

即日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

尽管在现场展示中,文心一言已经几乎能媲美ChatGPT,但李彦宏也坦言:确实不尽完美,“这类大语言模型还远未到发展完善的阶段,进步空间很大”。

凭什么“革新生产力工具”?在李彦宏的现场展示中,文心一言在五大使用场景中,展露了其五大能力。

从对标ChatGPT的层面来看,文心一言基本做到了“人有我有”。

如果你体验过ChatGPT,那么对于其强大的“人工智能聊天机器人服务”,应该是印象深刻的。

这一点当然也只是最低门槛,百度凭借其在搜索业务的积累,拥有世界上较大的知识图谱,可以轻而易举地实现这一功能。

在李彦宏现场展示的文学创作场景中,文心一言根据对话问题将科幻小说《三体》的核心内容进行了总结,并提出了五个续写的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。

此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。

ChatGPT的“创造力”,也是让人“惊艳”。

在这一局的PK中,百度文心一言在商业文案创作场景中,顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

据介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。这让百度在中文语言的处理上,能够处于独一无二的位置。

“鸡兔同笼”成为了文心一言,展示其“数理逻辑推算”能力的案例。

面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。

在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗:洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。

李彦宏提到,文心一言也支持英文,但是“懂得都懂”,相较于ChatGPT仍是“不尽完美”。但是,未来,文心一言必然会朝着支持多种语言的方向,继续进步。

李彦宏在现场以“2023世界智能交通大会”为题,展示了文心一言在多模态生成方面,生成文本、图片、音频和视频的能力。

最初,文心一言为“2023世界智能交通大会”创作了一张海报;随后,对于“智能交通最适合哪个城市发展”这个问题,也给出了相应的观点解答;有趣的是,文心一言甚至能够生成四川话等方言语音;最后,文心一言甚至可以将上述文本、图片、音频信息,统一生成一个完整的视频版本。

遗憾的是,由于视频生成的成本较高,目前尚不对所有用户开放。但是,熟悉百家号的用户,已经在使用这一功能了:你创作的文字内容可以快速转制成视频模式并自动发布在百家号上。

李彦宏表示,“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

复刻ChatGPT,注定是一场巨头专属游戏,创业公司胜出的概率无限趋近于0。即便是最被寄予厚望的百度,也只能用“对标”而非超越,用“人有我有,人有我待优”,而非“人有我优”。

在演讲的开始,李彦宏就提到了“不尽完美”,“大家的期望值是要对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。”

事实,或许也正如此。就在文心一言正式发布的前一天,OpenAI发布了多模态预训练大模型GPT-4(接受图像和文本输入,发出文本输出)。

OpenAI官方称,GPT-4是OpenAI扩展深度学习的最新里程碑。其联合创始人& CEO Sam Altman也表示,“GPT-4是我们迄今为止功能最强大、对齐最好的模型!”

为了初步了解GPT-4在其他语言上的能力,OpenAI使用Azure Translate,将一套涵盖57个主题的1.4万多项选择题的MMLU基准,翻译成了多种语言,然后进行测试。

在测试的26种语言中,有24种语言,GPT-4优于GPT-3.5和其他大语言模型的英语语言性能。其中,中文达到了80.1%的准确性,而GPT-3.5的英文的准确性为70.1%。

也就是说,在这个测试中,GPT-4对于中文的语言理解,已经优于此前ChatGPT对于英文的理解。

此前,文心一言或许能够比使用GPT-3.5的ChatGPT优秀,但想要与使用GPT-4的ChatGPT一较高下,似乎还需要更快进步、成长。

于是,保守起见,文心一言原本可称之为“人有我优”的“中文理解”,也只得归为“人有我有”。

而在多模态生成方面,文心一言的展示有限,似乎也只能是“人有我待优”。

当然,也无需妄自菲薄,李彦宏强调:“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”

此前在2月份财报发布后,李彦宏也曾表示,百度计划将多项主流业务与文心一言整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等。

想必在未来,我们也将在实实在在的生活中,便捷直观地体会文心一言。

“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”李彦宏指出。

事实确也如此,近十年来,百度累计研发投入超过1000亿元。2月底发布的2022年的财报也显示,百度核心研发费用达到214.16亿元,占核心收入比例达22.4%。

李彦宏表示:“人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。百度是全球为数不多、进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的关键自研技术。”

李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

而更低的成本,也就意味着可以吸引更多的用户试用、体验。自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到,文心一言和生成式AI代表了一个新的技术范式,它会影响到每一家公司。

李彦宏认为,AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。他预测,“大语言模型将带来三大产业机会。”

第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前,企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了十多个行业大模型。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司。

李彦宏表示,AI对各行各业的颠覆性改变才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。

举报/反馈

百度的Chat GPT叫什么名字 阿里类chatgpt产品正在内测

百度的chat叫什么,百度的产品有哪些,百度的畅读模式老是自己打开,百度的插件怎么删除

过去几个月,【【微信】】 掀起的浪潮一刻也没有停歇,包括国内大量公司和科技从业者在兴奋于 【【微信】】 出现的同时,也在期待中国自己的 【【微信】】。在所有宣称将要推出类 【【微信】】 产品或大语言模型的公司中,百度是最早官宣的一批,也是第一个选择正式发布的公司。

3 月 16 日,就在 GPT-4 重磅升级的两天后,百度如期在北京总部正式发布了旗下大语言模型――文心一言。发布会现场,百度创始人兼李彦宏展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。

图/百度

不过根据李彦宏的说法,由于生成式需要输入较长的文本和时间,不适合在现场实机演示,故而选择用录屏形式展示文心一言的生成效果。坦白讲,作为一场商业产品发布会,可以理解,毕竟一旦出错将会极大影响外界的看法和股价,谷歌此前推出生成式 AI 聊天机器人 Bard 时就因为一个「答非所问」的错误:市值蒸发了上千亿美元。

但也要承认,录屏的发布形式始终也让这场产品发布会显得有些空洞――谁也不知道录屏背后会有多少次尝试和人工痕迹,所以才有人调侃百度发布了 ChatPPT。反馈到股市上,文心一言不仅没有抬升百度股价,甚至在发布后一度跌超 10%。

李彦宏在发布会上也提到,文心一言并不完美,但市场有需求就必须要推出来。然而并没有准备好的文心一言,是否选对发布时间和节奏,目前仍未可知。但尽管如此,还是能从这场发布会的内容中一窥文心一言的面貌,以及百度的野心与困境。

文心一言距离 【【微信】】 有多远?

根据发布会上的视频展示,文心一言面向大众用户的交互界面基本与 【【微信】】 类似,都以对话机器人形式回应用户的文本输入。

图/百度

但文心一言并没有像两天前发布的 GPT-4 一样支持对图片信息的总结和分析――读图、识图,甚至懂梗图,OpenAI 就将去年的一张梗图输入并附上文字要求 GPT-4 解释笑点,结果 GPT-4 准确地指出了「梗」是「将过时的巨大 VGA 接口插入现代的小巧智能手机的反差」。

图/OpenAI

不同的是,文心一言支持了语音和视频的输出。「语音」支持只是通过 TTS 语音合成技术以四川话读出文本内容,并不值得一提,但「视频」生成的难度明显更高。仅从录屏展示来看,尽管模板痕迹明显,但生成视频(视频素材+字幕)至少还是可堪一用。

而具体文本理解和生成能力上,百度在第一个「文学创作」环节展示了文心一言的续写《三体》的创意能力,比如续写可以从哪些角度出发:

图/百度

这些回答本身不存在对错,但如果我们对比下 【【微信】】 的回答,一定程度上能发现文心一言的文本输出更「泛泛而谈」,【【微信】】 的输出会更加具体:

图/【【微信】】

此外,百度在「商业文案」环节展示了如何用文心一言起公司名,我们也以同样的问题询问了 【【微信】】:

图/百度

图/【【微信】】

一个值得注意的问题是,如果不强调中文名,【【微信】】 会自然倾向使用英文名。

就像我们在之前的文章中提到的,OpenAI 在训练 GPT-3.5 和 GPT-4 大语言模型时的语料库、基准测试和开发人员都是以英文为主,所以 【【微信】】 在英文的理解和生成能力胜过包括中文在内的其他语言。

这也是百度的优势所在。

百度可能更懂中文

尽管在整体能力上,很难期待百度一跃超过 【【微信】】 和 OpenAI,但百度文心一言相比 【【微信】】 在中文信息的可靠性上可能会有一定优势。除了上面提到的语言倾向问题,【【微信】】 不论是 GPT-3.5 还是 GPT-4 版本,训练用语料库都截止于 2021 年 9 月,在涉及很多未知信息时容易编造内容,比如在介绍电视剧《三体》演员阵容时再次「胡编乱造」:

图/【【微信】】

相较之下,百度文心一言和微软 【【微信】】 都正确指出了具体的演员阵容,【【微信】】 还提醒了我们另一个 Netflix 版本的电视剧《三体》。

发布会上,李彦宏表示,百度和文心一言更懂中文和中国市场,甚至单独在五个环节中设置了「中文理解」的环节来展示。以百度官方演示的「洛阳纸贵」为例,【【微信】】 再次出现了「幻觉」,文心一言和 【【微信】】 基本指出了正确典故,但接下来只有文心一言正面回答了「当时洛阳的纸到底有多贵」:

图/百度

当然,考虑百度选定的问题以及录屏的形式,还很难就此断定「文心一言在中文上比 【【微信】】(GPT-3.5)更强」,但可以肯定的是,「中文」的优势一定是百度乃至未来中国类 【【微信】】 产品发力的重中之重。

而同时百度也展示了自身在行业应用上的优势。李彦宏引用百度在人工智能上的四层架构――(AI)芯片层、(深度学习)框架层、模型层、应用层时谈到,百度的多层架构协同效应将推动 AI 实现更快的迭代速度,以及在应用上也会有更高的效率和成本。

文心一言主要分为两部分,一部分是面向普通用户,通过嵌入百度搜索,用户可以直接与文心一言大语言模型交互,预计类似微软的 Bing 搜索和 Chat 的形式;另一部分面向企业客户,提供上述提到的四层人工智能全栈能力,从底层的云计算能力到深度学习框架,再到大模型和应用。

图/百度

事实上,百度相比 OpenAI 更早开启了 AI 大模型的商业化进程,在百度文心大模型的官网就展示了与不同领域大公司合作开发的行业大模型,此外还宣布已经有 650 家合作伙伴接入了文心一言,包括之前官宣的魅族、携程、兴业银行、美通社等。

但最终百度还是在用户侧证明文心一言的表现实力,否则从合作伙伴到客户到头来只会放弃百度。

百度必须拥抱 【【微信】】

我们高估了 【【微信】】 的意义吗?比尔・盖茨将其比作互联网的诞生,微软 CEO 纳德拉说它堪比工业革命,英伟达 CEO 黄仁勋称其为 AI 的「iPhone 时刻」。

我相信,但好像也无法笃定未来一定属于类似 【【微信】】 的产品,不过可以肯定的是,【【微信】】 将改变搜索引擎的产品形态和业务模式。在这一点上,去年广告收入(包括搜索广告收入)占比分别为 60%和 77%的百度、谷歌都一样,必须面对 【【微信】】 带来的冲击和变革。

另一方面,百度和谷歌在很早就率先拥抱了 AI 技术,并在长达十年的时间跨度上重金投入研发。百度在 2022 年将全年核心收入的 22.4%,即 214.16 亿元投入了核心研发,而据欧盟委员会发布的报告,谷歌在 2022 年更是投入了 279 亿欧元研发经费,居全球第一。

但在 【【微信】】 之前,庞大的研发积累始终没有找到合适的商业化出口,颇有些「英雄无用武之地」。

【【微信】】 带来的突破确实带来了出口,或者说风口。当用户、开发者和企业客户都在拥抱 【【微信】】,百度不可能放弃,就像李彦宏说的,文心一言没有准备好却还是要发,是因为有市场需求。

题图来自百度