庆云古诗词

庆云古诗词

百度推新搜索app李彦宏 到底是文心一言还是文心一格

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

用百度搜索李彦宏,李彦宏百度靠什么赚钱,李彦宏创建百度的机会,李彦宏百度怎么赚钱

  过去几个月,chatgpt 掀起的浪潮一刻也没有停歇,包括国内大量公司和科技从业者在兴奋于 chatgpt 出现的同时,也在期待中国自己的 chatgpt。在所有宣称将要推出类 chatgpt 产品或大语言模型的公司中,百度是最早官宣的一批,也是第一个选择正式发布的公司。

  3 月 16 日,就在 GPT-4 重磅升级的两天后,百度如期在北京总部正式发布了旗下大语言模型――文心一言。发布会现场,百度创始人兼李彦宏展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。

图/百度

  不过根据李彦宏的说法,由于生成式需要输入较长的文本和时间,不适合在现场实机演示,故而选择用录屏形式展示文心一言的生成效果。坦白讲,作为一场商业产品发布会,可以理解,毕竟一旦出错将会极大影响外界的看法和股价,谷歌此前推出生成式 AI 聊天机器人 Bard 时就因为一个「答非所问」的错误:市值蒸发了上千亿美元。

  但也要承认,录屏的发布形式始终也让这场产品发布会显得有些空洞――谁也不知道录屏背后会有多少次尝试和人工痕迹,所以才有人调侃百度发布了 ChatPPT。反馈到股市上,文心一言不仅没有抬升百度股价,甚至在发布后一度跌超 10%。

  李彦宏在发布会上也提到,文心一言并不完美,但市场有需求就必须要推出来。然而并没有准备好的文心一言,是否选对发布时间和节奏,目前仍未可知。但尽管如此,还是能从这场发布会的内容中一窥文心一言的面貌,以及百度的野心与困境。

  文心一言距离 chatgpt 有多远?

  根据发布会上的视频展示,文心一言面向大众用户的交互界面基本与 chatgpt 类似,都以对话机器人形式回应用户的文本输入。

图/百度

  但文心一言并没有像两天前发布的 GPT-4 一样支持对图片信息的总结和分析――读图、识图,甚至懂梗图,OpenAI 就将去年的一张梗图输入并附上文字要求 GPT-4 解释笑点,结果 GPT-4 准确地指出了「梗」是「将过时的巨大 VGA 接口插入现代的小巧智能手机的反差」。

图/OpenAI

  不同的是,文心一言支持了语音和视频的输出。「语音」支持只是通过 TTS 语音合成技术以四川话读出文本内容,并不值得一提,但「视频」生成的难度明显更高。仅从录屏展示来看,尽管模板痕迹明显,但生成视频(视频素材+字幕)至少还是可堪一用。

  而具体文本理解和生成能力上,百度在第一个「文学创作」环节展示了文心一言的续写《三体》的创意能力,比如续写可以从哪些角度出发:

图/百度

  这些回答本身不存在对错,但如果我们对比下 chatgpt 的回答,一定程度上能发现文心一言的文本输出更「泛泛而谈」,chatgpt 的输出会更加具体:

图/chatgpt

  此外,百度在「商业文案」环节展示了如何用文心一言起公司名,我们也以同样的问题询问了 chatgpt:

图/百度
图/chatgpt

  一个值得注意的问题是,如果不强调中文名,chatgpt 会自然倾向使用英文名。

  就像我们在之前的文章中提到的,OpenAI 在训练 GPT-3.5 和 GPT-4 大语言模型时的语料库、基准测试和开发人员都是以英文为主,所以 chatgpt 在英文的理解和生成能力胜过包括中文在内的其他语言。

  这也是百度的优势所在。

  百度可能更懂中文

  尽管在整体能力上,很难期待百度一跃超过 chatgpt 和 OpenAI,但百度文心一言相比 chatgpt 在中文信息的可靠性上可能会有一定优势。除了上面提到的语言倾向问题,chatgpt 不论是 GPT-3.5 还是 GPT-4 版本,训练用语料库都截止于 2021 年 9 月,在涉及很多未知信息时容易编造内容,比如在介绍电视剧《三体》演员阵容时再次「胡编乱造」:

图/chatgpt

  相较之下,百度文心一言和微软 chatgpt 都正确指出了具体的演员阵容,chatgpt 还提醒了我们另一个 Netflix 版本的电视剧《三体》。

  发布会上,李彦宏表示,百度和文心一言更懂中文和中国市场,甚至单独在五个环节中设置了「中文理解」的环节来展示。以百度官方演示的「洛阳纸贵」为例,chatgpt 再次出现了「幻觉」,文心一言和 chatgpt 基本指出了正确典故,但接下来只有文心一言正面回答了「当时洛阳的纸到底有多贵」:

图/百度

  当然,考虑百度选定的问题以及录屏的形式,还很难就此断定「文心一言在中文上比 chatgpt(GPT-3.5)更强」,但可以肯定的是,「中文」的优势一定是百度乃至未来中国类 chatgpt 产品发力的重中之重。

  而同时百度也展示了自身在行业应用上的优势。李彦宏引用百度在人工智能上的四层架构――(AI)芯片层、(深度学习)框架层、模型层、应用层时谈到,百度的多层架构协同效应将推动 AI 实现更快的迭代速度,以及在应用上也会有更高的效率和成本。

  文心一言主要分为两部分,一部分是面向普通用户,通过嵌入百度搜索,用户可以直接与文心一言大语言模型交互,预计类似微软的 Bing 搜索和 Chat 的形式;另一部分面向企业客户,提供上述提到的四层人工智能全栈能力,从底层的云计算能力到深度学习框架,再到大模型和应用。

图/百度

  事实上,百度相比 OpenAI 更早开启了 AI 大模型的商业化进程,在百度文心大模型的官网就展示了与不同领域大公司合作开发的行业大模型,此外还宣布已经有 650 家合作伙伴接入了文心一言,包括之前官宣的魅族、携程、兴业银行、美通社等。

  但最终百度还是在用户侧证明文心一言的表现实力,否则从合作伙伴到客户到头来只会放弃百度。

  百度必须拥抱 chatgpt

  我们高估了 chatgpt 的意义吗?比尔・盖茨将其比作互联网的诞生,微软 CEO 纳德拉说它堪比工业革命,英伟达 CEO 黄仁勋称其为 AI 的「iPhone 时刻」。

  我相信,但好像也无法笃定未来一定属于类似 chatgpt 的产品,不过可以肯定的是,chatgpt 将改变搜索引擎的产品形态和业务模式。在这一点上,去年广告收入(包括搜索广告收入)占比分别为 60%和 77%的百度、谷歌都一样,必须面对 chatgpt 带来的冲击和变革。

  另一方面,百度和谷歌在很早就率先拥抱了 AI 技术,并在长达十年的时间跨度上重金投入研发。百度在 2022 年将全年核心收入的 22.4%,即 214.16 亿元投入了核心研发,而据欧盟委员会发布的报告,谷歌在 2022 年更是投入了 279 亿欧元研发经费,居全球第一。

  但在 chatgpt 之前,庞大的研发积累始终没有找到合适的商业化出口,颇有些「英雄无用武之地」。

  chatgpt 带来的突破确实带来了出口,或者说风口。当用户、开发者和企业客户都在拥抱 chatgpt,百度不可能放弃,就像李彦宏说的,文心一言没有准备好却还是要发,是因为有市场需求。

  题图来自百度


百度文心一言开启邀请测试不到一小时涌入3万多家企业申请类ChatGPT成长需更多高质量用户反馈

百度文心一言什么时候上线,百度文心一言申请要多久,百度文心一言是什么意思,百度文心一言邀请码

原标题:百度文心一言开启邀请测试不到一小时涌入3万多家企业申请类ChatGPT成长需更多高质量用户反馈

距离新一代人工智能语言模型GPT-4发布不到24小时,国内互联网大厂百度昨天发布了对标ChatGPT的AI产品――文心一言(3月16日本报第六版“热点聚焦”刊登报道《自然语言处理“战国时代”即将到来?》)。尽管百度创始人兼董事长李彦宏一上台就“降了音调”,表示推出文心一言是为了回应市场期待,产品本身并不完美,但仍然无法降低网友心中早已被拉满的期望值。

昨天,文心一言开启邀请测试不到一小时,就涌入了3万多家企业申请。而从2月7日官宣预告到邀请测试,中间隔了37天。毫无疑问,文心一言的推出为竞争已近白热化的自然语言处理赛道再添一缕硝烟,也意味着ChatGPT全球赛开场。近期,国内还有数款类ChatGPT模型将要发布,面对差距,国内产品应该如何追赶“国际顶流”?专家呼吁,国内用户多一些耐心与真诚参与,给尚不完美的模型提供高质量的数据反馈。

全球首款实现多模态输出的类ChatGPT产品

昨天下午两点,受人瞩目的邀请测试展示如期召开。李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

上海交通大学计算机系专攻大语言模型方向的博士生陈星宇全程观看了发布会。在他看来,整场演示内容流畅,亮点不少,达到了他的预期。而演示最出彩之处当属文心一言将一段文本生成了图片、音频和视频,这是全球发布的产品级大语言模型中首个实现多模态输出的模型――即使是前一天发布的GPT-4,也只展示了多模态输入功能。

多模态输出意味着什么?陈星宇表示,目前尚没有一篇正式出版的文章介绍多模态输出是如何实现的,这属于百度自己的“独门秘籍”。据他猜测,应该是百度整合了多个不同类别的大模型的结果。而要把这些模型无缝整合到一个对话系统中,并实现流畅输出,其中有很多工程技术难题需要解决,比如优化。“百度在这方面做得很好。”他说。

仅从演示看,陈星宇认为文心一言达到了类ChatGPT的水准。但遗憾的是,演示并非实时,这也让不少欲亲自参与测试的网友大呼“不过瘾”。

人类“循循善诱”,才能让机器输出更好答案

此次,文心一言没有开放大规模公众测试,而是采用发放邀请码的方式邀请小部分用户参与体验。对此,部分网友表示不理解。

但在业内人士看来,这其中有更深层次的考量。“现阶段的文心一言,更需要有明确任务的使用者,而非打发无聊时光的对话者。”陈星宇说。

试想一下,当你把语言模型当成生产力工具,让它帮助你完成一项工作时,如果它输出的内容不能满足你的要求,你可能会尝试改变提问角度或输入更多有价值的信息,让答案更符合你的预期。而当你只是想聊天时,或许就没那么认真了,你输入的内容也许漫不经心,也许有小错误,甚至你还会暗自期待它犯错。

事实上,最新发布的GPT-4演示也证明了人类的“循循善诱”是如何让机器输出更完美答案的:演示者通过让GPT-4代入某种角色,并交代了四个回答问题的步骤,教会他产出令人满意的回答。

复旦大学计算机学院教授、深耕人工智能和自然语言处理20余年的黄萱菁表示,高质量的语料库和优质的人类反馈,是造就ChatGPT优异表现的两大关键因素。对于其所在实验室正在训练的类ChatGPT模型MOSS,他们也将通过更高质量的中文数据进行性能优化。

多一点耐心,给中国类ChatGPT更多成长机会

当下,生成式人工智能的表现虽然令人惊艳,但远未达到完美无缺的程度。即便是大受褒奖的GPT-4,在其公布的报告中也坦言,他们仍然无法彻底解决大语言模型的幻觉问题。相比ChatGPT,GPT-4回答事实性问题的准确率已达到80%,ChatGPT只有60%。

想要通过大语言模型得到令人满意的答案,耐心必不可少。一位网友反映,他用了8个问题引导,才让ChatGPT给出了勉强令人满意的答案。

上海交通大学计算机系助理研究员陈露透露,在类ChatGPT赛道上,中国已拥有许多不亚于文心一言规模的大语言模型,如浪潮的“源”、华为的盘古、阿里巴巴的PLUG,腾讯、字节等互联网大厂也有未公开的模型。“这条赛道,中国并非没有机会,但需要给它们更多成长空间。”

自百度官宣文心一言以来,已有超过650家企业宣布接入文心一言生态。随着大批由任务驱动而产生的高质量数据的涌现,文心一言将在与用户的互动与反馈中快速学习和成长。

“ChatGPT的成功表明,人工智能已经找到一条对的路。既然路走对了,迭代速度将是很快的。”黄萱菁说。以应用为驱动的人工智能,将通过真实用户反馈、开发者调用和模型迭代之间的飞轮快速进化,或许今天尚显稚嫩的模型很快就能达到“士别三日,当刮目相看”的效果,但眼下我们需要的仍是耐心与宽容。(沈湫莎)