庆云古诗词

庆云古诗词

百度ai文心一言怎么使用 百度ai 文心一言内测

淘文章 0
百度文心ernie,百度ai文章

3月16日,百度CEO李彦宏在新闻发布会上宣布,百度正式推出大语言模型生成式AI产品“文心一言”。这是继去年发布的文心大模型之后,百度在自然语言处理领域的又一重大突破。据悉,“文心一言”是基于文心大模型技术开发的,能够根据用户的输入生成流畅、有逻辑、有创意的对话内容,被外界誉为“中国版ChatGPT”。

ChatGPT是美国OpenAI团队去年推出的一个开源项目,利用GPT-3模型实现了人机对话的功能。该项目引起了全球的关注和讨论,被认为是人工智能领域的一个里程碑。然而,由于GPT-3模型主要基于英文语料训练,对中文语言的支持并不完善。此外,由于该项目涉及到敏感信息和伦理问题,OpenAI团队也对其使用进行了严格的限制和审核。

百度“文心一言”的出现,填补了中文生成式对话产品的空白,并且在技术上也有自己的创新和优势。首先,“文心一言”采用了多层次、多粒度、多任务、多模态等技术手段,提高了模型的泛化能力和表达能力。其次,“文心一言”结合了知识图谱、情感分析、逻辑推理等技术手段,提高了模型的理解能力和响应能力。最后,“文心一言”还引入了人工智能伦理指导原则和安全防护机制,保证了模型输出内容的合法性和合规性。

在发布会现场,“文心一言”的表现令人惊叹。李彦宏邀请了几位嘉宾与“文心一言”进行交流,并展示了其在不同场景下的应用效果。“文心一言”不仅可以与用户聊天、咨询、娱乐等日常话题,还可以根据用户提供的关键词或主题生成诗歌、故事、歌词等创作内容。甚至,在李彦宏提出要求后,“文心一言”还现场续写了《三体》系列小说 。

据介绍,“文心一言”的应用场景非常广泛,可以服务于个人用户和企业客户。“文心一言”将于3月16日起向首批用户开放邀请测试码,在官网提供免费体验服务。同时,百度智能云也将面向企业客户开放“文心一言”的api接口调用服务。“我们希望通过‘文心一言’这样一个平台,让更多人享受到人工智能带来的便利和乐趣。”李彦宏表示。

我非常期待文心一言正式上线后给我们带来更多惊喜和便利。如果你也对这个产品感兴趣,可以填写下方问卷申请邀请测试。让我们一起见证中国AI的新时代吧!

【【网址】】/sur【【微信】】/wenxin.html?track=C109067&track=4016【【微信】】a17830b31f1db02567e779da

举报/反馈

百度更新词 百度的发布入口


过去几个月,【【微信】】 掀起的浪潮一刻也没有停歇,包括国内大量公司和科技从业者在兴奋于 【【微信】】 出现的同时,也在期待中国自己的 【【微信】】。在所有宣称将要推出类 【【微信】】 产品或大语言模型的公司中,百度是最早官宣的一批,也是第一个选择正式发布的公司。

3 月 16 日,就在 GPT-4 重磅升级的两天后,百度如期在北京总部正式发布了旗下大语言模型――文心一言。发布会现场,百度创始人兼李彦宏展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。

图 / 百度

不过根据李彦宏的说法,由于生成式需要输入较长的文本和时间,不适合在现场实机演示,故而选择用录屏形式展示文心一言的生成效果。坦白讲,作为一场商业产品发布会,可以理解,毕竟一旦出错将会极大影响外界的看法和股价,谷歌此前推出生成式 AI 聊天机器人 Bard 时就因为一个「答非所问」的错误:市值蒸发了上千亿美元。

但也要承认,录屏的发布形式始终也让这场产品发布会显得有些空洞――谁也不知道录屏背后会有多少次尝试和人工痕迹,所以才有人调侃百度发布了 ChatPPT。反馈到股市上,文心一言不仅没有抬升百度股价,甚至在发布后一度跌超 10%。

李彦宏在发布会上也提到,文心一言并不完美,但市场有需求就必须要推出来。然而并没有准备好的文心一言,是否选对发布时间和节奏,目前仍未可知。但尽管如此,还是能从这场发布会的内容中一窥文心一言的面貌,以及百度的野心与困境。

根据发布会上的视频展示,文心一言面向大众用户的交互界面基本与 【【微信】】 类似,都以对话机器人形式回应用户的文本输入。

但文心一言并没有像两天前发布的 GPT-4 一样支持对图片信息的总结和分析――读图、识图,甚至懂梗图,OpenAI 就将去年的一张梗图输入并附上文字要求 GPT-4 解释笑点,结果 GPT-4 准确地指出了「梗」是「将过时的巨大 VGA 接口插入现代的小巧智能手机的反差」。

图 /OpenAI

不同的是,文心一言支持了语音和视频的输出。「语音」支持只是通过 TTS 语音合成技术以四川话读出文本内容,并不值得一提,但「视频」生成的难度明显更高。仅从录屏展示来看,尽管模板痕迹明显,但生成视频(视频素材 + 字幕)至少还是可堪一用。

而具体文本理解和生成能力上,百度在第一个「文学创作」环节展示了文心一言的续写《三体》的创意能力,比如续写可以从哪些角度出发:

这些回答本身不存在对错,但如果我们对比下 【【微信】】 的回答,一定程度上能发现文心一言的文本输出更「泛泛而谈」,【【微信】】 的输出会更加具体:

图 /【【微信】】

此外,百度在「商业文案」环节展示了如何用文心一言起公司名,我们也以同样的问题询问了 【【微信】】:

一个值得注意的问题是,如果不强调中文名,【【微信】】 会自然倾向使用英文名。

就像我们在之前的文章中提到的,OpenAI 在训练 GPT-3.5 和 GPT-4 大语言模型时的语料库、基准测试和开发人员都是以英文为主,所以 【【微信】】 在英文的理解和生成能力胜过包括中文在内的其他语言。

这也是百度的优势所在。

尽管在整体能力上,很难期待百度一跃超过 【【微信】】 和 OpenAI,但百度文心一言相比 【【微信】】 在中文信息的可靠性上可能会有一定优势。除了上面提到的语言倾向问题,【【微信】】 不论是 GPT-3.5 还是 GPT-4 版本,训练用语料库都截止于 2021 年 9 月,在涉及很多未知信息时容易编造内容,比如在介绍电视剧《三体》演员阵容时再次「胡编乱造」:

相较之下,百度文心一言和微软 【【微信】】 都正确指出了具体的演员阵容,【【微信】】 还提醒了我们另一个 Netflix 版本的电视剧《三体》。

发布会上,李彦宏表示,百度和文心一言更懂中文和中国市场,甚至单独在五个环节中设置了「中文理解」的环节来展示。以百度官方演示的「洛阳纸贵」为例,【【微信】】 再次出现了「幻觉」,文心一言和 【【微信】】 基本指出了正确典故,但接下来只有文心一言正面回答了「当时洛阳的纸到底有多贵」:

当然,考虑百度选定的问题以及录屏的形式,还很难就此断定「文心一言在中文上比 【【微信】】(GPT-3.5)更强」,但可以肯定的是,「中文」的优势一定是百度乃至未来中国类 【【微信】】 产品发力的重中之重。

而同时百度也展示了自身在行业应用上的优势。李彦宏引用百度在人工智能上的四层架构――(AI)芯片层、(深度学习)框架层、模型层、应用层时谈到,百度的多层架构协同效应将推动 AI 实现更快的迭代速度,以及在应用上也会有更高的效率和成本。

文心一言主要分为两部分,一部分是面向普通用户,通过嵌入百度搜索,用户可以直接与文心一言大语言模型交互,预计类似微软的 Bing 搜索和 Chat 的形式;另一部分面向企业客户,提供上述提到的四层人工智能全栈能力,从底层的云计算能力到深度学习框架,再到大模型和应用。

事实上,百度相比 OpenAI 更早开启了 AI 大模型的商业化进程,在百度文心大模型的官网就展示了与不同领域大公司合作开发的行业大模型,此外还宣布已经有 650 家合作伙伴接入了文心一言,包括之前官宣的魅族、携程、兴业银行、美通社等。

但最终百度还是在用户侧证明文心一言的表现实力,否则从合作伙伴到客户到头来只会放弃百度。

我们高估了 【【微信】】 的意义吗?比尔 ・ 盖茨将其比作互联网的诞生,微软 CEO 纳德拉说它堪比工业革命,英伟达 CEO 黄仁勋称其为 AI 的「iPhone 时刻」。

我相信,但好像也无法笃定未来一定属于类似 【【微信】】 的产品,不过可以肯定的是,【【微信】】 将改变搜索引擎的产品形态和业务模式。在这一点上,去年广告收入(包括搜索广告收入)占比分别为 60% 和 77% 的百度、谷歌都一样,必须面对 【【微信】】 带来的冲击和变革。

另一方面,百度和谷歌在很早就率先拥抱了 AI 技术,并在长达十年的时间跨度上重金投入研发。百度在 2022 年将全年核心收入的 22.4%,即 214.16 亿元投入了核心研发,而据欧盟委员会发布的报告,谷歌在 2022 年更是投入了 279 亿欧元研发经费,居全球第一。

但在 【【微信】】 之前,庞大的研发积累始终没有找到合适的商业化出口,颇有些「英雄无用武之地」。

【【微信】】 带来的突破确实带来了出口,或者说风口。当用户、开发者和企业客户都在拥抱 【【微信】】,百度不可能放弃,就像李彦宏说的,文心一言没有准备好却还是要发,是因为有市场需求。

题图来自百度