庆云古诗词

庆云古诗词

ChatGPT的“追风者”

互联资讯 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

追风者官方,追风者phanteks百科,追风者(phanteks) tc12ls,追风者phanteks

文|Alter

文心一言发布十余天后,争论仍未有止歇的迹象。

有人给出了"拉垮"的评价,相比于多轮迭代的ChatGPT,文心一言在逻辑推理、多轮对话等方面的表现不尽如人意;也有人认为给文心一言值得肯定,原因是填补了中文互联网的空白,以及百度直面竞争的勇气。

可能最终会像李彦宏在发布会上所说的:当前文心一言的内测体验并不能叫作"完美",发布是因为有市场需求,"文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。"

这里并非想对比文心一言与ChatGPT的差距,而是想要讨论这样一个话题:那些以"中国版ChatGPT"自居的玩家们,到底是"追风者"还是"追赶者",不同的"初心"显然对应着不同的结果。

01 中国版ChatGPT的虚与实

国内企业对ChatGPT的态度,大致可以分为三个阶段:

第一个阶段是2023年农历春节前。

OpenAI在2022年11月30日推出了聊天机器人ChatGPT,5天时间注册用户量就超过了100万。期间不乏国内媒体的报道,微博等社交网络上逐渐流行起各种说法:ChatGPT可能将颠覆谷歌,掀起一场搜索引擎的大革命;大学生开始用ChatGPT写论文,部分高校宣布将禁用ChatGPT……

彼时"中国版ChatGPT"的话题已经在技术论坛里小范围讨论,国内大厂的工程师们大概率有参与其中。可由于ChatGPT频频被曝出回答错误、存在假消息,且商业化落地的前景不明朗,国内大多数企业都选择了缄默。

第二个阶段是ChatGPT爆红后。

时间来到2023年1月末,ChatGPT的注册用户破亿,成为史上扩散速度最快的应用,这场AI风暴终于吹到了太平洋对岸。国内社交媒体上充斥着ChatGPT的对话截图,并且出现了"ChatGPT概念股"的说法。

中国的科技大厂们"猛然醒悟",纷纷开始就中国版ChatGPT表明态度:百度在2月7日官宣将在3月上线文心一言;腾讯在2月9日回应称"在相关方向上已有布局,专项研究也在有序推进";阿里传出了类ChatGPT应用的对话截图;京东、网易有道、科大讯飞、小米也先后发声将推出相关产品。

第三个阶段是文心一言上线后。

可能因为发布会上的录屏展示,百度的股价在文心一言发布当天即下跌10%,一度成为互联网上的众嘲对象,即使李彦宏和百度CTO王海峰均在发布会上提前打了"预防针",直言模型目前"训练不够充分"。

有趣的是其他科技大厂的态度。目前申请测试百度文心的用户已经百万,超过10家企业用户申请调用文心一言的企业版API。如果说ChatGPT的走红只是唤醒了国内网民的好奇心,摆出了一副吃瓜群众的姿态,现在已然被彻底点燃了热情。但百度文心上线近10天后,并未有第二家企业官宣。

个中原因恐怕离不开"功利"二字。

在ChatGPT的方向被论证前,国内的大部分投资人和技术领袖并不敢冒险跟进,不考虑短期收益的只有少数派中的少数派;ChatGPT爆红后,特别是"ChatGPT概念股"出现后,中国版ChatGPT已经成为一种政治正确,大厂们的表态也就无可厚非;文心一言上线后则是另一个极端,在"肉眼可见"的技术差距面前,暂时收敛锋芒是否也是一种避开被舆论讨伐的选项?

"中国版ChatGPT"或喧嚣或冷静的背后,似乎还有另外一种解释:在用户心理阈值最高的时候,跟风放出消息不失为一种聪明的商业策略,而落实到产品上,终归还要结合现实需求。就像科大讯飞董事长刘庆峰的观点:AI要兑现红利,标准之一就是有看得见摸得着的应用场景。

02 空间换时间的认知陷阱

至于ChatGPT类产品的商业空间,微软无疑是最佳的参考对象。

作为OpenAI的大股东,微软被中国网友们戏称为"坐在副驾驶上狂飙",尤其是在ChatGPT的商业应用上,微软可谓动作频频:1月17日的公开活动上,微软CEO纳德拉表示,计划将ChatGPT整合进其所有产品;半个多月后,微软正式推出新版必应,将ChatGPT与搜索引擎融合;GPT-4发布两天后,微软发布了新功能Copilot,将用于Word、PowerPoint、Excel、Outlook等产品中,可自动生成PPT、自动写文章……

为何国内企业并没有兵临城下的危机感?最常见的说法是"空间换时间",中文互联网的特殊性,为国内企业留下了充足的反应时间。譬如晚于ChatGPT三个半月诞生的文心一言,照旧抓住了大把的机会。诸如此类的说辞在某种程度上有其道理,却也存在一些不可小觑的认知陷阱。

比如中文语料库的问题。

在不少人的理解中,中文语料库是ChatGPT难以逾越的壁垒,李彦宏称"文心一言是更适合中国市场的人工智能模型",理由正是中文特殊的分词和语法结构。中文语料库的建设需要大量的人力、物力和财力投入,同时还需要考虑语料的质量、版权等问题,几乎是一个天然避风港。

可国内互联网巨头的"数据隔离"也是不争的事实,尽管在工信部的施压下,大厂们被迫"拆墙",但不同平台的数据仍然很难产生交流和总结,无形中增加了模型训练的难度。就连文心一言的图像生成都经被传出先将中文指令翻译成英文,再根据英文描述生成图像,中文语料的现状可见一斑。

再比如技术上的硬性门槛。

国内并不缺少媲美GPT-3的大模型,这也是很多企业自信可以开发出ChatGPT类应用的直接原因,然而算力资源、工程能力、模型迭代策略、调优机制等能力的缺失也是不争的事实。还是文心一言的例子,虽然有ChatGPT这个参考答案,迭代、调优的路还是要重新走一遍才行。

一个浅显的道理,OpenAI在推出ChatGPT前,已经在大模型上默默耕耘了4年时间,期间不知道有多少次的试错。毕竟一个现象级产品诞生,往往是资源、基础技术、人才、产业需求等一系列因素的集大成,国内到底有多少家企业能够越过技术上的硬性门槛,目前还是一个未知数。

按照华西证券的测算,百度的文心一言想要达到ChatGPT目前的能力,需要补足的训练、推理和数据标注成本分别为2.29亿元、13.62亿元、0.05亿元,需要保持年均16亿元的投入。

倘若再算上维持正常运转的人力成本、训练模型的算力成本、存储数据的数据中心耗费,百度想要追平OpenAI需要付出相当庞大的投入,遑论其他缺少前期布局的企业。

就在百度们还在追赶GPT-3.5时,OpneAI已经有条不紊的推出了功能更为强大的GPT-4,并在3月24日宣布部分解除了ChatGPT无法联网的限制,正在推出ChatGPT插件,可以访问训练数据外的信息,增加一些特定功能,开始了从工具向平台的进化。

03 "追风者"无缘"星辰大海"

最糟糕的并不是做一个"追赶者",而是"反应迟钝"的追风者。

早在2020年的时候,OpenAI就借着GPT-3一鸣惊人,随即在全球范围内拉开了一场大模型军备竞赛,国内的华为、智源、浪潮、阿里云、百度、腾讯等企业先后发布了自家的预训练大模型品,并不断从NLP延伸出了双语、CV、跨模态等大模型。

而后的一段日子里,来自中国的大模型榜各类榜单,学术论文如流水线般生产。一些研究人员以发论文为己任,鲜有人思考学术以外的价值;企业对大模型满怀信心,并试图推动产业落地中来变现。最终也仅仅止步于此,没有一家企业能创造性地越过大模型到ChatGPT的天堑。

有人在知乎上问道:阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些,技术、钱还是领导力?OneFlow创始人袁进辉的回答道出了问题的本质:"需要有远见且为理想而持之以恒的人。"

不可否认的是,"谈理想"在国内的商业环境中多少有些感性且不切实际,甚至连相应的故事都是"舶来品":图灵奖得主Hinton潜心研究神经网络50多年;斯坦福的李飞飞教授花费6年时间创建了ImageNet数据集;OpenAI最初被定义为非营利性人工智能组织,要向全世界公开分享他们的研究成果……

国内盛行的是另一种商业故事:张小龙在2010年带领一个不到10人的团队,用了不足70天的时间开发出了微信的第一个版本;出行大战中胜出的滴滴,曾用四个月的时间拉来了一万多名网约车司机;2013年才立项测试外卖项目的美团,到了2014年就将外卖送到了全国200个城市……

问题在于,追逐风口、快速创新的打法到了人工智能时代是否依然奏效?不妨借用英伟达CEO黄仁勋的一个比喻:"每家公司都应该知道,未来的软件开发有点像炼丹,这是一个MLOps的过程。"其中的MLOps可以翻译为"人工智能研发运营体系",涵盖开发、部署、交付验证三个必不可少的过程。

在中国版ChatGPT的研发中,国内的企业已然走了"捷径":比如ChatGPT最大的特点就是引入了人类反馈的强化学习(RLHF),即用人工标注的方式,不断地将结果去反馈给模型,让模型不断自我迭代。百度等企业后来也采用了RLHF模式,并辅以"对话增强、有监督精调"等机制,底层架构和技术路径都与OpenAI相似。

最危险的地方恰恰也在于此。

不少人将ChatGPT比作是移动互联网时代的iPhone,意味着ChatGPT只是个开始,将有更多超出固有认知的新事物出现,可能是聊天机器人,可能是"画图高手",也可能是当前还想不到的应用。同时也预示着层出不穷的新风口,凡是风口,皆有虚实,一味跟着别人走路,总有踏空的时候。

李彦宏曾在2021年初的内部信中写道:"我们熬得过万丈孤独,藏得下星辰大海。"冥冥中成了中国企业面对ChatGPT时的命运写照:熬不过万丈孤独,何谈星辰大海?

04 写在最后

中国版ChatGPT的故事还在继续,不排除有越来越多的相似产品上线,甚至出现"百花齐放"的局面。

需要警惕的是那些自诩为"国产之光"的追风者,聊天机器人的风口来临时,迅速整顿人马开发类似应用;AI生图的热度起来后,快速组建团队抓住新的契机;而当新的风向标出现时,会再次调转方向...... 不愿意在底层技术上"苦修",注定要在风口里兜兜转转。

因为"追赶者"仍抱有理想、信念和希望,"追风者"注定只会在风中盘旋,被风势裹挟。


chatgpt 最可能被替代的职业 人工智能chatgpt走红全球科技圈

chatgpt是什么意思,chatgpt怎么下载,chatgpt怎么用,chatgpt怎么读

今天给各位分享ChatGPT现象级走红的知识,其中也会对现象级rapper进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

  • 1、2022年gpt
  • 2、近两年,前往寺庙的年轻人出现了哪些新趋势?文旅行业又该如何应对?
  • 3、原来是在想这个出自哪里
  • 4、chat币值得投资吗
  • 5、百度文心一言是什么?你对文心一言有什么期待?

2022年gpt在科技圈最火爆。根据查询相关公开信息显示,人工智能聊天机器人ChatGPT自2022年末爆火以来,在各领域获得了广泛运用,具备了搜索引擎的全知全能和人工智能的灵活精巧,ChatGPT也受到了广大学生群体的青睐。

寺庙旅游开始在年轻群体中悄然盛行。

据携程数据显示,今年2月以来,预订寺庙景区门票的人群中,90后、00后占比接近50%。年轻人正在成为点燃寺庙旺盛香火的主力。

当下,解压的方式不仅有露营、飞盘、围炉煮茶,年轻人开始寻求在寺庙、周边景区中获得释放。解压之外,寺庙的文创产品、智能AI等新奇元素也在吸引年轻人驻足。

然而,年轻人与寺庙们协力卷起的这一拨小趋势,又给文旅行业带来哪些启示?

多个寺庙工作人员眼中的年轻人

当前文旅行业的趋势,除了海滨度假、主题乐园等,还有一波年轻人将放松身心的方式寄托在了寺庙。原本在手机上敲木鱼被他们演变成行动与体验。

《酒管财经》向江西庐山风景区诺那塔院相关人士了解到,目前到塔院体验的群体以90后、00后居多,每个月塔院都会有3期的活动,今年2月份的活动已经报满了。

广州市大佛寺相关人员告诉《酒管财经》从人群来看不乏一些年轻人前来共修。

《酒管财经》发现,年轻人除了到寺庙、景区短暂性地停歇、游玩以外,还会选择到寺庙及景区禅院的禅修营,寻求短暂的休息,再重新下山面对生活。

这一小趋势也表现在OTA平台上。

携程数据显示,今年以来,寺庙相关景区门票订单量同比增长310%。从搜索热度来看,近期关注度较高的寺庙景区分别是灵隐寺、普陀山风景区、寒山寺、白马寺大雁塔、少林寺等。

从时间上来看,周末是年轻人们去寺庙的热门时段。

携程平台上,除节假日外,近三个月周末的寺庙相关景区门票日均订单较平日订单均量呈现翻倍增长。最近的一个周末(2月18日-19日),增幅更是达到150%。

作为对比,以主题乐园为例,相关景区门票上周末日均订单量较平日订单均量的增幅为75%。

除了可以旅游、放松,一些寺庙在新的社会语境下也衍生出更多年轻人喜好的事物。

比如少林寺旗下的各实业公司,就经营素饼、体育用品、文化用品和旅游纪念品等杭州永福寺开了一家名叫慈杯的咖啡店在各社交媒体频频出圈。有意思的是,这家咖啡店的美式叫涤烦,拿铁叫停雪,以及叫随缘的咖啡盲盒。

而在杭州香积寺,游客不仅可以买到素斋手串等,隔壁的历史文化街区还是年轻人吃饭休闲、喝咖啡的好去处。

年轻人的热忱,还有科技的加持。

前不久Chatgpt大热,北京龙泉寺就启用了互动机器人贤二机器僧,寺庙还为其开通了专属微博,很多年轻人通过微博与其互动。因此,龙泉寺还被外界称为IT强寺另外小度也曾在少林寺亮相学功夫同样吸粉无数。

据《酒管财经》独家了解,最近,携程也推出了相关寺庙旅游的文旅产品,比如寺庙主题团队游产品(如普陀山跟团游、五台山私家团等)参禅顿悟一条龙佛系文旅创意周边(如檀香香水、木鱼、数字藏品电子木鱼等)

那么近两年年轻人为何纷纷涌向寺庙?

中国旅游研究院武汉分院副院长、中南财经政法大学旅游管理系教授舒伯阳向《酒管财经》分析称,首先,当下部分年轻人开始从追求外在的热闹,转向追求内在的宁静。

另外一个原因是,这种现象出现以后,其他的年轻人对此产生向往,认为此举是一个新潮的标签。

舒伯阳称如果从消费主义角度来讲年轻人去寺庙就像是一种符号即我跟别人不一样总的来说这是整个社会年轻群体关注精神价值的一种表现。

对此,诺那塔院相关人士则认为,更多的年轻人是想放松一下、体验一下不同的生活,或者在山上住几天看看日出日落。费用方面,除了需要支付庐山风景区的门票以外,在塔院食宿不需要费用。

在《酒管财经》看来随着短视频的兴起一些寺庙的禅意内容创作者层出不穷并不断输出古色古香的寺庙飞檐、抒情且空灵的配乐,以及富有人生哲理的文案等,一句别爱太满,别睡太晚就能带动点赞收藏关注三连击。

信息流的推送与疫情后生活不易想要短暂逃离的情绪化表现,也都催生了刚刚踏入社会的年轻人想找地方静一静。

年轻人的寺庙情结背后是文旅的必修课

虽然部分年轻人到寺庙焚香、短暂禅修仅仅是一个小趋势,但从以往各OTA平台的数据来看,95后、00后群体正逐渐成为文旅的主力军,透过他们的行为、喜好,在文旅产品的打造、产品的设计上也能窥见一二。

舒伯阳同样认为,文旅行业要及时把握这种社会、群体动向,行业人可以打造针对性而不是仅仅贴标签的产品。

此外他认为旅游产品一种是感官层面另外一种是追求精神层面。行业需要逐渐升华旅游产品的精神性,从而引导游客去追求更多内在的体验。

其实,这也是当前文旅不断向内容创造,精神挖掘的一种趋向。

像是只有河南・戏剧幻城,以厚重深远的中原文化为题材,以艺术为手法,独特的东方建筑为载体,向世界讲述河南故事。

从产品类型上看只有河南属主题公园类产品在这里唯一的吸引物是戏剧。

只有河南戏剧幻城的诞生是中国主题公园发展的一个标志性事件它让人们认识到主题公园不再仅仅是娱乐IP+游乐设备+游艺的简单组合更重要的它第一次将戏剧作为被消费主体而不是陪衬。

从内容上演艺不再是简单的谋求游客开心一乐,而是通过戏剧特有的张力带给观众精神上的深层享受。

不同于迪斯尼、环球影城这种西方主题乐园,它完全呈现中国文化和价值理念。它通过宏大的叙事,多媒体、多艺术形态融合所带来的强大感官冲击,很好展示了中华历史文化发展的脉胳和场景,让消费者找到荣耀感和家国情怀。

文旅产品的打造也可借用王潮歌的观点精神产品不是用文化资源堆出来的,而是要创作者带着一个已经想要表达的命题,去审视这些文化资源,把它们当作素材,去表达自己对世界的思考。

再如苏州策划打造的姑苏八点半,是将苏州的夜景、商业、文化、美食等内容通过多个街区的集中展现,通过时尚的方式打造了一种新的观察城市,以及新维度的城市体验,越过喧闹,让游客体验过城市文化后,逐步静下来。

总结来说,年轻人要去寺庙最后追求的是精神层面的回血与笃定。文旅在内容上的精进与发力,其实也是通过内容的策划把景区、主题公园、城市等链接起来让游客在精神内核上满足并释放。

Chatgpt源于人工智能领域的研究,在深度学习和自然语言处理的基础上,使用了大规模的语料库进行训练。其核心技术是GPT(Generati【【微信】】ormer),是一种基于Transformer网络的语言模型。Chatgpt可以通过语言生成和理解实现自然的智能对话,其能够模拟人类的思维方式,与用户进行真正意义上的交流,并且不断学习和完善自己的对话技能。Chatgpt的应用领域众多,包括客服机器人、智能语音助手、智能家居、社交娱乐等,未来将会有更多的智能对话应用出现,并且整个行业将会不断推进和升级。

史上最强AI聊天机器人ChatGPT自推出以来,迅速席卷整个科技行业。

微软匆忙斥资100亿美元与背后的OpenAI套近乎,并宣布将其整合到to B和To C的几乎所有产品线中,如Office family barrels、Bing search和Azure cloud services,只要能上传遍。

在微软的老对手谷歌上,不断有高管出来说,如果我们不采取行动,ChatGPT会学得越来越好,别说谷歌搜索了,整个谷歌都没了。

就连看起来和ChatGPT关系不大的NVIDIA也赢了一波。 【/h/】因为ChatGPT的爆红,投资者对AI计算的前景趋之若鹜。2023年,黄仁勋的财富增加了51亿美元,单月位居福布斯财富榜榜首。

当然普通用户是最开心的。聊天假装专家回答问题也没什么。有人用它来“辅助”写论文,并给它起了个名字。 还有人用它做作业,吓死老师。

这里先不说用AI工具做这些事的道德争议。它的一个直接结果就是:

ChatGPT卡顿。 新申请API的用户进入“等待名单”,高峰时段用户需要频繁排队,有时会被卡,停止响应。

怎么解决?面对摇钱树,OpenAI选择了最实在的方式:收费,每月20美元起。

今天,OpenAI正式公布了ChatGPT的“试点订阅计划”,这是一项名为ChatGPT Plus的付费服务。

百度文心一言是每日更新的一句古诗词,旨在激发读者的思考,增强文人文魂。我期待文心一言能够带给我更多美好的文学体验,更深刻的文化意境,以及更多有趣的历史故事。

进入3月中旬,全球科技巨头再次竞相亮相大语言模型赛道。

一周之内,开发出ChatGPT的美国初创公司OpenAI,对OpenAI投入巨资的科技巨头微软,以及中国互联网龙头企业百度,相继发布了在大语言模型(LLM)领域的最新动态。这也再次引发了全球对该领域的关注。

当地时间3月14日,OpenAI公布了其大型语言模型的最新版本――GPT-4,它比GPT-3.5的问答质量和技术都有明显提升。

3月16日下午,百度开启新一代大语言模型、生成式AI产品文心一言测试,从而成为第一家加入该赛道竞争的中国企业。

在发布会现场,百度创始人、董事长兼首席执行官李彦宏通过问答的形式,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。几个小时后,微软宣布,将把GPT-4接入Office全家桶,新名为“Microsoft 365 Copilot”。

正如财经E法在2月17日发布的文章(OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?)所述,中国内地和中国香港的手机号均无法注册ChatGPT账号。此外,虽然OpenAI的应用程序编程接口(API)已向161个国家和地区开放,但不包括中国内地和中国香港。

一方面,业界普遍关注,在AIGC(生成式人工智能)势不可挡的科技浪潮中,谁将成为下一个弄潮儿?另一方面,在中美科技竞合的敏感期,各方亦颇为关注百度迈出的第一步带来的涟漪,以及中国企业该如何应对。

01“真的ready了吗?”

3月16日,李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问,“最近一段时间,很多朋友问我,为什么是今天,你们真的ready了吗”?

李彦宏的回答是,虽然百度已投入AI研究十多年,为发布文心一言做了充分准备,但“不能说完全ready了”,因为文心一言对标ChatGPT、甚至是GPT-4,门槛很高,还“有很多不完美的地方”。但他强调“一旦有了真实的人类反馈,文心一言的进步速度会非常快”。

李彦宏解释,之所以选择当天发布,是因为市场有需求:客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。

如何理解李彦宏所言的“对标GPT-4的门槛很高”?

当地时间3月14日,OpenAI公布了其大型语言模型的最新版本――GPT-4。值得注意的是,GPT-4是大型的多模态模型,即能够接受图像和文本类型的输入。而GPT-3.5只能接受文本输入。

在演示视频中,OpenAI总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图,并将图片输入GPT-4。仅1到2秒后,GPT-4就生成了网页代码,制作出了与草图高度相似的网站。根据OpenAI发布的实验数据, GPT-4模型相较前一代GPT-3.5已取得了巨大的进步,在许多专业测试中表现出超过绝大多数人类的水平。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,文心一言未来还有待全面开放来获得用户检验。无论是通过B端API还是直接向C端用户开放,用户体验口碑都是硬道理。当前ChatGPT没对中国用户开放,在国内市场,百度将获得先发优势。

对OpenAI和百度的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示,GPT系列大模型,包括GPT-4与文心一言本质上都是同一类产品,只是它们各自的数据覆盖范畴和数据模型的积累长短不一。从短期看,OpenAI的产品准备时间相对更加充足,智能程度暂时领先一些。但是对文心一言而言,能在这么短的时间内训练出这样的一个产品,也是非常了不起的。

同时,张毅也对百度做出更好产品更有信心,他的理由是,从人工智能、大数据、大模型的人才储备来看,中国会更有优势。

中央财经大学数字经济融合创新发展中心主任陈端则认为,与海外竞争对手相比,百度最大的优势是立足本土,构建了语言和文化层面理解的护城河。

作为中国公司研发的大语言模型产品,文心一言的中文理解能力备受关注。重要原因是,此前很多评论人士认为,ChatGPT的中文问答能力不如英文问答能力强。

李彦宏表示,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”创作了一首藏头诗。

李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。

受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文v日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文v解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。

此外,上海交通大学约翰・霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。

李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。

受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文v日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文v解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。

此外,上海交通大学约翰・霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。

发布会前后,百度的股价经历了大落大起。3月16日,港股百度盘中股价跌幅一度扩大超10%,报120.1港元。截至收盘,百度股价跌幅为6.36%,报125.1港元。但百度股价在美股势头强劲,当日百度美股开盘低开高走,振幅超7%。截至收盘,报138.16美元,涨幅为3.8%。3月17日,百度港股表现强势,盘中一度大涨超15%。截至当日收盘,百度港股涨幅为13.67%,报142.2港元。

文心一言宣布开启邀请测试一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

文心一言的市场热度持续飙升,资本市场也给予了价值重估。张毅认为,这也代表了公众对大语言模型/生成式AI “既期待,又担忧,然后是希望”的心情。

02谁都不能错过的科技革命

事实上,“真的ready了吗?”并不仅针对百度,也是伴随此轮“ChatGPT”热潮以来,公众普遍的疑问。

李彦宏观察到,从2021年开始,人工智能技术开始从“判别式”向“生成式”转变。

创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示,AI 2.0时代的第一个现象级应用,就是以GPT-4为代表的AIGC,又称生成式AI(Generative AI)。李开复表示,AI2.0 是绝对不能错过的一次革命,它将会是一个巨大的平台性机会,这个机会将比移动互联网大十倍。他还表示,AI 2.0也是中国在AI领域的第一次平台角逐机会。

受访专家普遍认为,此前全世界的AI企业都遇到了一个极大的问题:即使技术储备十分丰富,AI应用并没有给它们带来丰厚的收益。造成这一问题的原因在于,AI产品的应用主要集中在B端(企业用户)和G端(政府用户),AI产品在进入企业或机构时往往流程复杂,这在某种程度上会限制AI产品在市场上的快速扩张。

因此,张毅认为,AIGC的产品应用方向在C端更有可能产生巨大的商业机会。他分析说,在美国市场,此前C端市场被谷歌、亚马逊、Meta等企业抢占,让微软压力非常大,更需要一款产品来扳回一局。在中国市场,百度的优势和谷歌一样,都有强大的搜索引擎对数据的抓取能力,以及储存、整理、分析能力的基础。中国本身拥有十几亿人口的巨大市场,百度完全可以做得很优秀。

“百度和微软、谷歌本质上是两个不同市场的竞争,所以我相信文心一言以及系列产品也一定会跑出来。”张毅说。

李彦宏坚称,文心一言不是“中美科技对抗的工具”。但他也承认,ChatGPT 的成功,加快了百度推出该产品的进度。

百度CTO王海峰表示,人类进入AI时代,IT技术的技术栈可以分为四层:芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司,在各个层面都有领先业界的自研技术。例如,高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。王海峰认为,百度全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。

文心一言与ChatGPT一样,都使用了SFT(模型微调)、RLHF(从人类反馈中进行强化学习)以及Prompt(提示)作为底层技术。此外,文心一言还采用了知识增强、检索增强和对话增强技术。王海峰表示,这三项是百度已有技术优势的再创新。

陈端认为,在当前技术创新的集成性越来越高的当下,全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。

信心很重要,但差距无法忽视。

在本月初的两会期间,中国科技部部长王志刚在回应ChatGPT相关的问题时,用足球打比方,指出中国还有很多工作要做。“踢足球都是盘带、射门,但是要做到梅西(足坛巨星利昂内尔・梅西)那么好也不容易。”

王志刚指出,中国在这方面也作了很多布局,在该领域的研究也进行了很多年,并且有一些

成果,“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。

王志刚说,ChatGPT出来以后,引起了大家的关注。实际从技术本身源头来讲,它叫做NLP、NLU,也就是自然语言处理和自然语言理解。ChatGPT之所以引起关注,在于它作为一个大模型,有效结合了大数据、大算力、强算法,计算方法有进步。同样一种原理,做得有区别。比如大家都能做出发动机,但质量是有不同的。

然而,无论是ChatGPT还是文心一言,其背后的大语言模型是核心竞争力。北京大学王选计算机研究所研究员赵东岩告诉财经E法,国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。

一位科技系统人士则对财经E法指出,客观而言,中美目前在该领域的基础研究成果差距较大。这些基础研究成果包含自然语言处理(NLP)、数据库、GPU产品,“美国切断GPU芯片(的供应),(中国的)算力就跟不上”。

大型算力的核心在于高性能GPU芯片。北京航空航天大学软件学院助理教授周号益告诉财经E法,在GPU芯片等计算硬件上,中国与国际的差距在十年左右,硬件水平会严重制约大语言模型以及科学计算类模型的发展。

周号益认为,在技术和模型上,中国的科技公司与OpenAI并没有代差,差距仅在五年以内,在一些较小的技术领域差距只有2-3年。在数据采集方面,以GPT-3大模型为例,其训练的语料中中文只占5%,中国科技企业对中文语料的积累具有一定优势,因此极有可能在中文领域实现突破。

03巨头下一步:构建生态

对于以ChatGPT为代表的大语言模型赛道如何实现盈利,是各方公认的难题(ChatGPT爆火的冷思考:盈利难题与治理挑战)。

开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。而2023年1月,投资银行摩根士丹利(Morgan Stanley)的一份分析报告称,ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。

但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为,ChatGPT能带来多少盈利,并不是OpenAI关注的重点,重点是基于它的模型能长出什么样的服务和应用,从而构建起一个生态系统。“ChatGPT的发展需要一个产业生态,比如它和微软相关应用的融合就是很好的思路。”曹建峰说。

当地时间3月15日,微软副总裁兼消费者首席营销官余瑟夫・梅迪发文表示,新版必应搜索引擎已经在 GPT-4 上运行。另据OpenAI披露,GPT-4是在微软Azure AI 超级计算机上进行训练的,并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。

谷歌则宣布开放其大语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite。通过PaLM API 接口,开发者们可以将PaLM用于各种应用程序的开发。MakerSuite则可以让开发者快速对自己的想法进行原型设计,并且随着时间的推移,该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。

微软迅速跟进。当地时间3月16日,微软宣布将把GPT-4接入Office全家桶。新功能名为“Microsoft 365 Copilot”。

李彦宏则在发布会上表示,文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。

根据文心一言的邀请测试方案,3月16日起,首批用户可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。该服务于3月16日起开放预约。

截至3月18日早11点,排队申请百度智能云文心一言企业版API调用服务器测试的企业用户增加到9万家,百度收到关于文心一言合作的咨询 6588条。

陈端认为,这一轮的竞争,不仅是商业主体的竞争,实际上也是关乎下一轮国家数字竞争力的竞争。所以,百度的当务之急不完全是技术层面的研发,也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。

在陈端看来,中国在构建生态系统上具有优势。陈端指出,中国的移动互联网经过多年发展,应用层生态化的配套创新已经非常成熟。应用层的很多中小微创业团队,在过去配合移动互联生态做了大量的局部、垂类场景端的创新,把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。

04中小企业还有机会吗?

面对大语言模型的浪潮,中国企业该如何抓住机遇,避免风险?

在中国,布局ChatGPT的企业有两种类型:第一种是传统的互联网大公司,第二种是一些初创企业。

陈端认为,目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说,