chat gpt 为什么这么强大 ChatGPT 数据如何更新到2023年
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
OpenAI为何成为全球用户数增长最快的产品?我们认为主要系对话型应用使用几乎没有学习成本和门槛、 ChatGPT与全行业的联系和结合都相对流畅。作为人类史上用户数增长最快的应用,我们认为ChatGPT与抖音、 Meta等主流产品一样都代表着下一个时代的来临,而其增速或许象征着以ChatGPT为代表的AIGC将以超出想 象的速度打破固有的商业模式和渗透进全行业。
我们与市场观点差异:除生产力外我们怎么看ChatGPT?—全新的云计算和交互革命
我们差异性的观点在于我们认为ChatGPT在提升生产力以外,有望凭借其极低的使用门槛(对话)将 与全新的硬件和交互方式升级实现共振,因此我们认为在助手工具、软件行业和硬件升级的消费级产品 和中间件中蕴藏更多机会。
为什么是OpenAI?:真实数据和模型迭代的飞轮造就了全新一代的对话机器人ChatGPT
ChatGPT是AI行业上首次大规模自传播:ChatGPT仅仅推出两个月后其月活用户就突破1亿,成为史上 用户增长速度最快的消费级应用程序,这与ChatGPT自身超预期的能力和OpenAI前期通过真实数据对 模型的迭代都有紧密关系,而我们认为在大规模传播的背景下通过持续的真实数据输入将持续转动 OpenAI模型、用户、数据的飞轮。
如何理解ChatGPT?OpenAI GPT系列模型的持续迭代,人类反馈机制成为模型核心区别
我们认为ChatGPT或是基于人类反馈强化学习的代表模型:OpenAI推出的GPT系列模型每一代的模型都略有区别, 例如GPT-1的学习方式是半监督学习,而参数量增长的GPT-2采用的则是无监督学习,GPT-3在2的基础上提升参 数至1750亿,而后的InstructGPT和ChatGPT在大模型的基础上使用一小部分人工数据构建奖励模型,使得大模 型更理解信息的含义,并能够进行自我判断。最终从结果看,ChatGPT相比早期的无监督学习和海量训练参数为 特征的模型,在加入人类反馈机制后判断用户提问意图和提升自身答案质量的能力得到显著增强。
我们如何看待ChatGPT?同样的统计学与运筹学,不一样的最终模型效果
我们认为ChatGPT是生成式AI在发展过程中积累量变过程中的一次重要“突现”:尽管ChatGPT在模型、训练方式和数 据集方面与前代模型并未有太大差距,但随大模型自身会随机出现“突现”能力且指数级增长,因此我们认为ChatGPT 通过“突现”获得了远超上一代的意图理解、多轮对话能力和准确率。 我们认为ChatGPT或代表NLP领域研究的范式转变:尽管大模型的训练成本相对较高、调用严苛且部分领域效果没有显 著区别,但ChatGPT在大模型领域展示出的NLP领域与在过去十余年中追求的通用人工智能(AGI)极为接近,我们认 为这或将推动全球头部的科技互联网公司从微调小模型到使用大模型进行上下文学习的范式转变,伴随这种范式转变我 们有望能够看到更多行业在大模型的影响下其商业模式发生重大变化。
ChatGPT:摸索前进中诞生的生产力工具,更像是第一次工业革命中的蒸汽机
我们认为ChatGPT的诞生更像第一次工业革命时期内蒸汽机的发明:从底层模型看ChatGPT这些算法本身并不复杂, 但目前数学上我们并没有很好的解释AI模型为什么能收敛,因此AI这件事情并不是被数学和物理规律决定的,而是AI 研究人员不断按照经验和推论来推进其发展。因此我们认为ChatGPT更像是第一次工业革命前夕,人类已经通过摸 索掌握了生产力提升的工具-初代未经改良的蒸汽机,但依旧没有整理出热力学定律、微积分、牛顿定律。
为生成式AI立法1:虽无法预测AI能力进化的方向,但根据AI发展的经验总结三大定律
第一定律: 在ChatGPT转化成本为0的背景下,ChatGPT渗透率增长速度呈现巴斯模型,我们基于ChatGPT上 线5天用户超一百万,上线一个月活跃账户超过1200万,总注册用户超过1亿。
第二定律合集: 1)创新者窘境定律:当一个企业面临破坏性技术变革(如生成式AI)时,良好的管理方法将加速成功 企业的失败。 2)Scaling Law:当AI大模型足够大、语料足够多、算力足够充足的时候,其性能不光会线性提升, 还会突然的指数级爆发,以往在逻辑、正确性等方面的棘手问题将更有希望解决。 3)ChatGPT之父Sam Altman:全新的摩尔定律是宇宙中的智能数量每18个月翻一番。
第三定律: 类似于万有引力,我们认为生成式AI将最终实现对其他全行业的渗透。
生产力测算:AIGC或持续提高知识工作者的生产力,2030年或有望创造20万亿美元生产力
AIGC或持续提高知识工作者的生产力,2030年或有望创造20万亿美元生产力:从提高知识工作者的 生产力视角来看,根据ARK的研究到2030年人工智能应该使知识工作者的生产力提高4倍以上。在 100%采用人工智能的情况下,全球总支出约为41万亿美元,其创造的额外生产力约为20万亿美元。
微软:加速投资OpenAI和ChatGPT与产品融合,新版Bing发布打响搜索引擎范式革命第一枪
OpenAI将促进Office套件和Azure的升级。微软正尝试将OpenAI的语言人工智能技术ChatGPT应用于Office套件,并将ChatGPT添加到其 基于云的Azure服务中。此举将发挥chatGPT的特点,包括根据自然语言生成文本及代码、为Outlook用户提供回复电子邮件的建议等,促进 Office套件和Azure的升级。我们认为微软将有望持续推AI深度融入全产品矩阵,加快各业务条线全方位搭载ChatGPT 的进度。 微软联手OpenAI或将引发搜索引擎革命。2月7日微软发布搭载了ChatGPT与Prometheus模型的新版搜索引擎Bing和Edge浏览器,标志着 微软多年来首次有机会动摇搜索领域龙头谷歌的产业地位。我们预计结合ChatGPT的New Bing在时效性与回答问题的种类范围等方面较 ChatGPT均有提升,甚至或将出现类思考能力的雏形。我们认为ChatGPT的搭载有望助力Bing在全球搜索引擎市场的份额提升。 微软加速投资OpenAI有望实现互利共赢。 OpenAI在前期通过微软提供的海量数据集资源和大量算力及基础设施进行训练,我们预计融合 进微软的OpenAI将借助微软提供的用户数据,获得更多的训练机会从而提升效能,提效后的ChatGPT或将拥有更大市场实现规模效益,在 扩大收入的同时降低边际成本。而对于微软来说OpenAI或将在成本可控的背景下赋能现有的产品组合。
谷歌:注资Anthropic&推出Bard对抗ChatGPT,创新者窘境下谷歌投资与自研双路径齐发
谷歌搜索引擎2021年占据全球搜索市场92.01%份额,22Q2仍有50%以上营收依靠搜索广告业务。ChatGPT的底层Transformer模型为谷 歌的研究成果,谷歌也第一时间针对ChatGPT对其搜索业务的威胁做出应急响应。 谷歌云注资3亿美元于 AI 初创公司Anthropic。该投资各方面均与微软最初对OpenAI的投资相似。Anthropic对标 ChatGPT 推出的 AI 助 手 Claude 已于1月底开始内测,并将于未来接入谷歌搜索引擎。 紧急推出基于LaMDA模型的AI对话机器人学徒巴德 (Apprentice Bard)。早在2021年谷歌对话型AI模型LaMDA就已问世,但出于规避 声誉风险考虑未大规模对外应用,在ChatGPT威胁的背景下谷歌于2月7日正式发布Bard。
百度:AI+云打造人工智能深度服务,推出文心大模型服务多行业
百度云业务:文心一言或将通过类似微软的方式以百度云作为配套设施对外提供AI相关的服务,通过人工智能产品 逐步落地到生产的实际场景中,百度有望打造AI+云提升云业务竞争力。 文心大模型:受益于百度知识图谱文心大模型成为了全球首个知识增强千亿大模型。文心大模型已历经多次迭代, 在更早之前也已经从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能。百度为推 进大模型深入产业落地,与行业头部企业联合研发融合行业数据、知识以及专家经验的行业大模型,目前百度文心 大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。
字节跳动:旗下AI Lab持续研究大模型,字节跳动招兵买马投入大模型研发
字节跳动旗下AI Lab布局AI“大模型”两大方向:AI Lab专注于人工智能领域的前沿技术研究,涵盖了计算机视觉、 语音 & 音频处理、 NLP、CV、【【微信】】、音乐、机器学习等多技术研究领域,同时致力于将研究成果落地,为公司现 有的产品和业务提供核心技术支持和服务。两大方向中语言大模型由字节搜索部门牵头,探索方向为搜索、广告等下游 业务的结合,预期于今年年中推出大模型;图像大模型:由产品研发与工程架构部下属的智能创作团队牵头。 原达摩院大模型 M6 带头人杨红霞加入字节,或将提升字节语言创新大模型的竞争力:杨红霞曾担任阿里达摩院超大 规模多模态预训练模型M6的技术负责人,带领M6大模型从百亿级进化到万亿级的参数量,并主导认知智能技术的发展 和场景落地,杨红霞加入字节或将促进字节在语言大模型领域的创新和落地和提高竞争力。
腾讯:混元系列AI大模型布局多领域,为类ChatGPT产品构建坚实基础
腾讯的数据、人才和硬件储备是布局AIGC领域的三大优势:数据方面,腾讯现有产品(微信、腾讯广告等)或带 来多样化、真实度高的数据和应用场景;此外硬件方面腾讯拥有高性能网络平台、成熟的太极机器学习平台,为模 型训练提供坚实基础。 混元AI大模型现已登顶多领域,未来有望为多个应用场景赋能:2022年4月混元AI大模型先后五大跨模态视频的 检索数据集榜单(在 MSR-VTT、MSVD、LSMDC、【【微信】】 和 Acti【【微信】】)中位列第一,2022年5月其于 CLUE 总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶。目前混元AI大模型已落地于腾讯广告、腾讯搜索 等多个核心业务场景,如依托语言理解能力理解广告内容,大幅提升广告投放于用户的匹配准确率。
阿里巴巴:持续深耕大模型和多模态,领先的全栈云服务技术支撑大模型研究
阿里巴巴持续深耕大模型研究:阿里巴巴早在 2020 年 6 月研发出 3 亿参数的大模型 M6,此外 阿里达摩院一直以来深耕多模态预训练,其模型在通用性和易用性方面都有一定优势,并打造出 国内第一个“统一底座”通义大模型,落地应用上可服务超过200个场景。 领先的全栈云服务支撑大模型研究:阿里作为一家具备支撑超万亿参数大模型研发的云 + AI全栈 技术实力的公司,已经通过算力基础设施上的领先和超大模型研发的经验为客户减少研发成本。
搜索引擎:ChatGPT或将挑战搜索引擎行业范式,带动GPU市场百亿美元级别资本开支增量
ChatGPT横空出世或将挑战数十载以来的搜索引擎行业范式:微软正式推出了新一代 AI 驱动搜索引擎 New Bing, 把基于 ChatGPT 技术的生成模型和 Bing 集成在一起,而New Bing必应中用的是全新版本的GPT,能够比 ChatGPT提供更多答案、注释这些答案并提供最新结果,同时提供更安全的用户体验。我们认为短期来看ChatGPT 或将与搜索引擎结合,且有望凭借ChatGPT对话能力影响现阶段处于搜索引擎行业龙头地位的Google并快速占据 一定市场份额,我们也持续期待AI技术发展和新模型的应用引发搜索引擎的竞争格局和商业模式的升级。
电商:客服行业或将率先大规模应用ChatGPT,市场规模乐观情况下有望达407亿美元
电商客服行业或率先应用ChatGPT:多轮对话能力即通过多轮、上下文具有关联性的对话,解决用户所提出的具体 的问题。我们认为在电商客服行业,客服需要根据与客户的多轮对话识别用户的根本问题,并回复用户解决方案, 而用户所提出的根本问题多为事实性问题,ChatGPT有望率先实现大规模应用。 多轮对话能力或将大幅缩减客服工作量:传统客服具有响应速率慢、人工成本高的痛点,我们认为ChatGPT的实时 性、低甚至趋于零的边际成本能够有效解决该痛点。人工或专注于处理部分AI无法解决的对话,在降低人工成本的 同时保证电商客服服务质量。
虚拟人:AIGC或为虚拟人提供高质量的内核,虚拟人应用有望进一步从娱乐拓展至服务行业
AIGC将打造“深度合成+计算驱动”型虚拟人:虚 拟人综合运用文本、图像、音频等AIGC技术,打造 综合外观、面部表情等高度且全面拟人化的数字内容。 未来虚拟人或将从文案、音频、图像等低密度呈现形 式转化为视频、实时交互等高密度呈现模式。 短期看虚拟人视频生成是发展重点,长期看虚拟人实 时互动将扮演重要角色:相比虚拟人视频生成,虚拟 人实时互动更强调虚拟人思维及策略的自然程度。受 文本生成局限性影响目前虚拟人实时互动大多用于特 定行业的智能客服,而长期看虚拟人通过实时交互成 为社交节点,我们认为其将有望为更多平台型企业如 电商、社交、短视频行业提供良好的企业形象窗口。
GPT4:下一代大模型发布或向微观及宏观经济学的经典假设发起挑战
GPT4.0未来可能会是多模态的具有思维链推能力的大模型,可能会导致宏观和微观经济学领域重要假设被挑战: 宏观经济学-重塑经济学界对生产要素的认知。梭罗模型作为宏观经济学领域的经典模型之一,其假设产出受全要素 生产率,资本和劳动力影响。AIGC时代下,我们对关注资本和劳动力的具体任务的需求提升,梭罗模型中对于资本 和劳动力增长的诸多假设或需重构,全要素生产率有望重新加速上升。 微观经济学-产品定价相关理论或迎来变革。我们认为软件行业、互联网行业、开源、生成式AI均为对传统微观经 济学的挑战。软件意味着非个性化产品的边际生产成本接近于0(但产品定制化和营销成本高),互联网意味着产品 的边际分发与营销费用接近于0(直到流量红利结束和获客成本上升),开源意味着产品本身的价格为0(但部署和 开发有成本),生成式AI意味着产品的个性/定制化生产边际成本接近于0。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
2023年4月7日的新闻
QQ阅读6日起正式调整订阅互通规则,QQ阅读、起点读书、红袖添香订阅的章节内容将不再互通。此前已经订阅的章节(2016年11月29日10:00 至2023年4月6日00:00)不受影响。由于数据量较大,此次调整将从4月6日起分批生效。