宸ヤ綔杩涘害琛╝i鎵撳嵃 ai鎬庝箞鍋氳亴鍛樿〃
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
智东西(公众号:【【微信】】) 作者 | 李水青 编辑 | 心缘
ChatGPT API开放60多天,世界已经不是两个月前的样子了。
微软联合创始人比尔・盖茨称GPT是“40多年来最革命性的技术进步”,英伟达创始人黄仁勋高呼:“我们正处于AI的iPhone时刻”,阿里董事会主席兼CEO张勇也说:“所有行业都值得用大模型重做一遍。”从一个风靡全球的AI玩具到独具潜力的赚钱法宝,对话机器人ChatGPT仅仅用了不到半年。
3月2日,ChatGPT的API以1k tokens/$0.002的价格开放,而后百度文心一言、阿里通义千问大模型等同类产品陆续开放接口、面向企业提供服务,一场巨头的AI大模型竞赛一触即发。AI大模型离落产业落地究竟有多远?哪些行业和场景是第一落地点?哪些领域还是无人区?这些问题成为产业关注的重点。
近日,智东西全面梳理了市面可见的类ChatGPT应用,发现在办公软件、社交文娱、营销广告、家庭助理四大方向的15条赛道,AI大模型技术正出现落地的萌芽。其中不仅有国民级的Office工具、钉钉等协同办公平台接入大模型,还有来自办公、电商、家居、社交文娱互联网平台推出AIGC功能,甚至以智能汽车、AR眼镜为代表的实体终端也上了大模型,带来新奇体验。
?▲接入类ChatGPT技术的应用汇总
类ChatGPT技术的落地仍处于早期阶段,但AI大模型应用创业已经热起来了。从知名投资团队启明创投的一张统计图可以看到,根据其与100多家企业交流统计,生成式AI创业覆盖的86%是应用领域,具体涉及聊天机器人、智能助手、AI服务、生产力工具、下一代交互等多个方面,追溯下一层具体场景更是门类众多。
▲生成式AI创业领域分布图(图源:启明创投)
各行各业的企业如何在AI旋风和迷雾中抓住机遇?通过分析市面上已有的类ChatGPT应用,我们能得到深入参考。
3月16日,微软正式将GPT-4接入到Office工具,让Word、PPT、Excel、Outlook等人们常见的办公软件全都接入AI,打响了大模型解放“打工人”的第一枪。
▲AI版Office工具的使用界面
而后,我们陆续看到协同办公平台、办公软件工具、用户管理系统、代码编程及数据分析应用都掀起了接入类ChatGPT技术的潮流,以较低的月费带来办公智能化体验。
1、协同办公平台接入“外脑”,输入关键词自动生成文档、PPT
微软于3月16日推出了AI版Office“全家桶”:Microsoft 365 Copilot,一夜之间刷新打工人对生产力工具的认知。而后,包括阿里、百度、字节跳动、WPS、谷歌等在内的玩家公开了协同办公平台介入大模型的情况。
首先来看看AI版Office“全家桶”。Word中,AI能秒出草稿,并根据用户要求增删文字信息和配图;PowerPoint中,AI能快速将文字转换成专业水准的PPT;Excel中,AI将数据分析变得轻松高效,能快速提炼出关键趋势;Outlook中,AI能给邮件分类加精,并自动撰写回复内容;协同办公时,AI能总结规划成员的工作进展、调取分析数据、做SWOT分析、整理会议核心信息。
▲用Microsoft 365 Copilot辅助文档编辑
用户要做的,仅仅是单击鼠标或者简单描述你对AI的要求。等待几秒钟,Microsoft 365 Copilot就会按用户的要求执行完任务。
微软打响了AI大模型接入办公平台的第一枪,而后国内外的各大协同办公平台也行动了。
先是4月11日,钉钉接入阿里通义千问大模型,用户输入一个“/”就能调动10余种高能AI能力,包括自动生成群聊摘要、辅助内容创作、总结会议纪要、草图变小程序等,为2300万企业提供智能转型抓手;同日,字节跳动旗下办公软件飞书发布视频,预告了其专属智能助手“My AI”,而另一协同办公龙头企业微信则暂无动静。
▲在AI版的钉钉输入“/”可获取辅助创作服务
然后是4月17日,百度官微宣布文心一言大模型在百度内部全面应用在智能工作平台“如流”上,助员工在日常工作中的思路构建、协作沟通、方案策划、代码编写等方面提升效率;同日,金山办公正式推出具备大语言模型能力的生成式AI应用“WPS AI”,包括文本生成、多轮对话、润色改写等功能,计划嵌入金山办公全线产品。
美国科技巨头谷歌直到5月5日才透露动向,宣布将其Bard AI工具提供给拥有谷歌Wordspace账户的用户,现已开放Workspace账户的访问权限。
AI协同办公平台成为云大厂“大乱斗”的第一战场。不过这些应用大多仍面向特定用户开放测试,因此广大用户要真正体验,还要再等一段时间。到时候,我们才能知道这些功能和真正的效率革命有多远距离。
2、“小而美”的AI办公工具,10美元/月体验文本“美颜”
“AI+办公”不仅是大厂的游戏,也是众多中小办公软件公司的机会。我们看到包括文档协同软件公司Notion、知名写作辅助工具Grammarly、热门文档编辑工具ChatPDF、知名PDF服务商福昕软件都推出了大模型应用产品,从更具体的切入点帮人们提高效率。
早在2月底,Notion就推出了基于ChatGPT的企服工具Notion AI,每个用户每月只需支付10美元,就可以让AI辅助总结会议记录、修改优化内容、生成表格清单、起草电子邮件等。Notion官方公告称,内测发现用到AI生成稿件的用户相对较少,AI改善写作功能被调用地更多,就像是美图领域的一键美颜一样。
▲Notion AI对文本的“一键美颜”功能
知名写作辅助工具Grammarly上个月推出了一款名为GrammarlyGo的生成式AI工具。用户每月可以免费获得100次提示,每月支付30美元或年支付144美元,可以获得每日500次提示服务。
GrammarlyGo回复电子邮件的功能备受好评:它可以扫描一封电子邮件内容,对其进行总结并根据选定的语气起早回复,包括“有说服力的”、“友好的”、“外交的”等多种语气可供作者选择。但有用户反映它仍是一个需要改编的模板内容,结尾总是以“最诚挚的问候”结束,使得体验打折扣。
▲GrammarlyGo辅助编辑邮件回复
ChatPDF是另一个同期热门类GPT应用。如下图所示用户将200页以内的pdf文档拖入,ChatPDF马上就自己“读懂”了整个文章的内容。首先它能够生成一个摘要大致总结文档的要点,然后用户可以在对话框进一步追问更多问题,ChatPDF能根据文档内容进行回答。
▲ChatPDF使用界面
这一应用面向三类场景:一是面向学生提供帮助,包括回答教科书、讲义及演示文稿中的问题,节省学习时间;二是面向工作群体,包括对财报、项目业务方案书、法律合同等文档快速提取所需信息;三是面向有奇思妙想的人,包括从历史文献、诗歌和文学作品中发现新见解和答案,开阔视野。
国内PDF文件行业也有类似动向。比如4月13日,全球PDF知名解决方案提供商福昕软件宣布,公司基于ChatGPT的新功能已处于部署阶段。
还有一些细分赛道国内玩家走在了前面。比如在电子签约行业,4月23日,国内电子签约SaaS提供商上上签推出行业首款AIGC工具哈勃(Hubble)。哈勃基于知名大模型企业智谱AI自研的千亿参数大模型GLM-130B打造,能通过连续对话帮客户实现对电子签约合同的检索,执行概况解读、重点识别、筛选标识、分类归纳相关功能。
3、AI成程序员编程伴侣,动动嘴皮子就能编程
ChatGPT不仅触及通用办公市场的大蛋糕,更潜入互联网、金融都不少行业办公赛道。
比如在互联网领域,微软旗下Copilot X、亚马逊CodeWhisperer,国内的华为云CodeArts Snap、创企硅心科技的aiXcoder XL等,都利用AI大模型算法辅助程序员编程,让他们动动嘴皮子就能写代码。
ChatGPT诞生之初就有很多程序员用它直接写代码,而后陆续出现了接入类ChatGPT技术的代码辅助工具,大大解放程序员。
先是3月初,中国开发者将微软的跨平台源代码编辑器【【微信】】(VS Code)与ChatGPT结合,从而获得AI指导编程服务,包括代码解释、找Bug等功能,插件上线仅几天就有数万次下载。
而后3月23日,微软旗下代码托管平台GitHub推出新版Copilot X辅助变成工具,接入GPT-4,新增聊天和语音功能,允许开发人员用自然语言询问如何完成特定的编码功能。
▲Copilot X辅助编程界面
4月,其他云大厂也陆续跟进。比如4月14日消息,AWS推出AIGC全家桶,实时AI编程伴侣Amazon CodeWhisperer正式免费向开发者开放,能根据开发人员的语言指令和集成开发环境(IDE)中的先前代码实时生成代码建议,提高开发人员的工作效率。经测试,使用者平均比不使用者完成任务的速度快57%,成功完成任务的可能性高27%。
▲Amazon CodeWhisperer支持的工具
而在国内,4月17日,华为云旗下的智能编程助手CodeArts Snap也在深圳一场“华为代码大模型的方案与应用”的主题活动中露面,据悉它能够智能理解代码逻辑,生成高质量的代码片段,并提供实时的错误提示与修复建议。
在这一赛道,国内创企也成果初现。比如aiXcoder(硅心科技)就比Github推出Copilot更早,并于2022年6月推出了国内首个代码生成预训练模型产品aiXcoder XL,支持由完整功能自然语言输入到完整编程语言的输出,3月底宣布将促进模型从百亿级扩展到千亿级。
尽管互联网赛道是离ChatGPT是最近的,但垂直办公赛道接入ChatGPT的机会还有很多,包括金融、政府、法律等各个垂直办公领域都有可能出现更多新应用,本文不再一一赘述。
2月6日,ChatGPT版搜索引擎突然上线,微软Bing(必应)给了统治搜索引擎多年的谷歌当头一棒,这是这波ChatGPT接入潮开启的起点。
▲谷歌推出AI版搜索引擎Bing
而后,ChatGPT逐渐落地社交、文娱、影视等各个领域,在更多细分赛道和平台与广大用户“打得火热”。
1、大模型嵌入搜索引擎,划时代产品来了
搜索引擎是一个相对较传统的行业,随着全球第二大搜索引擎微软Bing在3月接入ChatGPT,这一行业迎来划时代时刻。当下,包括谷歌、百度等搜索引擎龙头,以及360、知乎等垂直搜索领域玩家都透露出了最新进展。
在AI版Bing中,用户可以输入最长1000个字符的问题或想查询的东西,它就会以聊天的方式,直接将答案或建议回复给用户。比如输入“最有影响力的墨西哥作家和他们的作品”,用户可以看到由AI直接整理好的作家及作品列表的摘要,鼠标移动到相应位置,可以点开AI摘录信息的源头链接。
▲AI版Bing使用界面
这使得第一大搜索引擎谷歌面临25年来的最大威胁。2月7日凌晨,谷歌演示其基于自研大语言模型LaMDA的对话机器人Bard,而后传出召回已退出谷歌日常业务的两位谷歌联合创始人商讨对策。4月17日,外媒传谷歌AI版搜索引擎Magi将在不久后面世。
在国内,百度搜索、360搜索引擎等都在加速与AI做结合。比如360集团就推出了自己的大语言模型360GPT及360智脑服务,4月21日,创始人周鸿t发内部信提到,360在国内搜索份额接近40%……要全方位调动资源投身进去。而在垂直搜索领域,比如知乎平台在4月13日也联合大模型企业面壁智能推出了“知海图AI”中文大模型,已运用知乎“热榜摘要”,有望进一步应用到搜索框。
AI版搜索引擎将成为互联网巨头的必争之地,虽然国内搜索引擎巨头都还没有正式动作,但每一家都明白AI大模型已经改变原有的搜索引擎游戏规则。
2、ChatGPT接入社交媒体,3.99美元定制“知心姐姐”
再看看社交媒体,很多人在ChatGPT刚发布时就去跟它闲聊,但这个聊天对象就像是“毛坯房”,缺乏个性化。为此,定制化聊天机器人My AI、专业性咨询机械佛Hotoke AI、嵌入AR眼镜的对话服务等不同应用形态产生了。
较早是在2月27日,美国社交软件Snapchat推出了一款基于ChatGPT的聊天机器人,名为“My AI”,供每月3.99美元的Snapchat Plus付费用户使用。
对于用户来说,My AI并不像一个内置搜索引擎,而是一个躺在通讯录里的朋友,只需要打开聊天对话空就能跟其对话,但Snapchat对My AI的回答范围做了限制,使其不会对辱骂、暴力、*、政治等话题进行回应。
▲Snapchat的My AI应用的使用界面
无独有偶,还有人拿ChatGPT做起了佛陀心理咨询。3月初,日本开发者推出了一款基于ChatGPT的机械佛Hotoke AI,上线5天就帮网友们解决了13万多个问题。
▲有人拿ChatGPT做起了佛陀心理咨询
比如当被问及如何应对全球裁员潮、避免内耗时,AI佛陀首先表达了对提问者处境的理解和安慰,进而从佛教和心理学角度分别提出了应对方法,如冥想和正念、重做职业规划、和经历相似者交流、和家人保持联系等办法,最后还不忘鼓励提问者挑战是暂时的,要积极应对。
可以看到,ChatGPT进入社交文娱领域更多以聊天对话为主,凭借简单的接入方式,这在国内的微信、钉钉、飞书等平台从3月就成了扎堆场景。比如创企弥知科技在GPT-4发布5天之后火速推出其语音交互的趣味对话AIKiviGPT。用户可以召唤企微版私人AI助理,据称能够让它帮用户回邮件、画画、写代码、做规划。
▲弥知科技推出的个性化对话机器人
随着ChatGPT在国内受限,这些应用也面临挑战。不过,类似《ChatGPT接入到微信保姆级教程》的付费课程依然火得一塌糊涂,卖课人成了首批靠ChatGPT赚到钱的人群之一。
此外,ChatGPT还在潜入线下社交,比如近期斯坦福大学研究人员开发了一款rizzGPT应用,基于OpenAI的自动语音识别工具Whisper收听对话,GPT-4聊天机器人实时生成自然响应,最终通过一款开源AR眼镜让用户在现实环境中了解对方的信息。
▲基于GPT-4的AR眼镜Demo应用体验
3、多模态AI,为游戏娱乐、影视创作带来效率革命
影视和游戏是两块大蛋糕,无疑是生成式AI落地的绝佳场景。从游戏社区的聊天助手,到游戏素材的AIGC,再到文本生成视频,多模态AI有望带来游戏影视领域的效率革命。
3月中旬,知名游戏聊天社区Discord推出了基于ChatGPT的聊天机器人Clyde,它允许被用户召唤到对话中,可以实时多轮回答用户的问题,还可以向频道发送Gif动图,推荐音乐及更多其他内容。
▲游戏聊天社区Discord中的对话机器人应用场景
此外,Discord还将基于OpenAI的技术推出另外两项功能,包括内容过滤器系统AutoMod AI,以及助用户捕捉错过对话的内容服务Con【【微信】】。据称用户数据都不会被OpenAI用来训练任何模型或改进模型。不过具体的应用情况,还“让子弹飞一会”。
在国内,已经有一些动向。比如《原神》的创作方米哈游正准备加入国内知名大模型创企MiniMax进行新一轮融资;腾讯的AI Lab已经将AIGC技术应用于王者荣耀等旗舰游戏;众多游戏公司都在招聘网站挂出寻找AIGC工程师及美术设计师的公告。
在影视领域,4月13日,图像及视频生产力工具大厂Adobe发布公告,宣布旗下的视频创作应用Premiere Pro将发布系列新AI功能。这是Adobe上个月发布AIGC创作功能“萤火虫(Firefly)”后的最新动作,支持用户像编辑文字一样处理视频,预计5月上线,届时有望引起影视创作领域的革命。
▲Adobe推出的AIGC创作功能“萤火虫(Firefly)”
国内企业也已有布局,创立于2020年的计算美学是清华大学孵化的科技企业,目前已推出了全球首款可商用视觉设计数据集,旗下核心产品包括AIGC生产力工具“画宇宙”、智能设计引擎“图宇宙”,下一步计划推出AI设计创意平台Yeahpix。AI大模型正在影响人类艺术。正如计算美学(Nolibox)联合创始人黄晟昱所说:“智能设计之于设计行业,正如自动驾驶之于交通行业。”
游戏和影视都是设计文本、音频、视频的多模态领域,对大模型技术成熟度和工程化开发能力有更高的要求,因此技术落地也相对需要放在更长时间线上去看待。
20年前,互联网技术改变了人们买东西的方式;现在,ChatGPT正将消费变革再向前推了一步。智能客服、商品推荐、广告策划、直播卖货、客户管理等各个环节都将被极大改变。
1、真智能客服来了,无需再呼唤“人工”
很多人以前都遇到过“鸡同鸭讲”的傻瓜机器客服,ChatGPT将改变这一情况。让智能客服真正理解客户的需求,基于客户诉求创作营销内容,根据数据分析营销效果,真正的智能客服能做的事远不止向客户介绍产品。
今年3月,全球领先电商SaaS服务商Shopify已集成了ChatGPT。Shopify主要面向企业及个人客户提供电商网站建立、维护管理等服务。
采用ChatGPT,Shopify一方面升级智能客服功能,帮商家与客户沟通更顺畅;另一方面,商家可以通过ChatGPT获取平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程等多项服务,提升运营效率。
▲Shopify将GPT集成到软件
智能客服作为ChatGPT最直接能落地的领域,一定会很快入驻各大电商平台,让一批不具备更多技能的客服被替换掉。
2、定制化商品推荐,告别传统“傻瓜”推荐算法
ChatGPT还有一些营销场景应用是围绕垂直领域展开,革新推荐算法的逻辑,让产品卖点更精准地触达目标客户。
比如,海外生鲜电商平台Intacart的食物搜索工具,其基于ChatGPT推出了面向食物推荐的应用,与自身来自75000多零售合作商店的产品数据结合了起来,帮助客户找到购物的灵感。
再比如,美国一款名为Expedia的软件内置了一个聊天机器人,它可以通过AI大模型算法为用户规划旅游。有人经历过用ChatGPT规划旅游被推荐一个不存在的海滩,能够在iOS上轻便运行的Expedia据称不会出现这个问题。Expedia会根据旅游地推荐经济实惠的酒店,建议可以打卡的景点,是大模型落地垂直旅游行业的一个代表应用案例。
▲Expedia内的聊天机器人可提供酒店推荐和预订住宿链接
当下国内众多电商的推荐算法都还是基于传统技术,因此也会出现“买过的东西依然推荐”的傻瓜做法,AI大模型有望彻底改变这些业态。
3、智能虚拟数字人直播,自动生成、24小时不间断
越来越多的数字人直播闯入电商,接下来他们可能渐渐智商变得更高,让人分不清是人是机器。
4月21日消息,位于美国旧金山的Synthesis AI宣布,他们开发了一种可以通过文本提示创建逼真虚拟数字人的新方法,使用生成式AI和视觉效果管道来制作高分辨率、电影质量的虚拟数字人,并可用于游戏、虚拟现实、电影和模拟等各种应用。
实际上,在国内,智能数字人已成为众多上市公司和创企扎堆进入的领域。比如国内AI股上市天娱数科的虚拟数字人已经接入ChatGPT等模型;虚拟技术提供商世优科技目前已将ChatGPT技术接入数字人产品当中;智能内容生成平台来画也在3月底正式接入ChatGPT,短短几十秒就能生成一篇高质量视频文案,并推出数字IP+直播模式。
▲将ChatGPT技术接入数字人产品
4、CRM龙头接入ChatGPT,AI辅助客户管理
再看看更深层次的客户关系管理环节,GPT技术依然是无孔不入,进化为智能咨询角色。
3月7日,客户关系管理领域SaaS巨头Salesforce推出基于ChatGPT的CRM生成式AI产品:“Einstein GPT”,据称可用于帮助企业销售人员、客户服务专员和市场营销人员高效率完成本职工作。比如其可以帮销售人员撰写电子邮件,结合过往案例生成知识文章,为客服人员生成客户提问的特定答案,帮开发人员编写代码等。
同时,Salesforce旗下的办公协作软件Slack也推出了基于ChatGPT的应用,Slack将其应用积累的数据与ChatGPT相结合,为客户提供他们所需的信息,包括提供即时对话摘要、研究工具和写作辅助等,帮助数百万公司更高效地工作。
如下图所示,Slack的ChatGPT应用提供一个对话界面,可以帮用户获取即时对话框中的信息,并基于研究工具去解析内容的主题,并帮用户快速撰写消息。
▲Slack中的ChatGPT应用界面
Salesforce这样的营销SaaS龙头都已经行动了,行业第二三梯队的玩家跟进是可想而知的。
5、AI洗劫广告策划圈,已经有人失业了
在生成式AI最擅长的内容环节――广告策划,已经有人感受到了失业的威胁。
4月13日,疑似国内公关大厂蓝色光标的内部邮件截图显示:为了给全面拥抱AIGC打下基础,蓝标管理层决定“无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包的支出”。4月20日,这一截图被多位蓝标员工核实,蓝色光标也正式发布“All in AI”战略,加大投入打造【【微信】】矩阵,微软、百度、阿里巴巴都是其合作伙伴。
▲蓝色光标的内部邮件显示因AIGC停用文案外包
其他产业链玩家也闻风而动。就在不久前的4月10日,知名营销SaaS企业上线数据集成平台有赞iPaaS和由大模型驱动的首个AI产品“加我智能”。加我智能目前主要支持图文推广和活动策划两大场景,能自动生成推广图文,并理解活动目的,生成跨产品和功能的营销活动。
国外也是一致趋势,4月20日,外媒称谷歌计划在未来几个月内将生成式AI引入其广告业务。目前,谷歌已经在其广告业务中使用AI来创建简单的提示,鼓励用户购买产品。
可以看到,无论是互联网广告商、广告公关代理龙头还是SaaS服务商,他们都在加快接入AI大模型的步伐。如果能将广告人从众多重复机械化工作中解放出来,大卫・奥格威理想中的广告创意或许会离我们更近一步。
6、ChatGPT接入实体机器人,线上线下整合营销
ChatGPT大多数时候主要作用于线上,但在线下消费场景也显示出潜力。
2月底,国内服务机器人企业穿山甲机器人推出了首款接入ChatGPT的迎宾机器人“Tiamo小鱼”,据称支持超100种场景应用方案、百万级知识库和超140种语言选择,同时穿山甲机器人还将其他系列机器人也支持接入ChatGPT。如下图所示,当机器人被问及“你跟其他的服务机器人有什么区别”时,该机器人回复自己“采用的是深度学习和自然语言处理技术”。
▲穿山甲服务机器人接入了ChatGPT
国内AI服务器机器人领军企业猎户星空也已经行动了,计划在近期推出接入大模型的服务机器人产品。猎户星空董事长傅盛也在3月15日第一时间分享了GPT-4体验视频,他说:“GPT-4发布世界要变了!每个人都要关心。”
这个“变”指的是什么?一是交互的革命。2007年乔布斯发布iPhone时就是一个交互革命,触摸键盘由此替代了物理键盘,软件定义了不同键位的形态和用法;现在随着GPT-4的到来,触摸键盘将可能进一步被语音交互替代;二是社会生产力变革,生产效率会大大提升。其中前者对机器人领域影响更大,而后者对内容产业影响力较大。
不过,实体机器人是从软硬件开发到工程化落地、运营链条更长的载体,如何让产品真正解决场景刚需,是这个赛道玩家面临的重要问题。实体服务机器人企业能否找到刚需场景,一整套机器人技术链能否支撑其实现产品化十分关键。
最后来看看家庭场景,类ChatGPT技术正在彻底改变智能家居的面貌。
智能音箱在很长时间里被认为会是智能家居的中枢,但常常被吐槽不够智能,革命首先从这里开始。
1、让Siri具备“大脑”,智能音箱换新潮来了?
在ChatGPT一发布时,我们就看到了有开发者试验将Siri接入ChatGPT,而后一些企
chatgpt时代怎样就业 chatgpt全网最详细的安装教程
chatgpt国内能用吗,chatgpt怎么用,chatgpt怎么读,chatgpt使用ChatGPT 的核心是一个LLM(大型语言模型),默认使用 GPT 3.5 模型,也可以使用最新的 GPT-4 模型,但目前还没有太多关于 GPT-4 的技术细节可供讨论。LLM是一种基于神经网络模型类型,通过对海量文本数据进行训练以理解和生成人类语言,并利用训练数据来学习语言中单词之间的统计模式和关系,并预测后续单词逐个输出结果。
本文大约1800字,读完约4分钟。
说明。此文是美国一名系统设计师发布的视频文字转录。原文是英文,我通过OpenAI的Whisper模型将音频文字转成英文,然后利用 GPT-3.5-Turbo翻译成中文。这是我见到的对大语言模型通俗解释最好的文章之一,所以特别分享给朋友们。
我们来看一下ChatGPT是如何工作的。我们从制作这个视频中学到了很多东西,希望你们也能学到一些。让我们开始吧。ChatGPT于2022年11月30日发布,仅用两个月就达到了1亿活跃用户。而Instagram则花费了两年半的时间才达成同样的里程碑。这是历史上增长最快的应用程序。那么ChatGPT是如何工作的呢?ChatGPT 的核心是一个LLM(大型语言模型),默认使用 GPT 3.5 模型,也可以使用最新的 GPT-4 模型,但目前还没有太多关于 GPT-4 的技术细节可供讨论。
LLM是一种基于神经网络模型类型,通过对海量文本数据进行训练以理解和生成人类语言,并利用训练数据来学习语言中单词之间的统计模式和关系,并预测后续单词逐个输出结果。
LLM往往根据其大小和包含参数数量进行表征,在神经网络中有96层、1750亿参数规模为最大规格。
该模型输入和输出由标记组织, 标记是单词或更准确地说部分单词数值表示形式, 使用数字代替单词因为它们可以更有效地处理。
GPT 3.5 是在大量的互联网数据上进行训练的,源数据包含5000亿个标记。换句话说,该模型是在数千亿单词上进行训练以预测给定输入标记序列的下一个标记。它能够生成结构良好、语法正确且与其所训练的互联网数据在语义上相似的文本。但如果没有适当引导,则该模型也可能生成不真实、有毒或反映有害情感的输出。
即使存在这种严重缺陷,该模型本身已经非常有用,但只能以一种非常结构化的方式使用,并可以通过精心设计的文本指令或 PROMs 来教授执行自然语言任务。这就是新领域 PROM 工程学问产生之处。
为了使模型更安全并具备类似于聊天机器人式问题和答案功能,还需要进一步微调模型成为 Chat GPT 版本。微调是将不完全符合人类价值观念的模型转变为 Chat GPT 可以使用的精调版本过程, 称作来自人类反馈强化学习(LLHF)。
OpenAI 解释了他们如何对该模型运行 LLHF 的方法,但对于非 ML 专业人士来说并不容易理解。让我们试着用一个类比来理解它。想象一下 GPT 3.5 是一位高技能的厨师,可以准备各种各样的菜肴。使用 LLHF 对 GPT 3.5 进行微调就像是提升这位厨师的技能,使得他做出来的菜更加美味。
最初,该模型通过大量食谱和烹饪技巧进行培训。然而,有时候这位厨师不知道如何满足特定客户要求。为了解决这个问题,我们从真实人员那里收集反馈以创建新数据集。
第一步是创建比较数据集。我们要求厨师根据客人的要求准备多道菜,并让人们根据口味和外观对这些菜进行排名。这有助于厨师了解哪些菜受到客户的青睐。接下来是奖励建模。厨师利用这个反馈创建一个奖励模型,类似于理解客户偏好的指南。奖励越高,菜品就越好。然后,我们使用PPO或近端策略优化来训练模型。在这个类比中,厨师按照奖励模型制作菜肴并练习技巧。他们使用称为近端策略优化的技术来提高自己的技能水平。这就像厨师将当前的菜肴与稍微不同版本进行比较,并根据奖励模型学习哪一个更好一样。该过程会重复多次,每次都会根据更新后的客户反馈改进自己的技能水平。随着每次迭代,厨师变得更擅长准备符合客户偏好的美食。
换句话说,在通过收集用户反馈、创建基于其偏好的奖励模型以及使用PPO迭代地改进模型性能的过程中,GPT 3.5被RLHF微调。这使得GPT 3.5能够生成更好的、针对特定用户请求量身定制的响应。
现在我们了解了该模型是如何训练和微调的,让我们来看看该模型在ChatGPT中如何用于回答提示。从概念上讲,它就像将提示输入到ChatGPT模型中并返回输出一样简单。但实际上,情况要复杂一些。首先,ChatGPT知道聊天会话的上下文。这是通过每次输入新提示时由ChatGPT UI向模型提供整个过去对话来完成的。这称为会话提示注入。这就是为什么ChatGPT似乎具有上下文感知能力。
其次,ChatGPT包括主要提示工程技术。这些指令片段在用户提示之前和之后注入以引导模型进行对话语气方面的处理,并且对用户不可见。
第三,在传递给审核API之前警告或阻止某些类型不安全内容可能也需要经过审核API生成结果才能返回给用户。
以上就是我们探索 ChatGpt 这个迷人世界所做出贡献背后涉及到大量工程设计与技术创新, 不断开启新的可能性并重塑我们之间交流方式。现在请系好安全带,享受这段旅程吧!■
责任编辑:王毅博