AIGC的普及速度将超出我们的想象
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
ChatGPT问世至今四个多月了,生成式AI对整个社会的影响之大、之广、之快恐怕连OpenAI也始料未及。作为一个科技博主,这段时间我一直在试用ChatGPT\GPT4,深刻体会到用户是如何被改变,这种改变又将如何影响互联网及更多产业,甚至影响整个社会,有几个观点想分享给大家。
这种感觉像是在做采访,而这个采访对象跨领域无所不知。我相当于有了一个写作助手,无论什么话题,它都能帮我梳理资料整理大纲。
不可否认,ChatGPT会经常出错,尤其数据经常有误,有时还胡说八道,比如我叫它帮我查一下从广州到北京某个时间段的航班,它一本正经地给了我一堆结果,但一半的结果是错的。不过想想如果招了个刚出道不久的助手,也不可能要求他不出错,而且毕竟还有一个学习过程,我觉得还是可以接受的。
现在有什么事,我第一时间会想到问ChatGPT。而搜索对于我来说已退居二线,当我想查询资料或者对ChatGPT的回答有疑问时才用,而当搜索目标更明确后,搜索的结果也变得更准确。搜索引擎不会因此消失,但随着用户习惯的改变,将来也许会沦为聊天机器人的附庸。
2023年2月8日,微软正式将ChatGPT引入Bing。根据分析公司Similarweb的数据,截至3月20日,Bing的页面访问量增长了15.8%,而谷歌的访问量下降了近1%。3月初,微软的一位高管在推特上分享,Bing每日活跃用户已突破1亿,大约三分之一的Bing Chat测试人员是新用户。
很遗憾在国内无法体验新Bing,但我看了不少油管博主的体验试频,在新Bing首页的搜索入口旁边增加了一个chat频道,点进去就可以体验由ChatGPT支持的聊天业务了。微软搜索引擎只占3.45%的市场份额,Bing chat对它来说就是一个增量。
但对于占据92.42%搜索市场的谷歌来说,如果在网站上添加这么一个入口,不但搜索业务得不到什么好处,还会被分流走用户。搜索引擎已有成熟的广告模式,聊天机器人却还得重新摸索盈利模式。
OpenAI采用MAAS模式向企业收取API接口费,Jasper、Midjourney等独立AI应用都每月向用户收取订阅费,但Bing、谷歌这样的搜索平台怎么赚钱?据说微软正和大型广告公司合作,在聊天内容中插入付费链接,不知道这种模式会不会影响用户体验。
如此就不难理解为什么谷歌作为Transformer的推出者,实力其实并不输OpenAI,但还是被OpenAI抢了头啖汤。碍于微软的压力,谷歌只能硬着头皮应战。但不管今后Bard在技术上是不是比chatGPT强,谷歌都要处理左右手互搏的矛盾。当然除了搜索,谷歌的其它业务如Youtube、地图却将从大语言模型大大获益。
其次,我认为AIGC很快将成为互联网服务的标配,没这个能力的应用迟早要被淘汰。
最近体验了一下Shop,这是加拿大跨境电商平台Shopify旗下的应用。Shopify应该是最早使用生成式AI的电商平台,它是一个SAAS平台,电商企业用它建立独立站点,然后通过Google、Facebook、Instagram、Tiktok、Twitter等做营销推广、获取用户。
Shopify推出了两种AI工具:一个叫Autowrite,企业只要根据输入的商品相关信息,Autowrite 会自动撰写商品说明。
另一个叫Shopify Flow ,这是 Shopify 自建的无代码自动化流程工具,最近跟OpenAI 打通了,它能帮你想商店名称、产品名称、产品内容,生成网站首页 banners、背景图、产品图、品牌介绍;甚至还可以帮你做 SEO(搜索引擎优化),帮你增长流量。开个网店是不是也没那么难?不过这个功能需要付费才能使用。
另外,shop的AI客服也变得更高级。在京东这样的电商平台,AI客服只能机械地回答系统设置好的几类问题,而且经常答非所问。但shop的客服已经很人性化,它像个导购员一样跟你交流,给你推荐商品,介绍产品,帮你下单。不过它还没接入物流系统,无法回答关于物流方面的问题。
AIGC对电商行业的效率提升非常明显。其实在今年4月7日正式推出通义千问大语言模型之前,阿里巴巴就在低调测试其AIGC技术。每年双十一,1亿以上销售额的头部卖家在广告内容上平均要投入200多万,而且从9-10月就开始准备。2022年双十一,阿里将AI工具提供给头部卖家,包括文本生成图片、图片生成视频,为卖家们节省了40%的投入。在阿里的带动下,电商说不定将是中国最早普及AIGC的行业。
OpenAI除了开放API接口,还推出了chatGPT插件供各种第三方应用接入;百度“文心一言”首批就集结了300多家合作企业;阿里巴巴已经明确表示通义大模型将接入阿里全线产品,张勇说:面向AI时代,所有产品都值得用大模型重做一次。
大家都争先恐后,AIGC的普及速度也许会超出我们的想象,也许过不了多久,没AIGC能力的应用恐怕要遭人嫌弃了。不久的将来,那些不能将生成式AI跟自己业务好好结合的应用,迟早会被淘汰,而一些创新应用可能涌现出来,移动互联网市场将重新洗牌。
至于用户,虽然担心被AI取代,但在尝到甜头后,那个没有AIGC的日子,再也不想回去了。
aigc的商业化之路展望 aigc浪潮迭起的背后蕴含哪些商机
ai商业化什么意思,ai产品商业化明敏 萧箫 整理自 AIGC峰会量子位 | 公众号 QbitAI
AIGC热得发烫,不跟上就会被淘汰。
这是当下创投圈最直观的感受。
但“跟上”并不是一件容易的事:怎么跟?朝什么方向跟?
一不留神,就可能与风口错过。
对初创公司而言,如今AIGC技术发展过快,即便从应用层出发创业,公司PPT也不一定能活过一次OpenAI技术迭代;
对投资方来说,短时间内出现的AI新技术和新创业方向太多,从0开始学习很可能与潜力股擦肩而过。
技术狂欢之下,关于国内外大模型创业差异、大模型未来发展方向和AIGC创新性的体现,企业和投资者们有了不一样的思考。
为此,量子位邀请到了元语智能联合创始人兼COO朱雷、峰瑞资本投资合伙人陈石、*Ai联合创始人马千里和华院数智人商业化副总裁林莱尼,一起来讨论这波AIGC浪潮下,中国面临的新机遇和新挑战。
圆桌环节由量子位主编金磊主持。在不改变原意的基础上,量子位对内容进行了编辑整理。希望能够给你带来更多的启发与思考。
中国 AIGC 产业峰会是由量子位主办的行业峰会,近 20 位产业代表与会讨论。线下参与观众 600+,线上收看观众近 300 万,得到了包括 CCTV2、BTV 等在内的数十家媒体的广泛报道关注。
话题要点
AIGC让很多人才重回AI赛道,长远来看对我国科技发展非常有利。这轮AIGC热潮让创业者感到焦虑,但更多是在焦虑中前进。大部分AIGC创业公司的机会可能还是在非模型层,或是做一些垂类模型。只要AI不背叛人类,就一定会带来社会效率和人类体验的飞升。成为像OpenAI一样的企业,并不意味着打造一个中国版OpenAI。国内AIGC这一波巨大的浪潮,大家都说是“iPhone”时刻,但其实更像是初期的PC互联网时刻。以下为论坛对话全文:
论坛实录
AIGC热潮带来震撼、兴奋和焦虑
量子位金磊:特别感谢各位参与“中国AIGC新机遇”圆桌论坛,如今由ChatGPT引爆AIGC大热潮,尤其是国内已形成了一股燎原之势。因此我们认为站在当下的时间点上,有必要对AIGC的快速发展做一个总结和讨论,以应对即将到来的新机遇。
为此,我们邀请了几位走在业界前沿的企业嘉宾来共同探讨这一话题。
第一位是元语智能联合创始人兼COO朱雷,元语智能是这一波AIGC热潮的先行者。
第二位是峰瑞资本投资合伙人陈石,前沿科技一直是峰瑞资本重点投资的方向。
第三位是*Ai联合创始人马千里,在生成式绘画方面,*Ai同样是国内企业中的先行者,目前APP上的用户已超过200万人。
最后一位是华院数智人商业化副总裁林莱尼,华院计算深耕于人工智能数智人领域,长期致力于智能技术赋能产业。
在这场讨论中,我们围绕每个话题设置了一个关键词。第一个话题比较轻松,关键词为“感受”。
我们想首先请各位谈一下,这波AIGC热潮,给您所处的行业及相关业务,带来的最直观感受是什么?
元语智能朱雷:最直接的感受就是震撼和冲击。
尽管我们一直在行业内做大模型探索和开发,会有一定的预期,但这一轮热潮中还是有很多方面超出我们的预判。
体现明显的一个方面是ChatGPT在各行各业中的接受程度和应用深度。这是人工智能发展以来非常大的一个改变。原来AI都是在小圈子或固定环节里应用,这一次是真正实现了破圈,从广度到深度,都是一个非常大的技术变革,这是我们认为的震撼之处。对我们所处行业来讲,影响大概有两点。
第一,我们正在做的模型迅速被推到了聚光灯下。举例来说,我们在2022年10月正式开源了单模型多任务大模型PromptCLUE,当时的下载量不是很多,但在ChatGPT推出后,尤其是今年1月份,随着全球范围内ChatGPT话题持续发酵,我们的开源模型下载量增长很快,这对我们来说是一个比较大的促进作用,也加速了模型研发。
第二,人才方面。此前在国内氛围的影响下,不少国内外人才加入AI浪潮,但也不免有些人对这一赛道有点失望。如今随着这波巨浪袭来,让很多人才重新回到了AI的大方向之下,所以我认为从长远来看,这会是对我国科技行业的一个重大利好。
峰瑞资本陈石:其实我以前是写程序的,对AI的技术和应用比较了解。我自己本身也经历过之前深度学习的计算机视觉那一波AI浪潮,那么这一次是做生成式AI,以预训练大规模语言模型为主,GPT-4加入了多模态的输入输出。这次的技术变革让我们感到非常惊讶,因为它是一个突然的跳跃,不是连续渐进的变化。
这背后最主要的原因在于,AI其实已经具备了一些通用智能。微软研究院最近有一个报告,认为当下语言模型的发展,我们已经看到了通用人工智能的火花,而且这个火花还在不停燃烧、变大,这是让人很惊喜的事情。
从产业角度来说,我会觉得这一轮技术浪潮和上一轮深度学习浪潮相比,也有很大的不同。上一轮的AI技术变革,总体上来说没有达到预期,主要是在通用性方面比较差,最后只在安防、人脸识别等少数应用场景有一些真正的落地实践,投入产出是不好的。但这一轮的AI技术变革,技术的通用性更好,适用的场景比较宽广,产出价值会比较大。
我认为如果AI会让人类的社会运转效率、体验都实现提升。而这种变化是可以看到的,它也会从本质上改变各行各业,特别是内容生产、教育、科研等,还有其他更多行业都会受到影响。
因此我们对这一轮AIGC浪潮感到非常兴奋。这是人类的福祉,但前提是AI不背叛人类;这也为各位创业者带来了很好的机遇。
*Ai马千里:站在创业者角度来看,这轮AIGC热潮让我更加焦虑了。
因为它的发展速度太快了,我们去年8月的时候预估,在今年2、3月AI对图片内容的影响会越来越强,变化体现在漫画、GIF、短视频等领域。但没想到,一季度Controlnet加入进来后,诞生了非常多碾压式的新成果。
这就会让人时而觉得焦虑,因为自己在做大量工作时,其他团队可能会追赶上来。
另一方面,这种焦虑其实是全行业范围的,甚至传统行业的人也在焦虑。
这反而形成了一种“抱团取暖”,一些“八竿子打不着”的合作对象找到我们,比如奇瑞汽车、若态潮玩、以及快消品的品牌等,他们把诉求给到我们,我们一起去做训练,甚至还会给大量私有化数据。
要知道这些数据在一般情况下,企业是不会轻易分享出去的,但现在他们愿意提供,也是在担心如果不参与到这轮浪潮中来,就会被淘汰。
虽然有焦虑,但是更多是在焦虑中有前进的感觉,这是创业者的一种感受。
华院林莱尼:我来从数智人领域谈一下感受。
数智人从过去的文本客服,升级为语音客服,再到多模态人机交互系统的发展周期,人机交互模式正持续进化。
目前的数智人技术已经覆盖了较多能力域,如能够回答问题、撰写文章、文本摘要、语言翻译和代码生成等任务,甚至可处理更多小众主题;这些具备多模态交互能力的数智人在许多业务场景中已基本实现“听得清、听得懂、会表达”,并在金融、文旅、传媒、公共服务、医疗、零售、文娱、智能家居等越来越多的行业中商业化落地,提供坐席客服、理财顾问、播报主持、导游导览、虚拟偶像、虚拟歌手等辅助人工服务,已可作为企业或个人在完成一些重复性工作时的辅助工具。
并且,我们都知道全球在医疗和教育方面仍处于严重的资源不足,这两个领域存在巨大需求但缺乏足够劳动力来满足需求,这恰恰是数智人乃至人工智能未来的主要应用之一。
举例来说,许多发展中国家的老百姓由于所处偏远、基层医疗资源匮乏,就医十分困难。
如设置一些专业医疗辅助用的数智人协助医生完成基础的预检和分诊工作,并为病人提供是否需要进一步治疗的建议和相关注意事项等,从而提高医疗工作效率和服务水平;在教育领域,通过AI赋能教育可以根据不同学生的特点因地制宜提供个性化的学习方案,培养学生学习兴趣、提高教育质量等等。
所以数智人的出现既是挑战也是机遇,我们需要保持敏锐的洞察力和前瞻性思维,积极应对它所带来不管是正面亦或负面的影响。
中国AIGC创新性如何体现?
量子位金磊:讨论的第二个关键词,叫做模型同质化和创新性。
就目前来看,无论是AIGC应用的玩法,或是背后算法模型似乎有同质化的趋势。因此,中国AIGC的原创性该如何体现?
元语智能朱雷:这个问题很好,我们也一直在思考这一问题。
可以看到,大部分基础研究、尤其是算法模型方面,很多都是国外率先诞生。再看国内目前做大模型,无论是大厂、研究机构还是初创公司,在基础研究环节都是非常薄弱的,因此基础研究或者原创性探索上,国内目前还有一段距离需要追赶。
但这也不是说目前国内自研大模型没有价值,反而是非常势在必行的。
第一,这可以推动开源数据集、模型这方面的生态构建。
比如在中文语料梳理上,通用语料质量还不够好;还有在开源方面的氛围也比较差,据我们了解国外有很多医疗行业的开源数据集,但国内我们已知的只有2个,开源数据集的质量也不好。
因此要有更多人来做这件事,这也是我们元语智能核心团队在2019年发起中文语言模型评测基准开源社区时,就在倡导的方向和理念。
第二,现在国内对大模型AI基础设施的重视,已经到了相当高的量级。这时对于人才的吸引,包括很多圈外人都愿意加入到这一浪潮中来,从长期角度来看,这件事对于国内做AI基础设施非常有价值。
国内大模型的创新工作,大厂、初创公司都在做,各家的切入点也不同。
比如有专门做和心理咨询相关的,比如元语智能就是在通用大模型之上,做上层专业模型。聚焦在一两个行业里,解决客户的具体问题。
对于国内初创公司而言,创新性主要体现在对行业是否有足够多、深刻的理解,以及是否能迅速在行业内把数据和场景跑起来。这就要求初创公司在模型底层数据、指令微调层面上做一定创新。
*Ai马千里:做产品创新和拥抱Stable Diffusion生态并不冲突。SD只是帮忙从0-1的原型搭建,但是从底层数据、中层算法、上层应用方面还是要做从1-100的创新。怎么做出这个差差异化,这是每个创业者要思考的事情。
比如我们现在开发国风模型,首先这个模型底层要有大量国风数据,比如中国人面孔、眼睛、汉服等素材,以汉服为例,甚至具体精细区分不同时期、不同民族风格差别、汉服左右衣襟的不同代表意味都大不相同,细节见鬼神,对于关注国风的人来说细节非常重要。谁训练出来了这种带有丰富细节的戏份模型,谁就能具备底层的差异化。
训练数据不是一次性的,而是实时的、自我迭代的。我们平台上每天有200万用户每天创作接近220万张图片,很多图片都会被分享到我们的“广场”里面,我们会将受到关注和喜爱的作品的关键词拿来做进一步训练,使平台能力得到实时增强、这样的话差异化就更体现出来了。这也是为什么我们使用开源Stable Diffusion,但是平台作品和市面上的内容有很大区别,实时自我迭代的数据训练成为了创新点。
当然,除了底层数据,在训练方法方式上也有很多创新点,比如融合GPT的功能,这些功能我不赘述,欢迎大家直接用*ai上手体验。
华院林莱尼:数智人作为生成式AI技术的其中一种应用,本身包括了好几个层面的内容。就如我们评价一个演员,会从“声台行表”出发。除了外貌、声音这些外在部分,数智人的行为动作、文本表达、语音表达、交互方式甚至个性等都在生成范围内。
刚刚马总从数智人的外貌、类型和风格等方面做了解答。我这边从数智人的内容生成做一些补充。华院计算认为,数智人有三个层次,第一个层次是能说会动,第二个层次是真情实感,第三个层次是能思会想。
其中,第一个层次与 AIGC 技术中的音视频生成相关,第二个层次与文本生成和跨模态生成相关,最后一个层次则是机器人能够有自己的思考,经持续进行自主学习后,涉及策略生成等方面。为达成第三层次的数智人,我们将“常识知识图谱”中的社交常识加入到对话交互框架,实现数智人的情绪系统;通过建立行为概率性知识图谱,该图谱涵盖了5000+ 种不同的行为,实现数智人的个性化交互。
因此,最终生成的数智人,声音外貌或有相像,但结合其形体动作、交互内容以及差异化的个性足以让数智人具备自己情感和个性的个体,拥有独一无二的原创性。当然,目前华院要达成这种具备多模态交互能力且有自己个性和情感的数智人还需在认知智能领域持续、深入的研究。
峰瑞资本陈石:在趋势上看,不仅是国内,海外也是有大量偏同质化的跟进。有个统计数据显示,2022年平均四天出一个大模型,大概90多个大模型,主要是以美国为主。
本轮生成式AI的核心突破还是在算法层面和模型训练范式层面。
算法方面,大家刚刚都提到了Transformer、Diffusion Model,是目前的主流模型,所以现在很多模型都是以他们为底层架构来做迭代和变化的。
从热度方面来看,我不认为这是一个短期热潮或泡沫,我认为它会经历很长时间的进步,并产生出非常大的社会价值和商业价值。业界有人说,大型语言模型是人机接口,还是新形态的操作系统。
首先,语言模型已经成为了人机接口第一界面,以前通过菜单、图形化的方式,人们只能做有限选择,但其实通过语言才是人机交互最自然和灵活的选择。
另外从操作系统角度来看,因为GPT等语言模型已经具备一定的通用智能,有点像大脑或者分发中心,它可以和人类做交互、接收、拆解和分发任务给各种外部插件应用,得到结果后再反馈给人类,所以可以认为它也具备了操作系统的特点。
未来软件行业也在变化,我觉得方向是以语言模型为中枢的应用生态体系。AI除了赋能并提升行业效率产生商业价值之外,人类还可以通过向AI学习,不断提升人类自己的学习能力。
举例来说,人类学习语言是很痛苦的,比如学外语十几年效果可能都不是很好,但是机器学习语言的效率非常高,如果我们能够部分打开AI的内部结构,找到一些其中的规律,或许人类也可以借此提升自己,和机器一起进步,这些事情就具备很大的社会价值。
因此我不认为AIGC热潮会是短期的,它是有长期社会价值和商业价值的。
大模型只能靠“大力出奇迹”吗?
量子位金磊:针对大模型的参数规模,还有一个问题要讨论一下,叫做“大力出奇迹”。大力一定会出奇迹吗?想先请教马总,您觉得大力出奇迹这种方式一定是AIGC必经之路吗?
*Ai马千里:如果AIGC能出奇迹,不管是大力还是什么力,都是好事情。
在一些语境中,“大力出奇迹”像是一件坏事情一样,好像迫不得已的选择,但它不见得是坏事。
我曾经看过一篇博客叫“苦涩的教训”,是强化学习之父Richard Sutton写的,他认为人类总是自作聪明地去干预机器,教它怎么下围棋、让它学习人类的棋谱,但其实最有效的方法还是自我学习,无监督学习。
一定程度上,我们人类干预太多反而会限制它的发挥。所以本质上,虽然我们需要大量算力、算法上也要跟进,但我们不需要那么强地去干预它,否则效果可能会南辕北辙。
峰瑞资本陈石:大力出奇迹是必然,因为目前这个阶段的突破,就是无监督学习取得的。
无监督学习、特别是大规模无监督学习,此前一直是机器学习领域的圣杯,从来没人取得过这个圣杯。如今OpenAI把它拿下来了,我觉得这是当下被验证的一件事情,也是一个趋势,所以估计大家还会这么做,在算法和训练技术方面如果没有取得大的突破,我觉得大模型还只能这么训练。
对创业公司来说,他如果是做应用层,其实可以不需要自己去训练模型,而是在大模型基础上做调优。所以我觉得,大部分AIGC创业公司的机会可能还是在应用层,或者做一些垂类模型方向。
大模型本身,我觉得未来中国可能不会有太多家、甚至全球也不会有太多家去做。但垂类模型还有一定的机会。
如何看待中国版OpenAI
量子位金磊:接下来的关键词叫做“中国版OpenAI”。这波热潮中,国内有很多大佬纷纷下场布局、广发AI英雄帖,说要打造中国版OpenAI。
所以,就中国目前大环境来看,有必要做“中国版OpenAI”吗?可行性高吗?
华院林莱尼:我对我们国家出现像OpenAI那样基于底层算法研究、研发出划时代创新技术或应用的公司充满信心,尤其我看到现场有不少Z世代的年轻创业者,他们不仅有创新精神,也有情怀和责任感。
但成为像OpenAI一样的企业,并不意味着打造一个中国版OpenAI,我们无需重复他人的道路,在人工智能领域,“创新”是非常重要的。虽然OpenAI打造了一个多模态大模型的底层平台,为我们打开了生成式AI技术的应用大门,但从真实世界应用场景来看,多模态大模型也并非能“一招鲜、吃遍天”。
举例来说,从GPT的1.17亿到GPT-3的1750亿,几年来大模型参数量增长了近1500倍,而Google的Switch Transformer参数量更是达到1.6万亿,海量参数规模所需的庞大算力,是许多企业甚至行业无法提供的。
因此,如何提高算法鲁棒性、提升模型效果,通过小样本学习、多模态学习等实现少量数据完成新领域的训练,仍然是AI需要考虑的问题。
目前,我国已有不少露出小荷尖尖角的AI企业正在茁壮发展,虽然暂时因算力或算法上积累的经验不足,与OpenAI这样全球顶尖的AI公司尚有差距。但我坚信不久的未来,我们将看到属于我们自己的AI代表企业及其创新技术。
元语智能朱雷:我觉得这个说法有一点以偏概全。OpenAI所谓“十年磨一剑”,是因为它最初是以非盈利性目的成立的一家组织。最近它跟微软合作,整体才进入闭源状态,也有了一些商业化的模式。
但其实以商业化为目标的技术研究,国外也有很多公司都在做,而不以商业化为目标的技术研究,国内也有很多,比如高校、研究院、或是一些开源社区等,有一大批开发者和组织,以开源为目的在做这样的事情。
只不过目前国内环境下,大家普遍只会关注到一些有商业光环的项目,但对于那些非商业化的项目大家关注度比较低。
其实包括我们陈石总这样的投资人也好,包括我们量子位这种媒体也好,大家可能真的要做一件事,就是推动国内开源数据集和开源模型的发展,这个可能会成为未来的一个基石。
我认为,国内和国外在这件事上没有本质区别,大家都有一些考虑商业化的公司和以开源为目的的组织。
对中国AIGC新机遇的期待
量子位金磊:最后一个关键词,就是圆桌论坛的议题“中国AIGC新机遇”,我们用简短一句话来谈谈对它的期待。
华院林莱尼:说起这个期待,我们发现互联网企业可能对于35岁+的人群不是很友好,所以我们