马斯克aigc 马斯克布局aigc
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域相关内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
「国内要闻」
生成式人工智能服务管理办法发布
其中提到利用AI生成内容应当真实准确,采取措施防止生成虚假信息;提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责等。
知乎发布"知海图 AI" 中文大模
知乎和面壁科技合作的中文大模型“知海图AI”正式开启内测。同时,基于人工智能的“热榜摘要”开启内测,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
阿里所有产品将接入大模型全面升级
阿里CEO张勇表示,阿里巴巴所有产品未来都将接入大模型全面升级 ,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
王小川成立百川智能
前搜狗 CEO 王小川宣布成立百川智能,并透露“百川智能”已经获得了5000万美元启动资金。百川智能”已初步搭建起包括搜狗、百度等技术骨千在内的团队,目前已经开始训练500亿参数的模型。王小川称,争取年内发布国内最好的大模型和颠覆性的产品。
京东将在今年发布千亿级产业大模型「京东版」ChatGPT
京东集团副总裁何晓冬透露:京东将在今年发布新一代产业大模型,言犀是「京东版」ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖3000+,人工审核通过率95%+、生成文字30亿 +。
昆仑万维「天工」大语言模型4月17日启动邀测
由昆仑万维和奇点智源合作自研的国产大语言模型「天工」3.5(【【网址】】)将于4月17日启动邀请测试。据称,「天工」大模型已经非常接近OpenAI ChatGPT的智能水平。
商汤科技推出“商汤日日新”生成式大模型
商汤科技宣布推出大模型体系“商汤日日新大模型”,包括自然语言生成、文生图、感知模型标注、以及模型研发功能。此外,商汤科技还推出了商汤自研中文语言大模型应用平台“商量”。
360GPT产品“360智脑”开放内测
中国版 ChatGPT 产品“360智脑”正式面向企业用户开放内测(申请内测地址【【网址】】/zt/invite.html#/)。企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。
百度打假声明:目前文心一言无官方 App
百度官方发布声明称:目前文心一言没有任何官方 App,在公司官宣前,凡是在 App Store 和各种应用商店看到的“文心一言” App 都是假的,凡是声称有“文心一言源代码”的都是骗子。公司已对苹果公司及相关开发者团队发起诉讼。
飞书发布 AI 助手 My AI
飞书发布 AI 助手「My AI」。这款产品可为用户做会议纪要、自动创办待办事项、一键整理销售报告、对齐 OKR 等等,均通过自然语言交互完成。目前,My AI 暂未公布测试或正式发布时间。
「国际要闻」
马斯克入局AIGC大战
马斯克豪掷千金紧急抢购约1万张GPU。据称推特版GPT已在准备中,而且推特本身就拥有海量数据,存在一定优势。同时,马斯克也在大力抢人,目前已成功挖到两位DeepMind工程师。
谷歌Bard为“Google it”按钮添加了更多搜索主题
Google 将谷歌搜索引擎的自动搜索短语集成到 Bard 聊天机器人中。用户在回复后点击 Bard 中的“Google it”按钮,将首先收到与主题匹配的搜索短语建议,点击该短语将带出匹配结果的谷歌搜索页面。
OpenAI、微软、谷歌等将讨论制定AI使用标准
本周三,人工智能开发领域顶尖企业的高管和员工将开会讨论制定关于如何使用人工智能技术的标准。OpenAI、微软、谷歌、苹果、英伟达、Stability AI、Hugging Face和Anthropic等公司的代表预计将出席。
AI绘画巨头Stable Diffusion背后的公司也要缺钱了
据报道,AI绘画巨头Stable Diffusion背后的公司Stability AI资金将要用完了。2022年12月,该公司从筹集了1.01亿美元的资金,目前已经“烧掉了很大一部分”资金。
AI辨声判断感冒准确率达70%
最近,印度研究人员对德国630名人员的声音进行了分析,试图通过分析声音来判断人们是否感冒。结果显示,AI判断对象是否感冒的准确率达到了70%。
首款ChatGPT眼镜来了
尖端智能眼镜开发商和零售商Inno【【微信】】公司旗下brands宣布推出一款名为 Lucyd 的新 iOS/Android 应用程序。该程序支持ChatGPT语音界面。用户可以通过眼镜内置的麦克风向 ChatGPT 提问,并通过立体声扬声器听到回答。
「ChatGPT相关」
OpenAI推出ChatGPT漏洞赏金计划
OpenAI 宣布推出漏洞赏金计划(Bug Bounty Program), 该公司将根据报告问题的严重性和影响提供现金奖励,奖励范围从200美元到20000美元。
OpenAI 正考虑将 ChatGPT 扩展到日本
OpenAI 首席执行官 Sam Altman于4月10日访问日本并会见了首相岸田文雄。他透露,正在考虑将 ChatGPT 扩展到日本。
欧洲多国对 ChatGPT 展开调查
法国国家信息自由委员会决定对 ChatGPT 提出5项指控,并展开调查。西班牙方面也已经正式对 ChatGPT 可能的违反法律行为展开初步调查程序。此外,欧洲数据保护委员会宣布成立专门工作组,以促进该调查在欧洲地区的合作事宜。
Insider将开始尝试用ChatGPT撰写新闻报道
在线媒体公司Insider宣布将开始尝试利用ChatGPT进行新闻报道。该媒体正在寻求成立一个由员工作家组成的工作组,以测试如何负责任地将人工智能与工作组的内部应用程序添加到公司的工作流程中。
Part2 观点
赵明谈ChatGPT:荣耀不做大模型
荣耀CEO赵明表示,既要看到ChatGPT大模型在互联网上的变化,又要思考荣耀自身如何脚踏实地地发展。荣耀不是一个互联网公司,不可能换个赛道走向大模型。
巴菲特:不确定AI对人类是否有益
巴菲特表示,他在AI方面没有任何专业知识,但多亏了微软联合创始人比尔・盖茨,他尝试了流行的聊天机器人ChatGPT。对于ChatGPT这样的人工智能技术,巴菲特目前尚不确定是否对人类有益。他说:“在能力方面,这是一个令人难以置信的技术进步,确实非同寻常。但是,我还不确定它是否有益。”
王小川:OpenAl比我们应该领先三年
此前李彦宏接受采访称,百度的文心一言和OpenAl差距可能在两个月左右。王小川:可能采访的是平行宇宙里的他,用时间衡量的话,OpenAl比我们应该领先三年时间是有的。是晚了,晚了也得干。
学者警告 ChatGPT 的法律问题是一颗“定时炸弹
近日,哥伦比亚大学的法学学者Tim Wu对于OpenAI的ChatGPT在法律责任方面的问题的警告。他认为,ChatGPT存在着严重的诽谤责任问题,这是一个定时炸弹。
北大教授:可将GPT技术「类比于从短信到微信的聊天革命」
北京大学教授、CAAI 副理事长刘宏表示,可以将 GPT 技术「类比于从短信到微信的聊天革命」。目前 GPT 技术正处在从「玩具」向工具的快速发展过程中,近期 GPT 技术引发社会各界的巨大关注部分源于其「好玩」的特性,而未来 GPT 技术的发展目标应该是逐步取代越来越多的创造性劳动。
Part3 深度
“百模大战”,来了
一夜之间,AI大模型热得发烫。百度最先挑起战事,阿里、商汤跟得最紧、跑得最猛,都已发布类ChatGPT产品。不止如此,科大讯飞等中大厂的大模型也已经在发布的路上。百“模”大战,一触即发。
ChatGPT生成的内容,是否享有版权?
Open AI“GPT4”新系统的发布和百度“文心一言”的推出,也将国内对AIGC版权问题的探讨再次推向高潮。本文希望结合国内外在AIGC版权领域的既有案例实践,就目前ChatGPT类产品生成内容的版权属性、权利归属与责任机制等尝试做了理论探讨。
ChatGPT,先养肥了卖课的
ChatGPT和AI绘画火了,搞培训的赚到第一笔钱。目前市面上有大量个人大V主导的付费社群,这一类也是传播最广的ChatGPT付费学习团体。比如提供加入ChatGPT相关付费社群的服务,收费198元/年。与个人大V相对应的是机构形式的培训班。
AI会杀死“美图秀秀们”吗?
近期,有传言称某头部修图APP“因为AI(的冲击)正处于生死存亡之际”。虽未指名道姓,但行业内给出的反应大多是:AI在“无差别攻击”各个行业的时候,修图APP也难逃一劫,因为目前AIGC以图像生成方面的应用相对最为广泛。
(举报)
机器视觉公司,在玩一局玩不起的游戏
机器视觉官网,机器视觉这个行业怎么样,机器视觉创业公司,机器视觉厂家图片来源@视觉中国
文 | 脑极体
有个著名咨询公司曾经预测过:未来只有两种公司,有人工智能的和不赚钱的。
它可能没想到,还有第三种——不赚钱的AI公司。
去年我们报道过“正在消失的机器视觉公司”,昔日的“AI四小龙”( 商汤、旷视、云从、依图),在商业化盈利上各有各的不顺。不过,随着GPT系列产品又掀起一股“大炼模型”的热潮,这些AI公司又支棱起来了。
商汤科技此前曾披露,下一步的发展战略是通用人工智能(AGI),继续推进“大装置+大模型”,并发布了1800亿参数的中文语言大模型 “商量”。
旷视科技也表态,会坚定投入生成式大模型的研发,保持核心技术能力长期领先。
云从科技公开的定增预案中,为云从“行业精灵”大模型研发项目,募集资金不超过36.35亿元。
依图科技没有公开消息,但在此前的融资中曾因AI大模型和国产芯片等被看好。
无论是上一轮,以BERT、GPT-3为代表的“预训练+精调”大模型,还是此刻正红火的,以ChatGPT、GPT-4、文心一言等为代表的“预训练+精调+提示+RLHF(人类反馈)”的大语言模型,已经成为各大头部科技公司“秀肌肉”、相互竞争的重要工具。
谷歌、百度等大厂跑着入场,各路大模型“神仙斗法”。这场狂欢派对,成了机器视觉公司不得不玩、又玩不起的游戏。
最近,CV公司参与到大模型这局游戏中,出现了这样的画风:语气一会儿大,一会儿怂。
在公开信息中,都表示自己会加大投入,去解决基础技术、基础问题。云从的管理者说要“投一二十亿解决算力问题”“我们是技术公司,研发投入不会低”;商汤的有关人士称,要做“统一化标准化的大模型”“加速构建通用人工智能的核心能力”;旷视也对标OpenAI,要“做影响物理世界的 AI 技术创新”。
谈到大模型技术和产品本身,底气又不足了。
这个说“基础大模型要有长期布局,NLP难点很多,短期内与境外领先企业会存在较大差距”,那个说“中国AI公司有商业化的压力,不能像OpenAI那样不计代价的创新”。
“预期管理”算是被你们玩明白了。
年轻人流行说自己是“脱不下长衫的孔乙己”,CV公司对于大模型这种不尴不尬的处境,其实也和“孔乙己”有相似之处。
CV公司在底层技术、基础设施、人才、资金、生态等领域的积累,不如头部科技企业优势显著。所以,自然也不可能真的跟谷歌、OpenAI、BATH(百度、阿里、腾讯、华为)正面打擂台,烧钱去做通用的基础大模型(foundation model)。
新一*语言模型,完整技术栈、工程实现能力、算力成本、数据积累等都有极高的门槛,AI公司自研大语言模型的难度前所未有。OpenAI 在2022年就花掉了5.44亿美元,收入只有3600万美元,这是国内CV公司不具备的家底儿。
当然,外界也不应该过度放大CV公司的责任,非要将巨头才能承担的创新压力放在CV公司身上。
但是,CV公司又有着“【【微信】】原生企业”的光环,也确实积累了很多技术储备, 所以也不能直接躺平,像ISV集成商、软件公司一样依附大厂,欢欣鼓舞地等着集成或调用API就好。
昔日的“AI四小龙”还是要撑起“技术自立”的架子,努力融入这波炼大模型的热潮里,于是,又将模型数量和参数规模的比拼,拉升到了新的竞争水平。
比如云从有NLP、视觉领域的预训练模型,商汤在“AI大装置【【微信】】”的基础上,构建的日日新大模型体系就包含了通用视觉模型、中文语言模型、图片生成模型……其中,仅“商量”大模型的参数规模,就和GPT-3差不多。
今天大家都感慨,孔乙己脱下长衫不容易,换个角度,“大模型”这件长衫,CV公司是不是有必要穿上呢?
从2018年的预训练大模型到2023年的大语言模型,大模型走过了一个从萌芽到繁荣的小周期,种类、功能也丰富起来,我们已经见过很多AI企业、高校和科研机构、行业公司所打造的各种各样的大模型。
问题来了:
第一,大模型的“智能涌现”,需要在超大规模的数据和充分的训练才能出现,只有不计投入的基础模型能做到。
很多面向行业的预训练大模型,由于数据和训练不足,无法达到“智能涌现”的临界点,这也是为什么此前预训练大模型那么多,却只有ChatGPT的到来,才证实了“通用人工智能”的可行性。
在基础模型的鲁棒性、泛化性极大提升的今天,一味盲目地“训大模型”,结果就是“大小班同上”,基础大模型和行业大模型一起,消耗本就不充沛的算力,进一步推高计算成本,让AI企业背上更重的负担。
第二,大模型的商业化路径,标准化API是比较基础的一种,而基础模型API有虹吸效应。
简单来说,通过API接入AI能力,技术是决定性因素,基础模型的能力强、受众广泛,很容易通过API经济完成商业化,而行业大模型面对的领域较窄,很难通过“规模效应”来摊薄研发成本。
随着一个又一个大模型被推向市场,大家恍然发现:原来我们并不缺大模型,缺的是商业化路径。
目前,大模型的商业化还比较有限,C端通用产品贴成本定价,B端盈利前景不明朗,根据 A16Z 对美国 LLM 创业调研,纯模型厂商只能拿走0-10%的价值,并且要长期对标OpenAI的定价策略,会面临很大的商业化压力。
通用基础模型和行业大模型一起面向市场和客户,结果就是,在商业价值分配上产生博弈。AI巨头“神仙斗法”,打造出的通用基础大模型会吸引产业和用户的最多关注。
而大量行业大模型,要么在训完后无人问津,浪费了前期投入;要么无法满足产业需求,商业化前景受限;或者跟通用基础大模型的能力有冲突,导致商业化达不到预期。
同为AI创业型公司的出门问问创始人李志飞,就在一次采访中直言:“不是所有人都要去做通用大模型,贸然进入,难度很大,商业竞争很激烈,想不清商业模式到最后会很痛苦。”
所以,大炼模型,可能是CV公司目前玩不起的一局游戏。
你可能会问,现在大模型这么火,不训大模型怎么能吃到这波红利,在新一轮AI热潮里建立优势呢?
CV公司要轻装上阵,可能要尝试这样几条路,去探索大模型热潮中的机会:
1.跟基础大模型平台建立更紧密地联系。
自己开发大模型难度太大,训练成本、存算成本过高,社区生态支持也不够充足。可以站在巨人的肩膀上,接入基础模型的能力打造小模型,与基础模型的商业模式形成差异。
此前CV公司盈利难的一个挑战是:机器视觉要进入腰尾市场,存在着海量的碎片化需求,客户体量比较小、数量多,项目规模不大,这对CV公司的开发效率提出了很高的要求。
通用的成熟型算法,无法满足细分需求,但全靠算法工程师来定制开发不现实,也不够经济划算。基础大模型,将算法开发推进到工业化阶段,减少了编程工作量,提高了开发效率,定制化算法的性价比提高,也就更容易为企业所接受。
对于CV公司来说,算法进入工业化大生产阶段,将碎片化需求全面覆盖、规模化复用,整体营收能力自然也就上来了。
2.深入到具体行业中去,构筑能产生差异化的应用产品。
基础模型要走向产业,必须进一步精调,CV公司就有相应的优势。
很多高度专业化或复杂的工作,比如金融、建筑设计、编程、办公、客服等,需要精准的垂类知识;一些特定领域,比如医疗、司法,非结构化数据比较稀缺。没有足够的语料来“投喂”,基础模型在这些场景就会欠缺一些“常识”,比如GPT-4就写不好中文诗。
据说,GPT-3.5的训练数据集全部为私有数据集,其中关键的SFT训练集,有89.3%的数据是定制的。
CV公司大多有自己聚焦的垂直领域,比如依图的智能医疗,旷视的物联网,云从的智慧园区,商汤的智慧城市、智慧出行等,可以结合在相关领域沉淀的差异化数据集,利用精调或prompt的方式,打造出更加精确、可靠的小模型,更容易部署,为AI应用加速AI的快速落地。
3.建立更具韧性的生态合作护城河。
CV公司在大模型技术上的积累,就会变成AI 2.0时代的底牌,也可以作为与AI巨头、算力提供商的生态合作筹码。
比如这一*模型,对提示学习、人类反馈的强化学习RLHF等提出了很高的要求,让模型在人类的引导下,发现知识的使用方式,理解人类的偏好,这在国内都属于很新的领域,提示师、专业标注师很少。有媒体报道,OpenAI的标注员,本科学历52.6%,硕士学历36.8%,这就不能全部靠众包模式来进行数据标注,必须拥有自己的垂直领域的标注团队。
比如医疗领域,医学图像还没有建立起自然图像那么大级别的数据库,而对医学图像的标注是很难的,不像自然图像标注,普通人一看就知道是什么,医学图像的数据标注涉及到器官、癌变等专业知识,就需要针对性地积累。
这样的高水平技术人员,恰恰是CV公司这种【【微信】】原生企业的重要资源,可以与产业链上下游开展更紧密地合作,从而保障产品和服务的竞争力和可持续性,吸引客户更多地将数据放入自己的产品中,形成马太效应。
大模型开辟了一条蕴藏着极大价值和可能性的新路,被寄托了太多期待和野心。要有大模型能力,不代表要自己训大模型。
重复建设的热潮终会褪去,届时,大模型商业化的考验才刚刚开始。
对于CV公司来说,脱下“大模型”的长衫,是为了留住商业化的“底裤”。集体弄潮只是只是一时热闹,保存实力才能在AI江湖中走得更远。