规模化算力供给、千亿参数量大模型研发、国家级数据训练基地北京通用人工智能“基建”三步走

互联资讯 2023-05-17 13:00:07 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

算力市场规模

由ChatGPT掀起的大模型浪潮仍在继续。被誉“AI第一城”的北京，率先将重点落在了政策上。5月12日-19日，《北京市促进通用人工智能创新发展的若干措施（2023-2025年）（征求意见稿）》（以下简称《若干措施》）向社会公开征求意见，5方面21条措施涵盖了算力、数据要素、大模型技术、应用场景等诸多受到广泛关注的领域。而在AI“新基建”领域，《若干措施》也画出了一条涵盖算力、算法以及数据训练的清晰图谱。

算力、算法与数据

数据、算力和算法，号称人工智能的“三驾马车”，缺一不可。而眼下的重点在于，这场始于AI领域的全球竞赛，却先在算力上引起了一波“焦虑”。上个月，OpenAI停止ChatGPT?Plus的销售，便让人猜测是因为需求量过大，计算资源供不应求，随着国内大模型相继入局，对于算力紧张的猜测也自然蔓延至国内。

《若干措施》的第一条正发力在这一领域，在组织商业算力定向满足本市紧迫需求、高效推动新增算力基础设施建设以及高效推动新增算力基础设施建设三个方面提出了具体的举措。

具体而言，《若干措施》提到，将加强与头部公有云厂商等市场主体合作，实施算力伙伴计划，并确定首批伙伴计划成员，新增算力建设项目纳入算力伙伴计划，加快推动海淀区“北京人工智能公共算力平台”、朝阳区“北京数字经济算力中心”等项目建设，快速形成规模化先进算力供给能力，支撑千亿级参数量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。

在算法方面，《若干措施》提到，要开展大模型创新算法及关键技术研究，在数据方面，则更聚焦在“高质量”这一关键词。例如针对目前大模型训练高质量中文语料占比过少，不利于中文语境表达及产业应用的问题，《若干措施》便提到，整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗等。

高质量的数据需要“国家队”的护航，在这一领域，《若干措施》表示，加快推动数据要素高水平开放的“国家数据基础制度先行先试示范区”建设，争创国家级数据训练基地，提升北京人工智能数据标注库规模和质量等。

“《若干措施》相当于一个非常明确的专项政策，用以统筹全市资源，更好地赋能、促进人工智能的发展，这种调集全市之力制定专门的政策规划推动一件事的情况，在全国范围内都是相对比较少见的。”北京社科院研究院王鹏如此评价道。

深度科技研究院院长张孝荣也认为，《若干措施》的亮点在于对人工智能产业三要素以及应用与监管方面都做了比较全面的部署和指导。“不过，在算法研究和基础软硬件研发方面，缺少可执行措施，有较大提升空间；在对于数据质量提升和建立统一算力调度平台方面，有些措施可以商榷，有的可以进一步完善。”张孝荣说。

应用场景牵引技术研发

技术创新的价值在于场景落地，人工智能也是如此。《若干措施》的第四部分，完全聚焦在通用人工智能技术创新场景的应用方面，政务服务将成为率先试点应用的领域，此外，推动医疗、科学研究、金融、自动驾驶、城市治理领域的示范应用也已提上日程。

以自动驾驶为例，《若干措施》便提到，支持自动驾驶企业研发多模态自动驾驶技术，发挥大型语言模型高维语义理解和泛化优势，基于车路协同数据和车辆行驶多传感器融合数据，提高自动驾驶模型多维感知和预测性能，有效解决复杂场景长尾问题，辅助提高车载自动驾驶模型泛化能力。

国泰君安曾表示，AI技术的跃进和爆款应用的推出，意味着人工智能产业进入应用场景大爆发阶段。今年3月，百度创始人、董事长兼首席执行官李彦宏透露，自2月百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。

彼时，李彦宏就曾提到，人工智能会彻底改变今天的每一个行业。“AI的长期价值，对各行各业的颠覆性改变，才刚刚开始。未来，将会有更多的杀手级应用、现象级产品出现，将会有更多的里程碑事件发生。”

王鹏认为，北京的人工智能发展，并不是简单地为了发展而发展，更多情况下是要跟城市整体的发展，如智慧城市、数字经济标杆城市等相结合。因为人工智能的发展不仅在于研发，而是在应用，而应用的本身就是数字经济的全产业链开放。从《若干措施》中也能看出，提到的重点发展方向除了基础研发之外，更多要以应用为牵引，与北京经济高质量发展进行深度的融合，让应用场景牵引研发。

不过张孝荣提到，大模型应用在全球也是起步阶段，需要大量时间探索，我们可以放慢节奏，不必急于一时。

立足首都，带动全国

早在ChatGPT走红之前，人工智能便已成为世界科技竞争的焦点。2017年7月，国务院发布的《新一代人工智能发展规划》将人工智能提升至国家战略层面，其中提到，2030年人工智能核心产业规模要超过1万亿元，并将带动相关产业规模超过10万亿元。

数据显示，截至2022年，我国人工智能产业规模已达到5080亿元，相较于2018年的2288亿元增长了122.05%，连续五年保持稳定增长。

首都北京的科技底色更浓。5月15日的2023中关村论坛新闻发布会介绍，2022年北京研发投入经费占比在6.5%以上，达到全国平均水平的2.7倍。在京国家实验室高质量入轨运行，全国重点实验室目前达到了80家，在全国排在第一位。2022年，北京平均每天新创办的科技型企业293家，不到5分钟就诞生一家科技型企业，独角兽企业102家，居全球第三。

中国数实融合50人论坛智库专家洪勇认为，北京人工智能产业发展拥有优质的科研与教育资源、浓厚的创新创业氛围、丰富的产业生态系统以及完善的政策支持等优势。

在他看来，《若干措施》对北京发展人工智能产业具有重要意义，它将促进创新发展，提升北京在算力资源和高质量数据方面的供给能力，推动创新技术的涌现。同时，它还将强化北京的核心竞争力，巩固其作为人工智能产业核心城市的地位。

此外，《若干措施》也将促进产业生态发展，形成完善的人工智能产业生态系统，推动合作与交流。最重要的是，它将带动经济发展，成为北京经济增长的重要引擎，促进北京在人工智能领域的引领地位。

王鹏也提到，在一系列优势的基础上，未来北京人工智能产业链布局可能会朝三个主要方向发展，首先是基础设施，其次是与数字化、城市转型升级等方面的融合，最后北京的人工智能不仅是服务北京，还要立足北京，辐射京津冀，服务全中国甚至辐射全世界，这才是北京作为首都，拥有如此多的积累后，应该达到的目标。

“换句话说，北京的人工智能一定处于我国人工智能的第一梯队，那么北京的目标就不单单是服务中国，而是要更好地‘走出去’。”王鹏总结称。

北京商报记者?杨月涵

海量资讯、精准解读，尽在新浪财经APP

虚拟人有了行业共识虚拟人产业链

虚拟人有什么用,虚拟人siren,虚拟人是真人吗,虚拟人是什么人反正不都是不是人吗

近期，“AI孙燕姿”火了，多部作品播放量破百万。虚拟数字人受追捧背后是技术层面的支撑。近年来，AI技术快速发展，尤其是AIGC技术在近期的突破，使得虚拟数字人发展进入新阶段。业内人士认为，AI技术应用将加快优质内容开发，虚拟数字人或成为新的流量入口。

AI技术快速发展

“AI孙燕姿”独特的音色与唱腔受到众多网友喜爱。截至目前，B站平台上以“AI孙燕姿”为关键词的歌曲作品超过1000首，其中3首作品播放量破100万，52首播放量超过10万。

AI歌手的原理并不复杂。以制作“AI孙燕姿”的歌曲为例，首先需要获取孙燕姿没有伴奏和混响的原始声音。然后将这些素材作为目标音色输入到模型中进行训练，得到一个可以生成孙燕姿音色的模型。接下来，可以用这个模型来转换任意音色的歌声，再进行一些后期处理和调校，就可以得到听起来像孙燕姿唱的歌曲了。

券商研究员也赶起了时髦。5月12日，招商证券传媒首席分析师顾佳表示，招商证券已为其打造数字分身，其虚拟人将很快“成百成千”出来进行一对一交流和路演。顾佳AI虚拟人将具备强大技能，可以同时出现在路演现场、新闻发布会、研报解读会、分析师电话会等场景。

东方证券研报显示，近年来，AI技术快速发展，尤其是AIGC技术近期的突破，使得虚拟数字人的发展进入新阶段。AI技术使数字人的制作成本降低，制作周期缩短、门槛降低。同时，多模态AI使得虚拟数字人的交互能力更上一个台阶。随着AI技术的不断完善，数字人的感知能力、思维能力、内容输出能力都将得到显著改善。

商业前景值得期待

虚拟数字人的商业前景值得期待，多种对话式服务有望升级至虚拟数字人形态。有机构测算，2030年我国虚拟数字人整体市场规模将达到千亿元。

“AI技术快速迭代，对虚拟数字人产业带来强大赋能。”在国内某头部券商传媒分析师看来，虚拟数字人行业处于高速发展期，AI+虚拟数字人市场规模有望快速增长，将迈向工具化、系统化、低成本新阶段。

国内众多企业早已展开布局。其中，腾讯等头部游戏公司推出了AI驱动型虚拟NPC和数字代言人，拓宽游戏变现模式。

浙文互联在近期发布的2022年年报中介绍，公司虚拟数字人业务致力于为三维虚拟世界提供造人、育人、用人的全站式技术和产品服务，为三维虚拟内容制作提供智能化、工业化的基础设施，如为东风风光mini定制的虚拟人“可甜”已交付使用；与《座驾》杂志联合打造的“IKA伊卡”已入驻快手；“宫玖羽”与汽车之家完成签约，担任“汽车之家特邀AI体验官”；长安汽车的“宫橙诗”交付完成。

“AI孙燕姿”在走红的同时，其合规性也引起市场关注，包括在版权层面出现侵权的担忧。

中国证券报记者注意到，在目前全网播放量最大的一则“AI孙燕姿”视频页面上，视频上传者特别注明该作品仅作为娱乐目的发布，视频中演唱人声并非孙燕姿本人。如有侵权告知删除。

作为虚拟数字人的重要应用平台，短视频平台在积极推动内容层面上的规范。5月9日，《抖音关于人工智能生成内容的平台规范暨行业倡议》发布，针对人工智能生成的视频、图片和衍生的虚拟人直播，首次明确其在平台内的行为规范。平台将提供虚拟人的注册能力，并对已注册的虚拟人形象进行保护。

业内人士表示，随着大量虚拟主播登场，势必会引发关于虚拟数字人的知识产权纠纷，虚拟数字人知识产权认证将成为迫切需求。

本文地址： https://www.528683.com//show-410036.html