人工智能算法的未来发展方向2022 人工智能未来会在哪些领域发展
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
新的AIGC浪潮似乎又要席卷而来。趁着日月换新天的窗口期,我们可以先看看中国人工智能领域有了哪些积累。总体说来,中国建立了稳固的政策来支持人工智能经济发展,并在全球人工智能学术领域做出了重大贡献。斯坦福大学的《人工智能指数》评估了全球各个方面的人工智能进展,包括研究、开发和经济等多个指标。其将中国列为2021年全球人工智能活力排名前三的国家之一(如图1)。更加具体来说,可以从三个方面:学术科研、经济、政策三方面概述我国目前的积累。
在学术层面上,总体来说中国AI论文数量最多、但质量不如美国。据《日本经济新闻》与荷兰学术信息巨头爱思唯尔进行的一项调查显示,中国在人工智能领域的论文的发表量在2021年是美国的近两倍,达到了4.3万篇,占全球的约三分之一。其他方面,如AI专利申请数量,期刊应用量和出版物数量等也都位于全球第一(如图2)。但会议论文引用情况并不像其他那样突出。另外,AI论文的总数自2010年以来翻了一番以上:从2010年的约20万篇增长到2021年的49.60万篇。
在经济、AI模型层面上,总而言之,我国虽然有积累,但不多。以百度为首,字节、商汤科技,阿里和腾讯等科技公司都显示出具有开发人工智能模型的潜力,虽然诞生了诸如之前的PaddlePaddle框架、近期的文心一言、MOSS、通义千问等大模型,但《人工智能指数》报道世界上大多数的大型语言模型和多模态模型仍由美国机构生产的:例如2022年美国、英国和中国分别产生了16个、8个和3个重要的AI系统。我们离ChatGPT和GPT-4仍有不小的距离。另外在经济方面,总体而言,中国在全球排名中离世界前列还有一定差距(如图3)。
在人才储备、政策方面,我国高度重视人工智能技术进步与行业发展,具有雄厚的政策、战略积累。我国先后出台了《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018-2020)年》《关于促进人工智能和实体经济深度融合的指导意见》《关于“双一流”建设高校促进学科融合 加快人工智能领域研究生培养的若干意见》等重要文件,彰显出我国对人工智能行业布局与规划的重要程度。另外诸市如北京、上海、深圳和杭州都分别给出了自身对人工智能发展的制度保障。例如上海截止2021年3月底,现行地方标准1368项,包括有智能电网移动终端安全防护规范、智能语音核心组件接口规范等。
我国在人工领域正处于“高筑墙,广积粮”中,而新的浪潮似乎要来了,随着ChatGPT的到来,大模型、AIGC呼声越来越高,不仅被消费者追捧,也倍受投资者关注,同时各国的科技巨头也开始新的一轮军事竞赛。这种种意味未来十年有那些发展方向也得根据时态重新进行思考。
首先是对AIGC生成内容的可控性、生成内容的评估手段的研究,重点是解决因数据存在的偏见和歧视而导致生成内容可能存在着违法信息的传播风险,以及生成内容对使用者是否合适,会不会给使用者带来心理暗示、精神影响。
二是如何保证AIGC的数据隐私安全、保护著作权的研究。AIGC的使用者在使用过程中可能会无意中透露有关个人、商业隐私等的敏感信息,而这些数据会传给AIGC的公司内部服务器上,这就可能会造成数据的泄露。而AIGC公司的数据库中也可能存在着未经用户同意的个人照片等隐私数据,容易对用户的个人隐私安全造成威胁。另一方面,关于图画创作的AIGC存在的著作权侵权问题也是久病难医。
三是关于AIGC与其他行业进行跨行业合作,研究人工智能在更广泛的领域中的应用。包括教育、金融、程序编写等。AI工具落地于各行各业终究是长远趋势,将作为生产力工具扎根在其能蔓延到的行业。
四是对数据标注行业的发展,数据作为新一代的“石油”,作为模型优劣性最直接的影响元素,如何降低标注成本同时保证标注的可靠性将是一个具有机遇与挑战同时存在的新方向。
中国人口基数,决定了人工智能赛道积累,就是培养了巨量合格的世界级人才,这些人拿到国外可以干翻一个团队的能力,在国内只能失业
我觉得未来十年,国内这群人要去哪里就决定了那些发展方向,如果他们卷不出去,就下来就是让国内大大小小任何一个企业都能廉价用上AI,注意是廉价到发指的地步。
至于要不要创新,我觉得大可不必盯着No1去追,毕竟创新也是有成本的,我们的主旨是足够省钱
至于服务业,我理解中国讨论服务业前提是有大量创业公司小公司存在,服务业才有意义
很多人理解服务业很狭隘,脑子里面抹不开*的图像,总是想着服务业就是满足普通人的多巴胺,这种人有这种想法是特殊环境导致的。
其实服务业本质还是过量人才以非常专业的技能帮你解决问题,而且比你亲手做还要廉价,本来中国人才基础是非常适合发展高质量第三产业的,但是由于人才太过廉价,而且小企业能够染指领域特别少,所以以专业能力服务高净值人群的服务业,被迫停留在多巴胺满足的程度。
所以,如果卷不出去,我是非常担心未来10年,赛博扬州瘦马培训产业才是AI唯一发展方向,我是无法接受的。
中国人工智能领域的积累有:
政府的热切关注:
- 连AI生成的内容都要符合社会主义核心价值观:
海量中文数据,包括但不限于:
- 大量ChatGPT生成的各种知乎回答的中文文本数据
- 大量使用SD和MJ生成的图片数据
- 大量使用ChatGPT和SD的视频教学和测评
- 各家App圈里掌握的数据及用户隐私
- 热门社区、百家号百度贴吧的*高*质量数据
- 总量为1:10的中英互联网数据
大量中文教程:
- 深度学习和强化学习中文版教科书
- 西瓜南瓜蒲公英教科书
- 动手学深度学习和动手学强化学习教科书
- Github社区机翻教程
大量从业、失业、准从业失业叠加态人员:
- 大量奋战在人工智能一线的海外华人
- 亦步亦趋、着急商业变现的企业高管
- 担心被PIP、996随时可能猝死按年卖身员工
- 使用Google和ChatGPT、Git和Github、Nvidia显卡的企业开发者
- 对口专业高学历+顶会+实操都强的少量HC
- 念PPT的高校老师
- 撑死几百块补贴还可能被薅走的研究苦学僧
- 写大量基础综述论文的灌水人
- 写英文顶会、求开奖的科研上道人
- 拿盗版资源卖积分会员广告的CSDN
- 白嫖开发者的某某社区
- 筛选圈王的某某竞赛
- 套壳API的收费小程序、AI U盘
- 用爱发电的ChatGPT浏览器插件开发者
- 拿着开源框架引流,坐等收租的云服务器商
- 背锅、刷榜的廉价实习生
- 签劳务合同的外包员工
- 常被白嫖、抄袭的开源代码自由开发者
- 说不行和蹭热度的评论区懂王
- 卖万元课和服务的培训机构
- 鼓吹人工智能行业高薪的媒体和行业分析师
- 贩卖人工智能导致失业的焦虑的媒体人
- 拿期权画饼白嫖程序员的创业公司
- 拿着框架苦找钱的技术大佬
- 邮件地址一发,坐等招募的资本大佬
- 大量开源软件开发者
- 滋滋滋送钱买课的转行AI小白
- 我这样的转行失败失业三年的小丑:
- 嗜钱如命的人得到了钱,视金钱如粪土的人得到了金钱的嫌弃。
知名算法:
- ResNet 孙剑已猝死
大量知名的工业和学界框架:
- Paddle~
- MXNet
- OpenMMlab
- MNN
- Mindspore
- TNN
- Oneflow
- 天元
- Jittor
- ElegantRL
- Tianshou 开发者三年前求职失败 今已在OpenAI就职
- ~
大量应用场景:
- 姿态识别,套皮人,搞虚拟偶像直播
- 语音识别,不可修改的憨憨人机字幕,不薅用户帮改的羊毛
- 文字和语音生成,智障客服,还不提供转人工
- 推荐系统,B站知乎抖音快手油管基本都有,失业人每天沉浸在奶头乐里,好不快活。
- 图片生成,涩图,本死宅喜闻乐见
- 视频生成,都来学我家坤坤跳舞
- 视频换脸,各种明星脸,基本都看过
- 多智能体强化学习,王者荣耀绝悟,可以大胆骂队友不如人机赶紧下线。
- 无人和辅助驾驶,这真应用的安全性要求很高,短期难,多是噱头。
最后,别忘了开发的时候,翻T子和镜像源:pip 使用国内镜像源 | 菜鸟教程
哪些发展方向值得关注:
一、不扯谎言、实事求是:别动辄几百万开发者、多少Star。
二、专注就业、别老降本:有活干、活得像个人而不是工具和牛马。
这是个很大的问题,大到足以让工信部或者国务院牵头,联合上多个部委,一起出一本白皮书。
中国有着非常适合人工智能发展的环境,并且在人工智能领域整个链条上都做出了不少的积累,我只能从自己略知皮毛的部分管中窥豹,分享一些见解,权作抛砖引玉之用。
关于人工智能,有一个广为流传的“三要素”说法,即“数据、算法、算力”,这三项人工智能要素间的关系,简单概括来说,就是一句话:算法通过算力在数据上学习知识。
近些年人工智能的发展热潮,实质上是 海量的训练数据、以深度学习为代表的人工智能算法、高性能向量计算算力,三者各自突破,并最终量变引发质变,形成“化学”反应的结果。
如果我们回顾人工智能热潮前的不少概念,比如移动互联网、物联网、云计算等等,这些前“网红”概念,会发现他们都是人工智能发展的基石,比如移动互联网和物联网带来了可被计算机存储和分析的数据,帮人工智能奠定了人工智能的数据基础;云计算和多媒体(游戏、GPU)的发展,突破了人工智能的算力瓶颈……
要聊中国在人工智能领域的积累,一个很好的方式是按照这三要素进行分类。
先聊聊数据,数据确实是我们的传统强项,也是专家们受采访时一定会谈及,圈外人也会津津乐道的优势。
我们有着巨大的网民和发达的移动互联网,我们有着全链条的工业链,我们早些年各省市纷纷成立自己的大数据局,国家在今年3月成立了国家数据局……从生产数据,到管理数据,我们在各个环节都走在了世界的前列。
在数据集生态的建设方面,我们国内也做出了不少解决方案。
比如 百度飞桨的公开数据集[1]
比如 阿里天池的数据集[2]
这些数据集平台上的数据,并不仅仅来源于平台创办者自身贡献,而是来源于一个个由各行业头部机构发起的项目或者竞赛。
比如天池数据集当前“榜一”的数据集,中文医疗信息处理评测基准CBLUE数据集,就来自由阿里云天池平台承办,中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起的中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding E【【微信】】)竞赛。
这个竞赛的协办单位还包括北京大学、腾讯天衍实验室、平安医疗科技等其他单位和企业。
这样的运作模式,可以从发起方的切实需求出发,同时实现制作数据集、网罗算法人才、训练可用算法模型等一石多鸟的目的,基本上国内质量最高的一批公开数据集,都是这种运作模式的产物,是我国近年来AI发展的重要数据财富。
但其实在数据这个方面,我们做得其实也没有想象的那样好,我们可以适度自信,但并没有自满的资本。
根据对21年AI论文的统计研究,50%的AI数据使用,集中于在全球12个顶级研究研究机构所掌握的数据集,而其中10个都是美国的,只有中国、德国分别有一家机构上榜。
In fact, over 50% 【【微信】】(Papers With Code) as of June 2021 can be attributed to just twel【【微信】】.. Moreover, this concentration on elite institutions as measured through Gini has increased to over 0.80 【【微信】】 (Figure 3 right red). This trend is also obser【【微信】】on on datasets in PWC more generally (Figure 3 right black).[3]
除了这些大机构所掌握的数据,像是经常使用的数据集,也大部分被美国所掌控,比如开源平台github上的awesomedata[4] 虽然不乏来自国内的contributors,但其运作的平台github是微软掌控的。
如果我们把AI限定在深度学习领域,会发现这一领域的算法具有一定的特殊性,和很多领域的核心技术不太一样。
如果我们仅仅把深度神经网络模型记作算法,会发现这些算法本身是跑不起来的,算法必须结合了足量的数据和算力才有意义。
整个深度学习网络的发展就充满了“力大砖飞”的过程,初代神经网络(感知机)可以追溯到上世纪五十年代,图像方面的基础网络结构CNN来自上世纪80年代,这些算法模型都曾一度蒙尘,是在数据和算力突飞猛进后才突然发挥出真正实力。
比如最近爆火的,以ChatGPT为代表的大模型,就是典型的用恐怖的数据和算力,推动了千亿级参数模型的训练和落地,其实际上并不是AI基础理论的突破性升级(这也是国内巨头敢发声,表示快速跟进的原因)。
而AI算法并不能直接让公众感知,最终能让公众感知的,都是训练好的模型,所以很多人容易把是把数据和算力的落后给算到算法头上。
如果说在数据方面,我们其实没有想象的那么厉害,在算法方面,则是没有想象的那么差。
根据斯坦福的报告,The 2023 AI Index Report[5]
中国的AI期刊论文发表数量和引用数量占比都位于世界第一。
报告里直接在O【【微信】】里写了美国和中国继续主导AI研发:
Although the United States and China continue to dominate AI R&D, research efforts are becoming increasingly geographically dispersed。
较为客观的说,我们在各行各业都做出了大量的应用性创新算法,但在算法模型的突破性研究上确实和美国有较大差距。
而突破性的研究,背后是不计成本、不以盈利为目的的投入,不可能在这方面同美国竞争。
很多人想质问为什么OpenAI能搞出这些或者那些的算法,但阿里巴巴做不出来,但实际上,微软总市值2万亿美元,阿里的市值则仅仅有2千亿美元。作为两家体量悬殊的公司,两者敢在AI上烧的钱不可能在同一个数量级上。
实际上根据斯坦福的报告,我国由企业(Industry)主导的AI研究占比,也确实远远低于美国或者欧盟加英国,国内的AI推动,主要还是来源于没有盈利压力的高校和政府推动。
我国的人工智能算力方面的积累,其实是受公众关注最小的,因为在这一领域,占有主导地位的,是我们的政府机关,而他们并没有太多宣传上的需求。
实际上,在这方面,我们这些年的积累,远远高于公众的悲观预期。
根据中国科学技术信息研究所(简称中信所)等机构编写的《人工智能计算中心发展白皮书2.0》[6]截至2021年,我国人工智能计算中心得到了飞跃式的发展:
在我国,经过近两年的快速发展,人工智能 计算中心已纳入全国各大城市的重点布局和规划 中,深圳、武汉、珠海、西安等城市均已建成人 工智能计算中心并投入运营,成都、南京、许昌 (中原)等城市正在建设中,北京、上海、杭州、 广州、大连、青岛、太原、南宁等地的人工智能 计算中心建设也在陆续规划中。我国政府统筹建 设的人工智能计算中心,多采用国产通用处理器 和 AI 加速器技术,以华为N腾、寒武纪思元等国内 AI 芯片为主。
华为、寒武纪都是被美国制裁的企业,而我国芯片相关的生态尚在成长,这是很多朋友对我国AI算力抱有悲观预期的原因。
但很多人容易忽略的是,商用芯片其实远不如消费终端芯片那样消耗量大,储备十万个手机SoC可能不够推出一款新产品,但储备十万个计算卡,在全国主要城市建设数据中心绰绰有余。
受益于政府(投资建设方)和华为(承建方)的有备无患,现有的AI算力建设需要的芯片并不存在瓶颈。
但芯片只是一部分,让芯片的算力能够供应到算法模型上,中间还隔着一套软件底座,比如华为N腾将这部分称之为“软件基础设施”[7]
这方面过内做的比较好的,有同样N腾生态下的MindSporeN思和百度的PaddlePaddle飞桨。
在Papers with Code趋势(trends)统计中,这两个框架是国内唯二会在发布论文中使用的AI框架。[8]
虽然在整个生态构建上,N思和飞桨都有很长的路要走,但目前也算是开了个好头,尤其华为N腾生态实现了从硬件到软件的垂直打通,未来具有极高的潜力。
预测未来本来就是人类不擅长的事,尤其在十年这样的跨度下。
更何况,才疏学浅,只敢简单聊聊最近感受到的一些趋势:
互联网公司因为较高的利润以及自身具有的软件优势,实际上是我国最早一批拥抱AI的企业。而在工业领域则不同,如果没有国家的引导,工业企业拥抱AI必须同时满足人力成本上升、和AI成本下降两个条件。
而人口结构的变化以及上文聊到的我国在AI领域的积累,实际上正逐渐为工业企业满足拥抱AI所必须的条件。
这方面其实并不一定需要特别高精尖的算法,而是以解决实际工程问题为主,不存在可行性问题。
现在的AIGC模型实际上都在烧钱赚吆喝,因此几乎展露出了0成本的优势,所以表现出了巨大的冲击。
但其实AIGC背后模型的运营成本,在短期内并不会下降很多,在“退烧”后,只有现有成本高于大模型运行成本的工作会被淘汰。
对普通人来说,会调用个AIGC的接口输出个内容,实际上不是什么技术含量高的工作,类比的话可能是汽车刚出来的时候汽车司机的角色,普通人能关注的点,主要还是不要去做马车司机。
专业的数据标注,依赖于标注者专业的知识,比如医疗诊断图像的标注,不可能交给软件工程的本科生来完成。
有经验的专业人员,比如医生和工程师,并不会在短期内被AI替代,而会在将来的一段时间内,因为可以扮演AI教师的身份,获取更多的机会。
在细分的领域内做到专家会是应对AI替代的优秀策略。
以上。
刘成林 中国科学院自动化研究所副所长、研究员
回答:
中国学者在上世纪70年代初,就开始了模式识别方法和应用研究。到70年代末,人工智能的多个分支方向,如模式识别、问题求解、专家系统等,已全面开展研究工作,并在80年代初陆续成立了相关的学术组织。70年代最有影响的成果,是吴文俊于1978年发表的关于几何定理及其证明的论文,提出了几何定理机器证明的新方法,通过一系列工作形成了数学机械化研究领域。21世纪初,中国在模式识别、机器学习、计算机视觉等方向的科研水平快速接近国际先进水平,一批青年学者快速成长。
当前,中国在人工智能的智能感知(模式识别)、认知推理、自然语言处理、机器学习、智能机器人、智能博弈、大模型等各个分支方向,全面开展了深入的研究工作,整体研究水平与美国非常接近。根据《2022斯坦福AI指数报告》,中国在AI领域国际期刊上发表论文数和被引次数都超过美国,在顶级会议上发表论文数也超过美国,但会议论文被引次数明显落后于美国。中国在人工智能领域的高端人才(如高被引学者)数量也大幅落后于美国。
中国在人工智能各个方向技术的跟踪、扩展和应用都很快,但基础理论方法的原创能力与美国还有明显差距。当前流行的深度学习基本思想和主要算法、自监督学习和大模型等理论,都是国外学者首先提出来的。最新发布的大模型ChatGPT和GPT-4甚至重新拉大了中国与美国的差距。
当前大模型虽然在内容生成、对话和交互等方面展示出很强的能力,但在可解释性、常识推理、安全可信、自适应等方面仍有明显不足。人工智能在理论和技术方面还有很大的发展空间,还有很多问题有待解决。下面是一些值得重视和关注的方向:
1) 类脑智能(脑启发智能),包括类脑认知计算模型、类脑学习、类脑芯片等,旨在为类人智能系统的实现提供思想方法和硬件支撑。
2) 深度学习理论和可解释性,包括已有模型算法的理论分析、新型可解释模型与方法等。
3) 数据和知识联合驱动的方法,包括神经系统与符号系统的融合学习与推理等。
4) 安全可信人工智能模型与方法,包括安全性、鲁棒性、可解释性、可信度衡量等。
5) 通用人工智能理论与方法,使智能体具备开放环境下自主感知、学习、交互、决策行动等能力。
6) 人机融合方法与系统,包括人机混合协同、脑机融合等。
7) 感知、认知、交互、行动于一体的智能系统,如类人智能机器人和自主无人系统。
8) 复杂系统智能协同与进化,包括多智能体协同、博弈、智能涌现、自主进化等。
9) 开源开放的人工智能基础模型,促进学术研究和产业应用。
10) 人工智能的伦理与治理,从技术研究和法律法规制定的角度同时开展,使人工智能服务于人类,防止被误用和滥用。
中兴联合中移动首发5g商用系统 中兴通讯联合广东移动腾讯开通5g
中兴联合中移动首发5g商品,中兴联合中移动首发5g商城,中兴移动属于哪个运营商,中兴移动属于中国移动吗?近日,中兴通讯联合中国移动研究院和重庆移动梁平分公司率先完成5G车联网新技术试验中的网络性能测试。
本次试验基于5G现网进行,包括车联网场景中面向智能辅助驾驶的信息交互类、协作感知类等业务,覆盖了23个车联网高优先场景,重点测试了5G端到端时延、可靠性等性能指标。此次试验有效验证了5G网络对车联网典型业务场景的支持能力。
中兴通讯高度重视5G车联网发展,协同中国移动研究院以及重庆移动快速确定测试方案,高效组建专业的测试队伍,率先完成5G车联网新技术试验的第一阶段测试。
后续,中兴通讯将持续加大技术研究,与运营商及产业合作伙伴一同推进组网、业务性能等全方面的合作验证,积极推动5G车联网产业生态走向成熟。