openai对手 openai团队有多少人
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
雷锋网 AI 科技评论按:各位读者想必今天一睁眼就被「OpenAI 的人工智能在 DOTA 5v5 比赛中也打败了人类选手」的新闻刷屏了。OpenAI 开发的 DOTA AI 去年在 1v1 solo 中打败顶级职业选手 Dendi 和 Sumail之后,紧接着就放出豪言还要在 5v5 的 DOTA 比赛中击败人类,这一天仿佛这么快就到来了。
5v5 AI,一个新的台阶,不过这个 AI 其实还比较初级DOTA(以及 DOTA2)是目前最火热的电子竞技游戏之一,也是当之无愧的职业比赛规模最大、奖金最高的游戏。DOTA 游戏有很高的难度,对人类玩家来说都需要很长的学习时间,因为 DOTA 中有上百种英雄、上百种物品、多种游戏策略、不同英雄有不同的玩法、不同的英雄组合之间也有独特的技能和装备配合;除此之外玩家还需要审时度势,同一个英雄在不同局面中也有不同的玩法。DOTA 的职业比赛也因此而变得激动人心,选手的局部小操作和整个团队改变战局的战略执行都会被玩家们津津乐道。
复杂的英雄、物品、配合、长短期策略结合等方面正是我们长期认为 DOTA 这样的游戏对现阶段的 AI 来说过于困难的原因。而且除了这些人类眼中的认知难题之外,DOTA 游戏的行动空间还非常庞大。相比于围棋中每一步操作只需要在棋盘上剩余的空位中选一个落子,DOTA 中的行动是非常密集的(每分钟操作在 100 次数量级)、考虑时间长短的(比如持续施法技能)、数值连续的(比如走位)、复杂多值化的(比如购买装备)、信息是部分可观察的(地图上有大量的无视野区域),反馈也可以认为是稀疏的(胜负最为重要),所以主流观点一度认为类似 DeepMind 开发 AlphaGo 时那样的纯粹强化学习自我对弈是无法学会玩 DOTA (以及星际等即时战略游戏)的,过大的行为空间会让训练过程长期停留在没有有效反馈的区域从而无法收敛。层级强化学习被认为是一种有希望帮助训练过程快速走出低效探索的方法,但发展仍不成熟。
OpenAI 对于 DOTA AI 的最终目标是开发出能够打败人类职业选手的 AI。显然这样的目标是无法一蹴而就的,所以他们的指导思想是分步走,从英雄、物品、地图范围、策略都有高度限制的 1v1 比赛开始,然后逐步减少限制,同时逐步改善模型,一步步接近最终目标;去年 TI(国际邀请赛)中 1v1 打败 Dendi,以及在测试比赛中打败 Sumail 的 DOTA AI 就是其中的第一步。对于这样的结果,初看有些意外,但细想之下还是比较合理的。毕竟玩 Atari 游戏我们都已经司空见惯了。
对于接下来的 5v5 AI(名为 OpenAI Five),自然也保留了诸多限制,游戏环境和各位玩家熟悉的样子有诸多不同。OpenAI Five 在这个环境里做了多次迭代更新,4 月 23 日版本首次打败了 OpenAI 自己编写的基于脚本的基准模型,5 月 15 日的版本与 OpenAI 员工队伍(天梯分段 2500,高于 46% 的玩家)打了一胜一负;而 6 月 6 日的版本则在与业余战队(天梯分段 4200,高于 93% 的玩家)和半职业战队(天梯分段 5500,高于 99% 的玩家)的比赛中都赢得了三局中的前两局。
OpenAI Five 目前设定的游戏中的限制有以下这些方面:
比赛双方都使用固定的瘟疫法师、冥界亚龙、矮人火枪手、水晶室女、巫妖 5 个英雄,而不是在超过 110 个英雄中任意选择(显然我们也可以推测出 OpenAI 就是以这组固定的英雄进行训练的)
禁止使用守卫,禁止使用隐身物品(消耗品及装备)
禁止使用幻象和分身
禁止打肉山
禁止购买圣剑、魔瓶、压制之刃、远行鞋、知识之书、眼泪
禁止使用扫描
OpenAI Five 方有五个无敌的信使,不过也禁止使用这些信使看视野以及承受伤害
显然各位 DOTA 玩家一看就知道,仅英雄选择的限制这一项就极大降低了游戏的复杂度;隐身、肉山之类的禁用也缩小了战略战术的选择空间;至于 5 个无敌的信使就更像是对 5 个 AI 之间(也许并不理想的)协作能力的妥协了。
不过,能打败业余和半职业战队的表现毕竟还是有一些特色的,能在三局中赢得前两局也说明了 AI 的策略选择与执行的效果。在几场比赛中 OpenAI Five 的玩法体现出了这些特点:
采取的策略总是放空自己的优势路,攻击对方的优势路(以及到中路的这小半场),以求造成压力、形成优势。(所以人类职业选手到了第三局也就能够反制这样的固定策略了)
OpenAI Five 五个英雄都集结在对方优势路到中塔之间的区域快速主动地组织 gank 并推搭
比赛开始 2 分钟,AI 的 2 级冰女和 2 级毒龙 gank 中路比赛前期给辅助英雄让钱让经验,这让辅助英雄更快地达到最高输出,同时也更快地结束比赛
人类方进攻高地,AI 冰女 BKB 跳大,配合队友击杀对方四人复杂的强化学习任务比预想的要简单?即便游戏中有一些限制,但还是有足够的复杂度,而且我们也看到了 AI 在游戏中的精彩表现。从技术角度来说,这也给了我们新的启发。
正如前文提到的,DOTA 中复杂的行动空间以及对长短期策略结合的需求的让领域内的研究者,甚至包括 OpenAI 的人自己都认为 DOTA 需要层次化强化学习这样的全新的深度学习技术,但其实只通过雷锋网 AI 科技评论也曾介绍过的近端策略优化 PPO就已经达到如此的水平 ―― 至少是在用足够大的规模做训练,以及选用了合适的超参数平衡了探索行为的程度的时候。
OpenAI 使用了256 个 V100 GPU 和 【【QQ微信】】 个 CPU 训练模型,不使用人类数据,80% 的时间自我对弈,20% 的时间和过去的版本对弈。训练中每天进行的游戏数量时长相当于大约 180 年。根据 DOTA 解说 Blitz 评价,OpenAI Five 的补刀只是普通玩家水平,但整场游戏的长期策略执行已经有了职业选手水准。用现有的方法就能达到短期策略和长期策略之间的均衡,算是一项惊喜的发现。
另一方面,OpenAI Five 中使用的模型架构也出人意料地简单。每一个英雄由一个单独的 LSTM 模型控制,而它只是一个单层的、含有 1024 个单元的 LSTM 网络。网络从 Value (DOTA2 制作公司)提供的 BOT API 获取数据,然后通过多个不同的动作输出接口进行控制。
OpenAI Five 的网络架构图OpenAI 对于反馈的设计也别有用心。除了输赢之外也选用了人类选手常用的指标:总财产、击杀数、死亡数、助攻数、补刀数等等。但是为了避免 AI 过于关注这些偏向于短期策略的数据,他们的反馈设计只鼓励 AI 在这些方面做到人类玩家的平均水平。
还有一个项目是 AI 之间的合作。OpenAI 并没有为 AI 之间设计显式的沟通频道,目前他们设计了一个名为「团队精神」的超参数,这个 0 到 1 之间的值会反应每个英雄关注自己单独的反馈和整个团队的反馈之间的比例。在训练中 OpenAI 通过退火来优化这个值的具体大小。
总结虽然我们说到目前的 5【【微信】】 的实际表现不过如此,但以现有的资源和方法就达到了超出预期的效果,这也值得我们反思以往的强化学习研究中,方法与实现是否有诸多做的不完善的地方才导致容易遇到训练困难、表现瓶颈、表现不稳定性等问题;另一方面,在现有方法的威力完全得到发挥的地方,我们也更容易清晰地看到继续提升表现还需要哪些创新。
OpenAI 还会在 7 月 28 日组织顶尖人类职业玩家再与 OpenAI Five 进行比赛,这之前系统还会进行调试更新。我们期待 OpenAI Five 近期能有更新、更强的表现,也期待它早日在无限制的完全展现了 DOTA 复杂程度的环境中再展风姿,更与 OpenAI 全体一起期待这些用于 DOTA AI 的技术能为更多真实世界问题带来帮助。
雷锋网 AI 科技评论报道。
OpenAI 员工数量(虽又击败了人类选手)由ChatGPT中文网发布,转载请联系本站书面授权。 特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。open ai估值290亿美元 openai估值合理么
你好,我是王煜全,这里是王煜全要闻评论。
10月20号的一条消息,根据《华尔街日报》的调研,微软正在跟OpenAI进行新一轮的融资谈判,内容是加大对OpenAI的投资,目的是进一步把AI工具集成到自己的云平台上。
OpenAI成立七年,今年的估值已经窜上了200亿美元。这是什么概念?有投资人计算了一下,这个估值是他们预测的OpenAI今年销售额的500到800倍。用金融分析师的话说,就是800倍的市销率。这么高的倍数,一般会被戏称为“市梦率”。
我们今天就来聊聊OpenAI这家大火的公司,讨论一下它这么高的估值到底是不是梦。
OpenAI是这两年的明星企业,它开发的产品已经得到了广泛的使用。最知名的就是语言模型GPT-3,你只要提要求,GPT-3就会很快完成一篇"命题作文"。已经有成百上千的开发者和公司在使用GPT-3来赋能自己的业务,甚至拿它来创业。
今年大火的AI画画,最早也是OpenAI发起的DALL-E低代码工具,你只要提想法、输入参数,电脑就会自动生成艺术级别的画作。很多商业绘画师都在质疑,AI会不会导致他们失业?这一波绘画的热潮中,还涌现了Midjourney、Stable AI等初创公司,有的已经是独角兽了。
因为收购了OpenAI,让微软获得了排它性权利,那就是OpenAI在把新技术推向市场的时候,优先考虑微软。所以今年OpenAI发布DALL-E 2的时候,微软就迫不及待把它集成到自己的软件里了,包括Office系列、搜索平台Bing的图片生成器。
据说,微软这次跟OpenAI的最新谈判,其中内容之一就是进一步加强排它性,比如只有微软可以用,别的云平台竞争对手尤其是亚马逊和谷歌,会被限制使用。
这也引发了很多争议,有人开始怀疑微软是不是又要开始搞垄断了。但不可否认的是,微软在帮助OpenAI商业化上起到了巨大的作用。如果没有微软云平台的助力,OpenAI可能还在为着价格昂贵的计算资源而挣扎!
微软收购OpenAI的关键原因之一,跟CEO纳德拉 (Satya Nadella) 这两年提出的“低代码开发”的云战略相吻合,也就是帮助没有编程基础的人掌握微软的软件。我认为这是促成OpenAI实现进一步价值提升的重要因素。人工智能本身就是一种学习甚至复制人类经验的技术,而通过提供低代码甚至0代码的人工智能工具,会让更多用户参与到这个生态里来。
比如,现在微软的不少编程软件都用上了GPT-3语言,开发者只需要说明自己想在App里实现什么功能,就可以自动生成代码了。这项工具已经集成到了开发者社区GitHub里面,还引发了社交平台上的热烈讨论:既然我用大白话都可以实现编程,程序员是不是也要被取代了?
最近的一个行业案例是美国最大的汽车零售平台CarMax,利用OpenAI的开发工具把10万条客户评论直接进行了分析,根据客户的表达情绪分类成正面、中性和负面,还提取了关键字摘要,在公司战略上起到了很大的帮助。CarMax的首席技术官说,如果没有人工智能,这项工作要人工编辑团队耗费11年才能完成。
利用微软云和OpenAI工具来创业的也有很多。比如一家叫做Jasper AI的公司,利用GPT-3来为用户提供写作服务,包括各种类型的博客文章、或者商业化的推广软文,据说2022年的年收入预计能达到8000万美元,估值已经超过了15亿美元。
如今,不管是用OpenAI来赋能自己的业务,或者是自己创业,都已经形成了一个不可逆转的趋势,我相信未来规模还会不断扩大。嗅觉敏锐的投资人自然不会放过这样的机会,不断推高了OpenAI泡沫般的估值。
OpenAI之所以带给人们巨大的想象空间,一方面自己确实有不错的研发基础,但另一方面,我认为微软云平台的价值起到的作用更大。因为云计算能够实现广泛的市场覆盖,提供算力支持;同时低代码开发的战略方向,让技术门槛大大降低,让普罗大众变身专业内容制作者、程序员、绘画师,进一步推动越来越多的人迁移到云上。
根据纳德拉的战略规划,他未来还要把OpenAI的技术集成到更多的软件里去,比如我们每天都在使用的Office、远程协作平台Teams,不再是资深IT程序员的专属了。这些软件在未来还会焕发出新的生命力,带给用户更多的惊喜。
纳德拉认为,AI的下一个阶段,就是人工智能的"全民化",人工智能会以基础技术和工具的形式提供给所有人,任何个人、组织、企业都可以利用人工智能来创造出人工智能解决方案,满足自己的需求。
就像在15世纪50年代,全欧洲只有3万本书,每一本都是修道院的人手工制作的。《谷登堡圣经》是欧洲第一本使用活字印刷技术制作的书,在之后的50年内,欧洲的图书数量迅速增加到大约1200万册,引发了文化、科学和艺术等领域的复兴。
人工智能也会遵循类似的轨迹,在未来会真正渗透到各种应用、服务和基础设施中。在这个大趋势中,能够规模化地提供AI工具和服务,我认为这才是OpenAI能拿到这么高估值的原因。有想法、有创意的创业者们,人工智能的新的产业机会已经出现了,抓紧时间开始行动吧。
如果有什么令你困惑的问题,欢迎加入我们的科技特训营,我们一起深入探讨,找到最好的创业机遇和方法。欢迎关注全球风口微信号,报名加入!
王煜全要闻评论,我们明天见!
OpenAI 估值(估值200亿)由ChatGPT中文网发布,转载请联系本站书面授权。 特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。