庆云古诗词

庆云古诗词

dotaopenaisolo openai 五人击败 dota 2 世界冠军

互联资讯 0
dotaopenai,dotaopen查看队友聊天记录,dotaopengl,dotaopgg

就在上周,人类对机器人进行了反击。实际上是在视频游戏中打败了他们。

在一场三强争霸赛中,两支职业战队打败了伊隆・马斯克创建的研究实验室OpenAI开发的人工智能机器人。他们所玩的Dota 2(刀塔:守卫遗迹2)电脑游戏是一款非常受欢迎并且激烈复杂的竞技游戏。而这场比赛对于人工智能来说是一块试金石:这将成为人类所创造的超越人们想象的人工智能的最新衡量标准。

人工智能技术获得了一些重大进展。近年来最引人注目的事例是DeepMind公司的AlphaGo击败了围棋世界冠军,这是一项专家认为至少十年无法实现的成就。然而最近,研究人员已经将人工智能参与视频游戏作为下一个挑战。虽然电子游戏并没有像AlphaGo和国际象那样广泛的知名度,但实际上它们的玩法要困难得多。这是因为游戏玩家将会隐藏各种信息,复杂的游戏环境也在不断变化,以及无法轻易模拟的战略思维。换句话说,这更接近我们希望采用人工智能在现实生活中解决的各种问题。

OpenAI的失败只是人工智能进步的一个坎坷

Dota 2是一个特别受欢迎的人工智能测试场,OpenAI公司拥有最好的Dota 2机器人。但在上周,OpenAI输了。那么发生了什么事?我们在人工智能的能力上达到了某种上限吗?这表明某些技能对于计算机而言过于复杂吗?

其答案是否定的。机器学习研究员兼Dota 2游戏粉丝Stephen Merity表示,这只是一个"坎",机器最终将征服游戏玩家,而OpenAI可能会颠覆人们的看法。但首先需要了解人类会获胜的原因,以及实现OpenAI的目标,即使遭到失败,这些做法仍然有用。它将告诉人工智能能够做什么,不能做什么,以及将来会发生什么。?

Dota 2游戏截图,这是一个幻想竞技的战斗游戏,两组五人战队为了摧毁彼此的基地而战斗。游戏玩法很复杂,比赛通常持续超过30分钟。

像机器人一样学习:如果一开始没有成功

首先,我们了解一下上周的比赛。这些游戏机器人是由OpenAI创建的。而作为其广泛的研究范围的一部分,OpenAI希望开发出"造福全人类"的人工智能。而这证明了许多不同的技术研究是合理的,并吸引了一些该领域最好的科学家参与。该实验室表示,通过训练Dota 2机器人团队(被称为OpenAI Five),它希望开发能够"处理现实世界的复杂性和不确定性"的系统。

这五个机器人(独立操作,但使用相同的算法训练)通过强化学习进行训练,以操作Dota 2游戏。这是一种常见的训练方法,基本上是大规模的反复尝试和试错(它有自己的弱点,但它也会产生令人难以置信的结果,其中包括AlphaGo)。他们并没有采用Dota 2的游戏规则对机器人进行编程,而是将它们直接丢进游戏中,让他们自己解决问题。 OpenAI的工程师通过他们完成某些任务进行奖励(比如杀死对手或赢得比赛)来加快这个过程,但仅此而已。

这意味着机器人在开始训练时完全随机操作,随着时间的推移,他们学会将某些行为与奖励联系起来。正如人们可能想到的,这是一种非常低效的学习方式。其结果是,机器人必须以加快游戏速度,每天训练获得的经验相当于人类180年的训练时间。正如OpenAI公司的首席技术官和联合创始人Greg Brockman在今年早些时候所说的那样,如果需要一个12,000到20,000小时的练习才能掌握某项技能,那么机器人每天都要经历"100个人的一生的经历"。

花费这么长时间的部分原因是Dota 2游戏非常复杂,远远超过棋盘游戏。两个五人战队在游戏地图上相互对峙和战斗,充满了无法预测的角色、障碍物,以及可破坏的建筑物,所有这些因素都对战斗的形势和进程产生影响。游戏玩家必须联合各种力量与对手作战将其摧毁。他们可以获取或购买数百种物品来提升他们的能力,每个玩家(其角色超过了100个)都有自己独特的动作和属性。Dota 2游戏的每场比赛都像是一场小型古代战争,其目标是争夺领土,并努力打败对手。

人工智能需要处理游戏中的所有数据,以便以更快的速度进行,这是一个巨大的挑战。为了训练他们的算法,OpenAI必须具备大量的处理能力,大约采用了256个GPU和128,000个CPU。这就是为什么IT专家经常将OpenAI Five作为一个工程和研究项目进行讨论和研究的原因:让系统正常运行具有挑战性,更不用说击败人类玩家了。

"就现代数据驱动人工智能方法所能处理的复杂程度而言,OpenAI Five比DQN或AlphaGo更加令人印象深刻。"斯坦福大学计算机科学博士生Andrey 【【微信】】指出。【【微信】】表示,虽然这些较旧的项目在纯粹研究的层面上引入了重要的、新颖的想法,但OpenAI Five主要是在以前的不可思议的情况下部署现有的结构。无论是规模和输赢都很大。

今年早些时候,OpenAI Five击败了一支业余游戏玩家团队作为其能力的基准。

机器人仍缺乏游戏计划

但是从抛开工程的角度而言,人工智能机器人输掉了这两场比赛,那么是机器人还不够好吗?答案是:仍然非常好。

在过去的一年中,人工智能机器人已经逐步掌握了变得更加复杂的游戏规则,从1对1的比赛开始,最后达到5v5的竞技。然而,他们还无法应对游戏的复杂性。在国际比赛中,一些限制被取消了。令人关注的是,机器人不再拥有无懈可击的信使(向玩家交付物品的NPC)。这些以前是他们游戏风格的重要支柱,因为获得治疗药水,可以帮助他们进行持续的攻击。在一些游戏中,他们不得不担心他们的供应线被取消的问题。

机器人是否掌握长期战略是一个关键问题

虽然对于这两场比赛仍在分析,但人们的初步共识是机器人玩得很好,它们都有自己的优点和缺点,人类玩家可以利用它们的弱点获得比赛的优势。

这两场比赛具有非常高的水平,人类玩家首先在游戏中领先,然后是机器人,最终人类玩家获得了胜利。但在这两场比赛中,一旦人类玩家获得了相当大的优势,就会发现机器人很难挽回败局。游戏评论员猜测这可能是因为人工智能首选的是"以90%的确定性获得1分,而不是以51%的把握赢得50分"。(这一特点在AlphaGo的游戏风格中也很明显。)这意味着OpenAI Five被用于研究稳定但可预测的胜利。当机器人失去了领先优势时,他们无法进行必要的冒险以重新获得胜利。

OpenAI Five在国际上的第二场比赛场面

不过这只是猜测。正如人工智能应用情况一样,猜测机器人背后的确切思维过程是不可能的。我们所知道的是这些机器人在游戏中的短期表现比较出色,但与人类的长期战略比赛时则十分棘手。

OpenAI Five的判断非常准确,可以通过法术和攻击积极地挑选目标,并且通常对它们遇到的对手构成威胁。法尔茅斯大学的人工智能游戏研究员Mike Cook和一名狂热的Dota玩家在现场直播了这些战斗,他们将机器人的风格描述为"催眠"。"它们精确而清晰地开展行动。"Cook 表示,"在通常情况下,人类玩家会在赢得一场战斗之后,将会稍微放松警惕,期待敌人队撤退,并重新集结。但机器人不这样做。如果它们看到获胜机会,就会一直进攻。"

在漫长的游戏比赛中,机器人们似乎在蹒跚而行,想一想很难在10分钟或20分钟的时间的比赛获得优势。它们在两场比赛中的第二场对阵一支中国职业游戏战队,这个战队选择了不对称的策略。一名玩家收集资源以不断加强战队的实力,而其他四人则对机器人战队进攻或干扰。然而,机器人似乎没有注意到发生了什么,并且在游戏结束时,人类战队中将会有一个消灭人工智能对手的超强玩家。"这是人类玩Dota游戏的风格。但对于机器人来说,这是极其长期的规划。"

这个战略问题不仅对OpenAI很重要,对于人工智能的研究也更为重要。缺乏长期规划通常被视为强化人工智能学习的一个主要缺陷,因为使用这种方法创建的人工智能通常强调及时支付而不是长期回报。这是因为构建一个长期工作的奖励系统是困难的。如果无法预测何时发生这种情况,那么如何训练机器人推迟使用强大的法术,直到敌人聚集在一起才使用?或者只是因为没有使用某个咒语而不给一个小奖励吗?如果机器人决定永远不使用它呢?这只是一个基本的例子。Dota 2游戏通常持续30-45分钟,玩家必须不断思考什么行动将导致长期的成功。

然而,重要的是要强调,这些机器人的行为并非仅仅是粗心大意或是寻求回报。控制每个玩家的神经网络具有学习某些策略的记忆组件。它们对奖励做出反应的方式是考虑未来的收益以及更直接的收益。实际上,OpenAI表示其人工智能代理程序的执行程度远高于其他任何类似系统,其"奖励半衰期"为14分钟(粗略地说,这是机器人可以等待未来回报的时间长度)。

【【微信】】撰写了大量有关强化学习局限性的文章。他表示,比赛表明强化学习可以处理比大多数人工智能研究人员想象的复杂程度更高的情况。但他补充说,比赛的失败表明需要新系统管理长期思维。(不出所料,OpenAI的首席技术官对这种说法并不认同。)

与比赛的结果不同,这里没有明显的结论。对机器人是否成功的分歧反映了人工智能中未解决的更大问题。正如研究员Julian Togelius在Twitter上所指出的那样,"我们如何才能开始区分长期战略和看起来像长期战略的行为?这有关系吗?我们现在所知道的是,在这个特定领域,人工智能还不能超越人类。"

open ai 用哪种语言开发 openai什么语言开发的

作为一名合格的(准)程序员,必做的一件事是关注编程语言的热度,编程榜代表了编程语言的市场占比变化,它的变化更预示着未来的科技风向和机会!

快一起看看本月排行有何看点:

4月Tiobe排行榜前15名

*以上数据来源&#【【网址】】/tiobe-index/,如侵删

在这个月,编程排行榜变化不大,排在前5的编程语言的市场份额都有增长!没有意外,Python依旧稳居第一!

Python霸占榜首 只因它真的很强

Python,年龄可能比很多读者都要大,但是它在更新快速的编程界却一直表现出色,甚至有人把它比作是编程界的《葵花宝典》,只是Python的速成之法相较《葵花宝典》有过之而无不及。

Python简洁,高效的特点,大大提升了程序员的编码速度,极大的提高了程序员的办公效率,比如用其他编程语言5、6行代码才能整明白的,用Python可能1-2行就能解决。

最近,火遍全球的OpenAI团队也被曝出所使用的后端编程语言是Python!随着人工智能技术的发展,Python被使用得越来越频繁,黑马大佬曾说,在整个AI界,Python就是默认的开发语言!

△ 截图来源知乎,如侵删

现在,不仅互联网企业会使用Python编程语言,在职场人的工作中,Python也应用得上。

学Python之前:这玩意真有传说中那么好么?

学Python之后:唉呀妈呀,真香~

别人花2天时间处理的Excel数据,你用Python 只花1小时;

别人靠胆量摸鱼,你靠Python自动化办公,光明正大的摸鱼;

别人一个网站一个网站找资源时,你用Python轻松全找到;

……

从此,再难的工作在你眼中都不再是事儿~升职加薪全有你!Python就是这么实在!

所以有人说这世上只有2种人,一种学了Python的人,一种在学Python路上的人。

Python+ 已成利器 在大数据领域中大放异彩

Python,成为职场人追求效率的利器,因为不管什么工作,数据都会是工作的一部分,有数据的地方,就有Python!

我们知道,随着互联网的发展,线上数据是以量级增长的,在巨大的数据中暗藏着很多有价值的信息,而Python可用于发现并提炼这些有价值的信息,在数据挖掘、数据分析、数据可视化等步骤中发挥关键作用!

现在,在数字化转型的推动下,越来越多的企业意识到大数据的魅力,并不断在这个领域投入资金,Python+大数据开发相关人才也备受青睐!

据《新职业――大数据工程技术人员就业景气现状分析报告》显示,在2025年大数据人才需求量将达到250万!

△ 《新职业――大数据工程技术人员就业景气现状分析报告》

在这一缺口之下,大数据人才的薪资也一直在飙升,不仅在一线城市能找到高薪工作,在新一线、省会城市的就业也非常出色!

薪资高、缺口大,自然成为职场人的“薪”选择!

任何学习过程都需要一个科学合理的学习路线,才能够有条不紊的完成我们的学习目标。Python+大数据所需学习的内容纷繁复杂,难度较大,为大家整理了一个全面的Python+大数据学习路线图,帮大家理清思路,攻破难关!

Python+大数据学习路线图详细介绍

学前导读:从传统关系型数据库入手,掌握数据迁移工具、BI数据可视化工具、SQL,对后续学习打下坚实基础。

1.大数据数据开发基础MySQL8.0从入门到精通

MySQL是整个IT基础课程,SQL贯穿整个IT人生,俗话说,SQL写的好,工作随便找。本课程从零到高阶全面讲解MySQL8.0,学习本课程之后可以具备基本开发所需的SQL水平。

2022最新MySQL知识精讲+mysql实战案例_零基础mysql数据库入门到高级全套教程

学前导读:学习Linux、Hadoop、Hive,掌握大数据基础技术。

2022版大数据Hadoop入门教程 Hadoop离线是大数据生态圈的核心与基石,是整个大数据开发的入门,是为后期的Spark、Flink打下坚实基础的课程。掌握课程三部分内容:Linux、Hadoop、Hive,就可以独立的基于数据仓库实现离线数据分析的可视化报表开发。

2022最新大数据Hadoop入门视频教程,最适合零基础自学的大数据Hadoop教程

学前导读:本阶段课程以真实项目为驱动,学习离线数仓技术。

数据离线数据仓库,企业级在线教育项目实战(Hive数仓项目完整流程) 本课程会、建立集团数据仓库,统一集团数据中心,把分散的业务数据集中存储和处理 ;目从需求调研、设计、版本控制、研发、测试到落地上线,涵盖了项目的完整工序 ;掘分析海量用户行为数据,定制多维数据集合,形成数据集市,供各个场景主题使用。

大数据项目实战教程_大数据企业级离线数据仓库,在线教育项目实战(Hive数仓项目完整流程)

学前导读:Spark官方已经在自己首页中将Python作为第一语言,在3.2版本的更新中,高亮提示内置*Pandas;课程完全顺应技术社区和招聘岗位需求的趋势,全网首家加入【【微信】】 Spark的内容。

1.python入门到精通(19天全)

python基础学习课程,从搭建环境。判断语句,再到基础的数据类型,之后对函数进行学习掌握,熟悉文件操作,初步构建面向对象的编程思想,最后以一个案例带领同学进入python的编程殿堂。

全套Python教程_Python基础入门视频教程,零基础小白自学Python必备教程

2.python编程进阶从零到搭建网站

学完本课程会掌握Python高级语法、多任务编程以及网络编程。

Python高级语法进阶教程_python多任务及网络编程,从零搭建网站全套教程

3.spark3.2从基础到精通

Spark是大数据体系的明星产品,是一款高性能的分布式内存迭代计算框架,可以处理海量规模的数据。本课程基于Python语言学习Spark3.2开发,课程的讲解注重理论联系实际,高效快捷,深入浅出,让初学者也能快速掌握。让有经验的工程师也能有所收获。

Spark全套视频教程,大数据spark3.2从基础到精通,全网首套基于Python语言的spark教程

4.大数据Hive+Spark离线数仓工业项目实战

通过大数据技术架构,解决工业物联网制造行业的数据存储和分析、可视化、个性化推荐问题。一站制造项目主要基于Hive数仓分层来存储各个业务指标数据,基于sparkSQL做数据分析。核心业务涉及运营商、呼叫中心、工单、油站、仓储物料。

全网首次披露大数据Spark离线数仓工业项目实战,Hive+Spark构建企业级大数据平台