美参议员AI生成开场演讲!ChatGPT之父惊呼:AI危险,请监管我们
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
ChatGPT之父舌战国会山!
OpenAI欲与政府联手,权力通天
来源:新智元(微信号【【微信】】)授权互联网思想(wanging0123)
【导读】Sam Altman也迎来「周受资时刻」了,在国会山听证会上,他备受议员尊敬。OpenAI和政府一联合,他是要成为rulemaker、登顶硅谷之王了?
上次是周受资,这次,轮到了Sam Altman。
不过这一次,国会议员对他的态度截然不同――友好,耐心,做足了功课,虚心请教。
北京时间昨晚,【【淘密令】】在美国参议院就AI技术的潜在危险作证,并敦促立法者对制造先进AI的组织实施许可要求和其他法规。
Sam Altman不用接受刁钻的问话,他坐在席位上游刃有余、侃侃而谈,再次向世界证明:作为全世界最受瞩目的初创公司CEO,他在书写着科技世界的规则和未来。
面对美国国会,Sam Altman再次斩钉截铁地保证:在未来六个月内,OpenAI坚决不会训练GPT-5。
同时, 他也对全世界发出警告:AI有可能会对世界有害,为了应对日益强大的AI风险,我们需要加强监管和立法,而政府的干预极为重要。
为啥Altman对政府监管如此积极呢?
显然,只要成为规则制定者,就能在竞争中赢者通吃。
而对于在硅谷靠着「社牛」属性闯出一片天地的Altman,和政府打交道,简直轻松得如同探囊取物。
用AI生成的开场演讲
作为科技界异军突起的新力量,OpenAI在成立8年后,在今年以迅雷不及掩耳之势搅动了全世界,逼得所有科技公司都参与进了一场以ChatGPT为起点的全球内卷。
这场全球AI军备竞赛,让不少专家警铃大作。
不过这次听证会,参议院的议员们并没有批评OpenAI的技术带来的混乱,而是谦逊地就ChatGPT的潜在规则征求了证人们的意见,对Sam Atlman的态度是肉眼可见的友好和尊敬。
?
听证会一开始,参议员Richard Blumenthal使用了声音克隆软件复制自己的音色,让ChatGPT写了一段开场白,使用数小时的演讲训练了一个文本到语音生成器。
此举证明,国会「拥抱AI」的态度旗帜鲜明。
AI危险,请监管我们
这一场听证会上,立法者明显非常兴奋,与他们曾经对小扎和周受资步步紧逼的质疑形成了鲜明对比。
参议员们没有喋喋不休地谈论过去的错误,而是对AI可能带来的好处充满渴望。
而Altman开门见山地告诉参议院:AI技术可能会出错。
他表示,自己很担心人工智能行业对世界造成重大伤害(cause significant harm to the world)。
「如果AI技术出错,造成的后果不堪设想。我们需要对此发声:我们希望与政府合作,防止这种情况发生。」
「我们认为,政府的监管干预对于减轻日益强大的AI模型的风险,至关重要。比如,美国政府可以考虑将许可和测试的要求结合起来,以开发和发布超过能力阈值的AI模型。」
Altman表示,自己非常担心选举会受到AI生成内容的影响,因此在这方面需要有足够的监管。
对此,参议员Dick Durbin表示,大公司来到参议院「恳求我们的监管」,是很了不起的行为。
Altman提出三点方案:
怎么监管?Altman早就替政府想好了。
在听证会上,他提出一个成体系的方案。
1. 成立一个新的政府机构,负责为大型 AI 模型颁发许可,撤销不符合标准的模型的许可。 而对于能力远达不到最先进的大模型的技术,他认为不需要使用这种许可监管制度。国会可以「定义能力阈值」,免除小型公司和研究人员可能遇到的监管负担,鼓励创新。 2. 为 AI 模型创建一套安全标准,包括对其危险能力的评估。 例如,模型必须通过安全测试,比如它们是否可以「自我复制」和「流出到监管之外」。 3. 要求独立专家对模型在各种指标上的表现进行独立审计。 当参议员问他是否愿意担任这个角色时,Altman说:我对目前的工作感到满意,不过他很愿意提供一个名单供国会挑选。
Altman说,因为AI模型可以「说服、操纵、影响一个人的行为、信仰」,甚至「创造新的生物制剂」,因此,非常需要许可。
对所有超过一定计算能力阈值的系统进行许可会更简单,但Altman表示,自己更愿意根据特定能力划定监管线。
那OpenAI自己的模型安不安全呢?
Altman一再表示,大家可以放心。
他说,GPT-4模型比其他任何类似模型做出的回应都会更有意、更真实,并且一定会拒绝有害的请求,因为GPT-4经过了广泛的预发布测试和审计。
「在发布任何新系统之前,OpenAI 会进行广泛的测试,聘请外部专家进行详细审查和独立审计,改进模型的行为,并实施强大的安全和监控系统。」
「在发布GPT-4之前,我们花了六个多月的时间进行广泛的评估、外部红队和危险能力测试。」
并且在上个月,ChatGPT的用户已经可以关闭聊天记录,防止自己的个人数据被用来训练AI模型了。
不过呢,也有眼尖的群众发现了「华点」,Altman的提议中,并没有涉及到公众热议的两点――
1. 要求AI模型为其训练数据公开来源。 2. 禁止AI模型使用受到知识产权保护的作品进行训练。
嗯,就是说,Altman非常巧妙地回避了这两个争议点。
Altman对于AI安全规则的提议,议员们大为赞许,并且偶尔会对他的证词表示感谢。参议员R-LA甚至向Altman抛出了橄榄枝,问他是否有意在国会创建的监管机构工作。
国会决心监管人工智能,早有前兆。本月初,Altman同谷歌、微软和英伟达的CEO一同在白宫会见了副总统Kamala Harris,讨论了负责任AI的发展。
而早在去年,白宫就曾提出「人工智能权利法案」,向业界提出各种要求,比如防止歧视。
类比原子弹,建议成立类似国际原子能机构的国际组织
参议员提出,把AI比作原子弹的说法。
而Altman参考世界各国政府监管核武器的做法,提出了组建一个类似于国际原子能机构的机构,来为该行业制定全球规则的想法。
OpenAI在未来六个月内不会训练GPT-5
在4月份Lex Fridman的第2轮访谈中,Sam Altman言之凿凿地说:「我们现在并没有训练GPT-5,目前只是在GPT-4的基础上进行更多的工作而已。」
这次听证会上,Altman更是直接承认,OpenAI在未来6个月内,没有训练可能成为GPT-5的新模型的计划。
而这应该意味着,谷歌将在今年晚些时候拥有其迄今为止最强大的人工智能系统――Project Gemini。
据说,Gemini专为存储和调度等未来创新而设计,不仅从一开始就是多模态的,而且在集成工具和API方面效率很高。目前正由新成立的Google Deepmind团队研发。
马库斯:OpenAI自称为了全人类,可数据不透明
纽约大学心理学和神经科学教授Gary Marcus也出现在了证人席上。
他的攻击性甚至比国会议员们还要强。
他对Sam Altman发出的提问,可谓「招招致命」。
OpenAI成立的宗旨不是造福全人类么,如今为什么跑去和微软结盟?
OpenAI不Open,GPT-4的训练数据不透明,到底是几个意思?
马库斯总结道:我们拥有前所未有的机会,但我们也面临着企业不负责任、广泛部署、缺乏适当监管和不可靠的可怕风险
在马库斯看来,Open和微软的行事都大有问题。
曾经微软的必应AI悉尼,表现出了一系列令人震惊的行为。
「悉尼的问题很大,如果是我,会马上把它从市场上撤下,但微软并没有。」
马库斯表示,这件事给自己敲响了警钟――即使是像OpenAI这样的非盈利组织,也可能被大公司买下,然后想做什么就做什么。
但现在,人们的观点和生活都在潜移默化地被AI塑造和改变,如果有人故意利用AI技术,用于不良的目的呢?
马库斯对此表示非常担心。
「如果让一种技术官僚和寡头政治相结合,那少数公司就可以影响人们的信仰,这是真正的风险所在......让少数玩家使用我们根本不知道的数据来做到这一点,这让我感到害怕」
Altman表示AI界并不存在垄断
针对一些常见的法律监管方面的问题,看得出来Altman早就成竹在胸,给各位参议员们安排得明明白白的。
参议员说,他对人工智能的「最大担忧」之一是「这种大规模的企业垄断」。
他举了 OpenAI 与科技巨头微软的合作为例。
Altman表示,他认为能够制造大模型的企业数量相对较少,反而可能会更加方便监管。
例如,大型的生成式 AI,只有少数公司能够制造,但是竞争一直是存在的。
给大模型建立法律责任
美国国会 1996 年通过的第 230 条促进了社交媒体的兴起,该条款保护网站免于对用户的帖子承担责任。
Altman认为:大模型现在没有办法受到230条的法律保护。应该制定新的法律保护大模型不会因为输出内容而承担法律责任。
巧妙回避最致命的问题
奥特曼最初回避了参议员提出的「AI可能造成最严重的后果」。
但在马库斯友好地提醒 Altman 没有回答问题后,这位参议员重复了他的问题。
Altman最终也没有正面回答这个问题。
他说,OpenAI 曾试图非常清楚人工智能的风险,这可能会以「很多不同的方式」对「世界造成重大伤害」。
他再次阐明。应对这个问题就是OpenAI成立的原因。「如果这项技术出了问题,它可能会大错特错。」
其实,在今年早些时候接受「StrictlyVC」采访时,Altman称人类灭绝是最坏的情况。
最终,就连马库斯似乎也对奥特曼软化了。
在听证会快结束时,坐在Altman旁边的马库斯说,「他在谈论恐惧时的诚意非常明显,这种诚意在透过电视屏幕是没法感受到的。」
老练的科技领袖
跟小扎相比,Altman此次听证会的表现十分老练,想来他作为社牛,对与政客们打交道早已游刃有余。毕竟,Altman可是多年前就曾考虑过竞选加州州长的人物。
而且对比去听证会前因为数据隐私和虚拟货币已经「捅了大篓子"的小扎,Altman背后的OpenAI不但几乎没有受到任何公众的指责,还是目前AI领域「万物竟发」局面的最主要开创者。
面对一上来就示好,呼吁对AI进行监管的Altman,这些几乎都是「技术素人」的立法者自然在这位「权威」面前会显得温柔和蔼很多。
所以同样场合之下,Altman身上的压力与小扎相比完全不是一个数量级。
大模型的商业模式
有参议院提出这种担心,如果像互联网社交平台一样,AI产品如果采用广告为主的商业模式,会让操纵性的产品设计和令人上瘾的算法被滥用。
Altman说自己「非常喜欢」订阅模式。
但是OpenAI 确实考虑过在 ChatGPT 免费版中投放广告来从其免费用户那里赚钱的可能性。
参考资料:
【【网址】】/tech-policy/2023/05/ai-technology-can-go-【【微信】】eo-tells-senate/
https://www.theverge.com/2023/5/16/【【QQ微信】】/【【微信】】sam-altman-openai
为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体
chatgpt已应用的上市公司 chatgpt应用端龙头企业
chatgpt,chatgpt官网,chatgpt怎么读,chatgpt怎么用5月16日,大语言模型开源厂商Together宣布获得2000万美元(约1.4亿元)种子轮融资,本次由Lux Capital 领投,Factory、S【【微信】】、First Round Capital、PayPal联合创始人Scott Banister 等跟投。
Together是一家「AIGC开放社区」报道过的类ChatGPT开源厂商,其产品RedPajama-INCITE具备与ChatGPT一样的问答功能。但在几乎同等的性能上算力消耗更低,普通笔记本就能跑30亿参数模型,甚至5年前发布的RTX 2070显卡也没问题。
目前,市面上类ChatGPT开源平台多如牛毛,几乎每天都有新品推出,例如,Alpaca、Guanaco、LuoTuo、Vicuna、Koala等。为何Together能获得巨额种子轮融资?这是因为Together手握两张王牌。
第一,其开源平台可以商业化,目前市面上多数开源平台都是基于LLaMA开发而成,LLaMA明文规定只能用于学术研究不允许商业化。
第二,Together曾开源1.2万亿token训练数据集(约5T),这在开源界非常罕见。也就是说中小型企业、个人开发者可以无需大规模数据训练就能直接使用其开源产品,进一步扩大了商业化落地空间。
RedPajama-INCITE开源产品介绍
RedPajama-INCITE(以下简称RedPajama)是在5月5日才开源的类ChatGPT产品,主要提供30亿、70亿两种参数,特点是功能强大算力消耗低,可在笔记本、普通显卡运行,适用于中小企业和个人开发者。
30亿参数:主要包括基础款、聊天款和指令调优三个版本。在8000亿token数据集上进行训练,在HELM和Eleuther的测试中比同类的GPT-Neo、Pythia-2.8B更优秀。自动生成的文本丝滑流畅,可以加入拟人化情感。
30亿参数开源地址:【【网址】】/togethercomputer/RedPajama-INCITE-Base-3B-v1
70亿参数:也是在8000亿token数据集上进行训练,RedPajama希望扩大至1万亿。主要包括基础款、聊天款和指令调优三个版本。其中,指令调优版本的测试结果非常棒,甚至高于LLama-7B版本。
70亿参数开源地址:【【网址】】/togethercomputer/RedPajama-INCITE-Chat-7B-v0.1
RedPajama曾开源1.2万亿token训练数据集
今年4月17日,RedPajama曾宣布开源1.2万亿token数据集,帮助开发者训练类ChatGPT大语言模型。(开源地址:【【网址】】/datasets/togethercomputer/【【微信】】ta-1T)
RedPajama完美复制了LLaMA模型上的1.2万亿训练数据集,按照其论文的数据模式从维基百科、GitHub、普通抓取、C4、图书、ArXiv、【【微信】】抓取了1.2万亿训练数据,并进行了数据优化、过滤。
其中,普通抓取渠道获取了8780亿数据,并通过多个质量过滤器进行过滤,包括选择类似维基百科页面的线性分类器。C4获取1750亿,基于标准 C4 数据集。GitHub获取590亿,按许可证和质量过滤;图书获取260亿,包括开放书籍的语料库,并根据内容相似性进行去重。
ArXiv获取280亿,去除了样板文件的科学文章。维基百科获取240亿,基于子集数据删除了样板内容。【【微信】】获取200亿,基于子集数据删除了样板内容。目前,Together正在打造RedPajama V2,这是一个包含2万亿token的训练数据集。
Together表示,非常感谢蒙特利尔大学的AAI CERC实验室,斯坦福基础模型研究中心,Ontocord.ai,Meta AI,EleutherAI,OLCF等学术机构和开源社区的鼎力支持。如果没有他们贡献核心训练代码、架构、数据,根本不可能推出RedPajama。