庆云古诗词

庆云古诗词

职途资讯:2023年3月29日 星期三 农历闰二月初八

互联资讯 0

淘宝搜:【红包到手500】领超级红包,京东搜:【红包到手500】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

2023年3月几号,2023年3月日历表查询,2023vj,2023年的3月2号

【微语】不要垂头丧气,即使失去一切,明天仍然握在你手里。

?国内外要闻

1、博鳌亚洲论坛2023年年会正式拉开帷幕。

2、自然资源部等三部门联合发文:鼓励在沙漠、戈壁等区域建设光伏基地。

3、网信办:严厉打击网上恶意损害企业和企业家形象声誉等违法违规行为。

4、全国中成药集采征求意见,报价降幅大于40%可获拟中选资格。

5、上海、杭州、昆明等地近期明确将有序放开设摊、允许外摆。

6、北京拟出台26条措施扶持个体工商户:可减免“六税两费”。

7、厦门放松限购:厦门户籍单身人士可购第二套住房,二孩以上家庭可买三套房。

8、河北沧州一废弃冷库在拆除过程中发生火灾事故,致11人死亡。

9、孟晚舟当值华为轮值董事长

10、国际足联公布最新女足排名:中国位列世界第13亚洲第3。公众号:职途圈

11、国际机票大跳水,多条国际航班票价降至千元以内,业内人士称燃油附加费或继续下调。

12、美国众院一致通过法案,认定中国列为发达国家,旨在剥夺国际组织优惠待遇。

13、日本北海道地区发生6.1级地震,震源深度30千米。

14、韩国拟对中国公民实行过境免签政策,免除申请电子旅行许可制。

15、美国田纳西州一小学发生枪击事件7人死亡,包括3名学生均为9岁,女枪手已被击毙。

企业快讯

1、2023微信公开课PRO・微信之约直播开讲,视频号公布包括付费订阅功能与“原创权益”扶持等多项产品计划

2、阿里巴巴宣布启动“1+6+N”组织变革,成熟一个,上市一个

3、华为投资控股有限公司董事会举行换届选举,孟晚舟4月1日起当值轮值董事长

4、快手三农推出“幸福乡村春耕季”,亿级流量扶持内容创作者

5、货拉拉于港交所提交上市申请:3月28日货拉拉在港交所提交上市申请。其全平台收入由2020年的5.29亿美元增至2022年的10.36亿美元,年复合增长率为39.9%,2022年实现盈利

6、京东集团与博世中国宣布建立战略合作关系,加速供应链数智化转型升级

7、“茅台家族”产品上新:“台源”酒定价156元/瓶,主打“下沉”基层市场

8、顺丰集团发布2022年度报告:营收2674.9亿元、归母净利润61.7亿元,业务量111.4亿票

9、运动科技公司Keep在港交所更新招股书:2022年营收22.12亿元,平均月活3640万

10、亚马逊全球开店亚太区卖家培训中心在杭州正式启用,2023年预计将总计培训近500万人次

政务快讯

1、网信办:去年处置账号680余万个,今年重拳整治9大突出问题

2、市场监管总局:“提质强企”行动去年帮扶企业超5.45万家,提升工业产值超81亿元

3、工信部就国家汽车芯片标准体系公开征求意见,到2025年将制定30项以上标准

4、生态环境部:钢铁超低排放改造累计拉动社会有效投资约2000亿元

5、住建部等15部门联合印发《关于加强经营性自建房安全管理的通知》

6、上海启动规上制造业企业数字化诊断,正制定标准、遴选服务商

7、杭州发布全国首个《大学生创业园服务规范》地方标准

8、江苏计划3年打造1000个“家门口就业服务站”,兜底帮扶10万群众就业

9、浙江经信领域出台17条举措,推进营商环境优化提升“一号改革工程”

10、河南省财政下达资金7.1亿元支持科技创新,服务高质量发展

科技通信

1、Redmi Note 12 Turbo正式发布:首发第二代骁龙7+芯片,售价1999元起

2、中国移动挂牌成立中移智库,打造数字经济领域高端智库

3、自研矩阵再扩充,安谋科技发布新一代“周易”X2 NPU

4、引领创新,中国信通院启动大模型技术及应用基准工作

5、国内首个量子计算产业知识产权联盟成立,“量子计算专利池”填补行业空白

6、搜狗输入法之父马占凯加入王慧文AI团队,打造中国版ChatGPT

文娱影游

1、腾讯WeGame平台举行“游戏之夜S5”:20余款游戏亮相,《无畏契约》开启预约

2、一览科技宣布推出业界首个视频AIGC工作流,“AI编剧”三步即可生成专业脚本

3、全球电影票房第三,《阿凡达:水之道》上线爱奇艺、腾讯视频、优酷

4、迪士尼真人版电影《小美人鱼》确认引进中国内地,档期待定

5、Steam一周销量榜:《生化危机4:重制版》超越Steam Deck登顶

6、迪士尼裁撤开发元宇宙战略的小型部门,裁员约50人。

金融财经

1、上交所:4月1日开展沪市全面实行注册制交易业务全网测试

2、北京银行发布“京彩生活”手机银行APP 7.0暨“智策”零售数字化运营体系

3、科创企业成长上市再添“利器”,浦发银行南京分行“浦创中心”揭牌

4、银保监会批准中国华融入股光大银行,或将成为第四大股东

5、小米消金掌门人更迭:天星数科总裁岳凯出任董事长,首任董事长洪锋个人原因卸任

住房地产

1、华润万象生活:2022年完成行业最大规模并购,管理规模跻身行业第一梯队

2、龙湖商业与南京能谷能源合作,打造南京首座轻资产天街

3、招商蛇口华东区域发布全新品牌主张,以百年新生力量“弘安里”赋能城市更新

4、上海建工:旗下上安物业运维管理总面积近800万平方米

5、龙建股份:中标巴中市恩阳区国家储备林建设项目,施工中标价14.41亿元

零售电商

1、天猫拟与50家头部快消品牌建立“新品”战略合作,覆盖从研发到上市全流程

2、百万门店上京东,京东到家即时零售全国巡回活动首站将落地上海

3、名创优品宣布新拓3个海外市场,全球化战略迈上新高度

4、本来生活与西鲜记合作再升级,共同赋能宁夏盐池滩羊产业发展

5、永辉预制菜自有品牌辉妈到家发布春季上新计划,新品剁椒鱼头表现亮眼

汽车出行

1、比亚迪2022年营收4240.61亿元、净利润166.22亿元,各项核心经营数据均创历史新高

2、蔚来首座第三代换电站正式上线,换电时间缩短20%

3、北汽重卡数字孪生智慧工厂落成投产,北京重卡首台车下线即交付

4、斑马智选亲橙空间在阿里西溪园区正式开业,系首家“斑马智选”门店

5、宇通新能源轻卡T系列产品全球首发,越级而致开启中国新能源轻卡3.0时代

教育培训

1、国家智慧教育读书平台上线,教育部等八部门启动全国青少年学生读书行动

2、网龙2022年营收78.66亿元,教育业务收入43.4亿元创历史新高

3、达内教育2022年业绩:双赛道布局发展稳健,实现净利润8523万元同比扭亏为盈

4、行动教育与瑞士IMD国际管理发展学院达成深度合作,助力企业数字化转型

5、凯文教育携手百度共建中职人工智能实训基地,内蒙古敖汉旗职业中学人工智能实习实训基地揭牌

医疗健康

1、信立泰:拟将控股子公司深圳信立泰医疗器械分拆至科创板上市

2、天康生物:子公司天康制药拟投资8亿元建设动物疫苗研发生产项目

3、中关村:全资子公司拟收购沃达康和普润德方100%股权,拓展医疗器械行业产品布局

4、塞力医疗中标重庆璧山区第二人民医院(全院耗材含试剂)SPD精益化服务项目

5、湖北大学发起成立湖北省合成生物学学会,服务合成生物制造产业高质量发展

6、迈瑞中国区总经理换人,赵宇翔上任

旅游民宿

1、文旅部等四部门将联合举办第五届全国导游大赛

2、海南旅游市场渐热,三亚机场今年已完成3.5万架次飞机起降

3、海昌海洋公园:大连发现王国奥特曼主题娱乐区计划于5月1日正式营业

4、万豪国际集团:预计今年在中国开设47家酒店,超半数为精选服务品牌酒店

5、2023上海旅游产业博览会第一期开幕,打造文旅深度融合的全产业链集群

区块链

1、工信部就《区块链和分布式记账技术标准体系建设指南(2023版)》公开征求意见

2、河南省印发《“河南链”建设实施方案(2023―2025年)》

3、上海黄浦区:对AI、元宇宙、区块链等重点领域技术攻关项目给予资金支持

4、携程商旅加入N世界“元启万象”计划,助力企业差旅服务升级

5、奢侈品巨头Gucci与Yuga Labs合作探索元宇宙中时尚与娱乐的交叉点

国际视角

1、苹果宣布在美国推出Apple Pay Later,允许分期付款、无利息与额外费用

2、微软宣布推出Microsoft Security Copilot,安全系统采用OpenAI技术

3、Meta拟出台新一轮改革措施:减少向部分员工发放奖金,引入年中绩效评估

4、迪士尼启动首轮裁员,计划总减员7000人

5、美国网约车公司Lyft聘请亚马逊前零售主管为新任CEO,两名联合创始人退出日常管理

6、Lyft宣布,其联合创始人、首席执行官Logan Green和总裁John Zimmer将很快辞去日常职务,亚马逊前零售主管Da【【微信】】将接任

融资收购

1、老字号非遗厨具品牌「王源吉」完成千万元级Pre-A轮融资,由江苏老字号产业投资基金独家投资

2、装配式工业化装修整体解决方案提供商「未来盒子」完成千万元级天使轮融资,由青矩创投独家战略投资

3、智能新能源卡车研发制造商「DeepWay」完成7.7亿元A+轮融资,由魏桥创业集团与软银中国资本联同领投,老股东启明创投等跟投

4、抗肿瘤新生抗原疫苗研发和生产商「澄实生物」完成数千万元Pre-A轮融资,由东方富海作为执行事务合伙人的国家中小企业发展基金(成都)交子创投投资

5、半导体自动化设备研发制造商「世禹精密」完成数千万元新一轮融资,由物产中大集团投资有限公司投资

6、高端半导体光刻胶厂商「徐州博康」完成数千万元新一轮融资,由清枫资本投资

7、人工嗅觉传感器研发商「中科微感」完成千万元级天使轮融资,探究资本担任独家财务顾问

8、人机交互产品研发商「元籁科技」完成数千万元天使轮融资,由蓝驰创投独家投资

9、人民币资产跨境交易科技服务商「亚丁金融」完成数千万元A轮融资,由斯道资本投资

10、时空智能大数据服务公司「箩筐」获得2.2亿美元战略融资,投资方为CHINA ORIENT SMART ECOTECH IN【【微信】】



openai这些年做了什么事 openai 训练结果

openai项目,openai公司上市了吗,openai可以做什么,open ai lab 这家公司好不好

原标题:老黄20问OpenAI联合创始人:ChatGPT得益于数据爆发,让AI说“不知道”是难点

智东西(公众号:【【微信】】)

作者 | 李水青

编辑 | 心缘

智东西3月23日报道,昨夜,在GTC大会主题演讲后,英伟达创始人兼CEO黄仁勋化身一名记者,与OpenAI联合创始人兼首席科学家伊利亚・萨特斯基弗(Ilya Sutskever)进行了一场50分钟的深度对话。

这是一场两位风口浪尖的科技圈大佬的巅峰级对话。就在昨天GTC大会上,老黄刚刚推出了ChatGPT专用推理GPU,针对生成式AI、大型语言模型等进行了大优化。他在会上盛赞ChatGPT“震惊世界”:“崭新的计算平台已经诞生,AI的「iPhone时刻」已经到来”。

而OpenAI这边,伊利亚已推动GPT-4和ChatGPT快速落地到搜索引擎、Office工具等微软多个产品,并用开放的API,引爆千行百业和数亿人的生产力革命。

在采访中老黄提到,大约十年前的一次会面中,伊利亚就如同先知般对他说:“GPU会影响接下来几代人的生活”、“GPU可能会对深度学习的训练有所帮助”。而伊利亚也回顾,ChatGPT诞生的源头则要追溯到更早的20年前,而后数据的爆发让质变到来。

伊利亚说ChatGPT实际上做的就是“预测下一个字符”,他坦言现在GPT-4还不及预期,存在逻辑死板、编造信息、不懂装懂等问题,下一步让模型更加可靠,同时学会说“不知道”是一大技术难点。

此外,老黄还与伊利亚探讨了关于摩尔定律、多模态、强化学习、自监督等更多关键问题。本文将两位大佬的对话内容呈现如下,内容做了不改变原意的编辑。

一、溯源:20年前畅想机器像人一样学习,模型只有上百个神经元

老黄:作为打造ChatGPT的最引入注目的顶尖科学家、工程师,你对深度学习技术有什么样的直觉?这一技术为什么会取得如此巨大的成功?

伊利亚:由于深度学习,我们的世界发生了巨大变化。我自己开始的初心是对各种问题有想要的直觉性理解,同时对于人类意识的定义,以及我们人类的智力是如何完成这样的预判,这是我特别感兴趣的地方。

在2002~2003年,当时的我认为“学习”是只有人类才能完成的任务,计算机是无法做到的。当时就想,如果能够让计算机去学习呢?可能会带来更多改变,但当时没有任何进展看起来是有希望的。

很幸运的是,当时我正在上大学,我研究的专业刚好是研究神经网络学习方向。我们希望了解如何通过神经网络去研究深度学习,以及神经网络如何像人类的大脑那样工作。当时的我其实并不清楚我们的工作路径是什么样的,只是觉得这会是有前景的行业。

老黄:那个时候的神经网络的规模是多大?

伊利亚:那个时候神经网络还没有讨论到规模的概念,我们只是有一百或者几百个神经单元,没想过现在居然能发展到现在如此之多的神经单元、以及如此多的CPU单位。

当时我们选用的是一个数学实验室,预算是非常有限的。我们先开始只做了各种各样不同的实验,并收集了各种不同的问题去测试准确度,一点一点去训练神经网络,这也是第一个生成式AI模式的雏形。我们不清楚下一步的方向是什么样的,但后来一想,发展神经网络、深度学习是一个重要节点。

二、节点:2010年明确深度学习研究方向,让老黄准备好GPU

老黄:在2012年这一节点,你就在神经网络领域有所建树。所以你是在什么时间点开始觉得计算机视觉、神经网络和人工智能是未来方向的?

伊利亚:在2012年之前大概两年左右,我逐渐意识到深度学习会获得很多关注。背后坚定的理论基础是:如果神经网络足够深、规模足够大,它就能够解决一些硬核内容问题,关键是需要神经网络兼备深度和规模,这意味着我们必须有足够大的数据库。

我们在优化数据模型上做出很多努力,我们的一个同事基于“秒”做出了神经网络的反馈。你可以不断训练神经网络,从而使得神经网络的规模更大,获得更多数据。有的人会说当时这个数据集大到不可想象,如果当时的算力能够处理这么大的数据,那么一定能触发一场革命。

老黄:当时是我们第一次相遇,你告诉我说,GPU会影响接下来几代人的生活,以及GPU可能会对深度学习的训练有所帮助。你是在什么时候意识到这一点的?

伊利亚:GPU在多伦多实验室中第一次尝试,我们并不清楚到底如何使用GPU、如何让GPU获得真正的关注。后来我们获得越来越多的数据集,我们也清楚传统的模型会带来更多优势。我们希望能够加速数据处理的过程,训练过去科学家从来没有训练过的内容,这是当时触发GPU使用的要点,促进我们不断培养训练神经网络。

三、里程碑:从预测下一个字符,到AI界的iPhone时刻

老黄:我们看到ChatGPT和OpenAI目前已经打破了过去计算机编辑图像的生成方式。

伊利亚:我觉得不是打破了计算机图像的生成方式,也不是打破了一种记录,而是:这样的数据集是显而易见而往往被忽视的,大部分人都是用传统的思维模式去处理数据集,但我们的处理方式“超越式”的,一旦超越就是几步的超越。当时非常艰难,但如果我们能做好,就是帮助人们跨越了一大步。

老黄:我觉得ChatGPT是“AI界的iPhone时刻”,你是如何达到这样的转变时刻的?

伊利亚:当我们开始时也不太清楚如何进行整个项目,而且,我们现在所得出的结论,和当时使用的逻辑完全不同。大家现在已经有这么好用的ChatGPT工具,来帮助大家创造出非常好的艺术效果和文本效果。但在2015年、2016年我们开始时,我们做了100多步实验和对比,当时看达成现在效果是很惊人的。当时大部分同事来自谷歌的DeepMind,他们有从业经验,但思想相对比较狭窄、受到束缚。

我们在OpenAI一开始有两大想法:一是让机器具备一种无监督学习能力,虽然今天我们认为这是理所当然的,但在2016年没有任何科学家有过相关的经验和洞见。“数据压缩”是技术上的瓶颈,ChatGPT实际上压缩了我们的训练数据集。最后我们还有一种数学模型,通过不断训练让我们压缩数据,这其实是对数据集的挑战。这个想法在Open AI最后展示中显示了成果,训练出了神经网络。

我们希望能够去训练神经网络预测下一个单词。我觉得,下一个神经元单位会和整个视觉神经网络密切相关,这重新证明了,下一个字符的预测、下一个数据的预测能够帮助我们去发掘现有数据的逻辑,这个就是ChatGPT训练的逻辑。

老黄:ChatGPT在全球揭开了一个工作的原理,就是只要我知道了这个工作的基本逻辑是什么,就能够观察学习下一步工作。(背后数据处理逻辑是什么样的?)

伊利亚:我可以用另一种方式描述这一过程。未受监管的数据不是更关注数据来源,而是关注你一开始为什么要寻找这些数据。关键你要意识到,训练这些神经网络识别文本是值得努力的目标,因此要用更多信息、语法预测下一个字符,这就是我们最想做的事情。

四、原理:海量数据是ChatGPT基础,人类反馈更重要

老黄:这么多年来,你一直说扩大数据规模能帮助提高AI能力。你认为GPT-1到GPT-4的演变过程,是否符合摩尔定律?你对数据集的扩大是否有预期?

伊利亚:OpenAI的一大目标是如何正确地扩大数据集,如何提升数据的高精准度。

比较明确的是,我们当时在做Open AI项目的时候,希望它能做一些策略*,比如一个竞争性的体育游戏,它必须足够快、足够聪明,还要和其它队竞赛。作为一个AI模型,它其实是不断重复了这样一个基于人类反馈的强化学习过程,我们希望AI得出的结果和全球冠军队进行对比,从而进行继续迭代学习。

老黄:人们有一定误解,ChatGPT只是一个很大的语言模型,但我相信背后是有一个系统。你是如何精准调控给予人类反馈的强化学习的?是不是有其它附属系统支持ChatGPT的表现?

伊利亚:我可以给大家解释一下,我们的工作原理是不断训练神经网络体系,让神经网络去预测下一个单词。

基于过去我们收集的文本,以及看上去像在学习。实际上ChatGPT不仅是表面上的学习,而是预测的单词和过去的单词之间达成一定的逻辑上的一致。过去的文本其实是投射到接下来的单词的预测上了。从神经网络来看,它更像是根据世界的不同方面,根据人们的希望、梦想和动机得出的一个结论。神经网络体系了解了我们的情况,做出了一些展示。

但模型还没有达到预期的效果。

作为一个大语言模型,真正想做的是从一个随机写作的文本,如何随便摘几个句子做前言,在此基础上,不需要做额外的训练就能让ChatGPT写出一篇符合逻辑的论文。所以,我们不是简单地根据人类经验完成AI学习,而是根据人类反馈进行强化学习。我们是在教AI,和AI交流。人类的反馈很重要,越多的反馈会使AI更靠谱。

所以除了第一阶段让AI具备预测下一个单词,第二阶段的人类反馈更加重要,这决定了世界是什么样的。

老黄:你可以让AI做某些事情,那么能不能让AI不做某些事情?比如说告诉AI界限在哪里?

伊利亚:可以的。我觉得第二个阶段的训练,就是和AI、神经网络去进行交流。我们对AI训练得越多,AI的精准度越高,就会越来越符合我们的意图。所以我们不断地提高AI的忠诚度、准确度,它就会变得越来越可靠、精准,而且越来越符合人类社会的逻辑。

五、挑战:ChatGPT逻辑思维较死板,“不懂装懂”也是大问题

老黄:GPT-4的表现非常让人震惊,它接下来会有什么样的改善?

伊利亚:GPT-4基于过去ChatGPT的性能做了很多改善。

我们对GPT-4的训练大概是从6-8个月之前开始的,GPT-4和之前版本GPT最重要的区别,就是GPT-4是基于更大精准度去预测下一个单词的,因为有更好的神经网络帮助预测,让人有更清楚的理解,与过去的直觉有所不同。

比如说你自己在读一篇推理小说,小说中有各种不同的人物和情节、密室、有谜团,你在读推理小说的过程中完全不清楚接下来会发生什么。在最后一页,你知道谁是凶手。通过小说不同的人物和情节,你会预测凶手有几种可能性,GPT-4所做的内容就像一本推理小说一样。

老黄:GPT-4展现出了逻辑推理能力,语言模型是如何学习到推理和逻辑的?它现在还有什么样缺陷,需要接下来的版本上更进一步优化?

伊利亚:神经网络或许会面临一些挑战,逻辑和推理无法更精准定义。神经网络或许有一些缺点,比如让它打破固有思维模式,这就是神经网络能走多远的问题。

我们认为GPT的推理确实还没有达到我们之前预期的水平,我们希望推理和逻辑达到更高水平。如果我们更进一步扩大数据库,保持过去的商业运转模型,它的推理的能力会进一步提高,我对这个比较有信心。

老黄:ChatGPT有一种自然而然的属性,它能够不断去理解。

伊利亚:神经网络确实有这些能力,但是有时候不太靠谱,这也是神经网络接下来推广面临的最大障碍。

在很多情况下,神经网络会夸张、犯很多人类根本做不出来的错误。现在我们需要更多的研究来解决这些“不可靠性”,这会帮我们比较精准的结果,或者让神经网络去学会说“我不知道”,这是当下面临的一个瓶颈。

(老黄:编造也是ChatGPT面临一个问题。)

现在GPT-4的模型已经被公开发布了,它其实没有追踪数据模型的能力,它是基于文本去预测下一个单词的能力,所以是有局限性的,是数据调节出来的结果。

有些人可能会让GPT-4去找出某些数据的来源,然后会对数据来源做更深入地调查。

总体而言,尽管GPT-4并不支持内部的数据收集,它肯定会在持续的数据深入挖掘之中变得更加精准。GPT-4已经能够从图片中进行学习,并且根据图片和内容的输入进行反馈。

六、趋势:为什么要做多模态?图片理解比文字高效

老黄:多模态学习如何加深GPT-4对于世界的理解?为什么多模态学习定义了GPT和OpenAI?

伊利亚:多模态为什么如此有趣,有两个原因:

第一,多模态是确实有用的。它在视觉和图像识别上特别有用,因为整个世界是由图片形成的,人们和动物都是视觉动物,人脑1/3的灰质都是用来处理图像的。GPT-4也能够去理解这些图像。

第二,随着我们对世界理解加深,通过图片或文字理解是一样的。这也是我们的一个论证,但不那么显而易见。对于一个人而言,我们可能一生之中只会说10亿个词。

老黄:也就是说我脑海中闪过10亿个词?居然有这么多。

伊利亚:是的,我们可以计算一下人一生的时间有多久,以及一秒能处理多少词,如果再减去生命中睡觉的时间,就能算出一生处理了多少单词。

人和神经网络不同之处,就是有些过去对于文本而言的话,如果我们有一个十亿级的词汇无法理解的话,可以用万亿级的词汇来理解。你问ChatGPT两张图片哪个是紫色和橘色,它能够回答。这就是我们对于世界的知识和信息,可以通过文本慢慢渗透给AI的神经网络。但如你加上视觉图片等更多的元素,神经网络可以更精准地学习。我不是想说神经网络学习图片、文字上更倾向于学习图片,一个人,如果在十亿级图片学习是更高效的。

老黄:我们想要人工智能智能去理解事物背后的深层含义,比如日常一句话语调差别可能导致不同含义。这些模态会不会对AI去理解文本有一定帮助呢?

伊利亚:是的,你说的这类场景非常重要。对于语音和语调,包括声音的大小和语气,可能它们对图像、文本没那么重要,但也是非常重要的信息来源。

七、展望:加强可靠性,不懂的事情要说“不知道”

老黄:根据你们公布的任务,GPT-4在哪些内容上比GPT-3做出了更多的进步?

伊利亚:比如说在一些数学竞赛上,如高中数学竞赛,很多问题是需要图表来解答的。GPT-3.5对于图表的解读做得特别差,而GPT-4只需要文本,准确率大约能从2%提升到20%。如果加入视觉进行推理和交流,能得到更好效果。或许在ChatGPT的新版本,我们会推出更多视觉交互模式。

老黄:AI是否可生成专属于AI的数据来自我训练,形成一个闭环的模型?就像我们人类通过自己不断地去学习外部的世界、通过自我反思、通过解决问题来去训练我们自己的大脑。

伊利亚:我不会低估这个部分已经存在的数据,甚至比我们意识到的数据更多。

老黄:你是否可以总结一下现在AI所的发展阶段?展望大语言模型的未来是什么样的?

伊利亚:预测未来是很困难的。我们希望提供更多令人感到惊艳版本的系统。我们希望提高数据的可靠度,让系统真正能够获得人们的信任;如果系统不能完成预期,就说“不知道”,这是我们现在最大的问题。

如果让生成式的AI去总结某一些文本,然后得出一个结论。在AI在解读这个文本过程中,不会去验证文本的真实性以及文本所说的信息的来源,这一点是很重要的。我们让神经网络必须要意识到所有数据来源的真实性,让神经网络意识到用户每一步的需求,这是我们对未来的展望。

老黄:你第一次使用ChatGPT-4的时候,有哪些性能让你觉得特别惊艳和震惊的?

伊利亚:简而言之是它的可靠性。

对比之前的ChatGPT版本,神经网络只会回答问题,有的时候也会误解问题,但是GPT-4基本没有再误解问题,会以更快的方式去解决数学难题,能够去处理复杂的艰难的任务,这个对我来说特别有意义。

还有另一个例子,它能够写押头韵的诗,也能够写押尾韵的诗。并且它能够去解释笑话,能明白这个笑话背后到底是什么样的原理。

总体而言,我在这个行业从业差不多二十多年了,特别让我震惊的是,它是有用的,可以给人类带来帮助的。它从最开始毫不起眼的工作领域,慢慢变得越来越强。同样的一个神经网络,通过两种不同的方式来训练,能够变得越来越强大。

所以我会有一个惊叹时刻:退后一步看,这些神经网络是如何去成长如此之迅速的?我们是不是需要更多的训练?它是不是会像人脑一样不断成长?这让我感觉到特别惊讶的方面。

结语:算法算力数据20年迭代,推动今天ChatGPT引爆全球

一项引爆全球的技术背后,是20多年的一个小畅想“火种”的不断进化迭代。技术创新的逻辑也并不复杂,“让机器预测下一个单词”听起来简单,但最终产品走向世界却经过了长达20年一批又一批人的研究努力。

通过老黄和伊利亚两位大佬的对话,我们看到ChatGPT已经能够满足不少理解和问答需求,多模态也将增强模型的效率。下一步,如何让模型更加可靠,保证信息真实性,同时让机器意识到自己“不知道”,这些问题都将成为研发重点。

可以预测的是,这一波ChatGPT带动AI的又一次跃进。不论上层应用能否蓬勃发展起来,智能算力需求无疑都将大大释放,老黄无疑又成了背后稳稳的赢家。返回搜狐,查看更多

责任编辑: