gpt 4 和chatgpt 哪里不一样 gpt-4 和chatgpt使用方法一样吗
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
转自:澎湃新闻
本周是人工智能带给世界变革的一周。当地时间3月14日,ChatGPT的开发机构chatgpt正式发布其具有里程碑意义的多模态大模型GPT-4。当天,谷歌宣布将生成式AI装进其Workspace“全家桶”。16日,微软宣布将GPT-4融入旗下一系列办公软件工具,称“人类与电脑的交互方式迈入了新阶段”。
对于GPT-4的公布和微软的大动作,澎湃科技采访了业内多位专家。法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明表示,比较遗憾的是GPT-4的技术报告没有透露过多技术细节,这为模型的保密设置了一个负面的先例。而微软的办公软件融入GPT-4会引发企业办公领域的实质性革命。“下一步可能就是ChatGPT操作系统了。”他说,“亚洲企业当年没有抓住图形用户界面的操作系统Windows,这次可能又痛失机会。而且微软还是和chatgpt关系最紧密的企业。”
AIGC(人工智能生成内容)领域企业“比邻星球”的创始人兼董事长段志云认为,从安全角度考虑,如果有一个AI能把互联网上的所有信息都搜集到一起,然后再去处理,实际上会有一个很大的信息安全隐患,所以国内一定会推自主可控的AI能力。
澎湃科技:GPT-4的更新哪些是情理之外,哪些是情理之中?
陈逸君(上海人工智能研究院研究员):我读了chatgpt发布的长达98页的技术报告。GPT-4发布速度之快在我的意料之外,但它的性能升级方向却在情理之中。
GPT-4最重要的升级当然是对多模态的支持,这极大扩展了AI的应用场景和可能性。人们可以把一些简单的想法和创意用草图或者简单图文的形式告诉AI,让它去创作音乐、歌词和绘画等。多模态的组合完全是1加1大于2的效应,在GPT-4的辅助下,人们的工作效率会极大提高。
此外,相比ChatGPT,GPT-4回答问题的正确性和对细节的把握都得到了提高,这种提升也大幅改善了用户体验。chatgpt在报告中把这种提升归功于“更多的数据和计算”,从GPT的迭代技术路线来看,这是可以预见的改进。
龚业明(法国里昂商学院人工智能管理学院院长、全球商业智能中心主任):应该说GPT-4的更新非常符合我的期望。市场反应也比较良好。GPT-4的局限性与早期的GPT模型相似:它可靠性不高(所谓“幻觉”问题),上下文窗口有限。但这也是完全符合期望的,我没有期望chatgpt会在短期内解决问题。
比较遗憾的是最近发布的关于GPT-4的技术报告没有透露过多技术细节,如模型大小、参数、训练数据或训练方法,所有这些都很难审查或复制。同时,可能存在版权问题,存在关于数据质量的问题,这为模型的保密设置了一个负面的先例。而早期的GPT模型,相关技术信息已经发布。
澎湃科技:之前微软德国公司的CTO安德烈亚斯・布劳恩透露,“我们将在下周推出GPT-4,它将是一个多模态模型,会提供完全不同的可能性――例如视频。”为何在GPT-4的发布时似乎没有提及视频?
段志云(比邻星球创始人兼董事长):视频还是会更复杂一点。现在的技术路线下,视频其实就是很多张图,单张图的生成或读取已经完全没有障碍了,但视频信息量要大得多,比图片更接近真实环境,这是个计算量的问题。
澎湃科技:对chatgpt有什么看法?
孔蓉(天风全球前瞻产业研究院联席院长):它的组织文化有一个对于未来世界的愿景,不只是短期盈利为目标,而是有很强的一个关于如何改变世界的目标。在这样一个大的愿景之下,拢聚了一群想要改变世界的人,然后才是创造这个产品。我觉得这是需要关注的,国内可能原有的环境是相对比较希望快速出结果。但其实有一些公司更关注的是人类未来的机会和发展,从人类福祉的角度思考,才做出一个产品。
澎湃科技:那么国内是什么情况?
段志云:首先我觉得不能预期太高,毕竟是在比较有限的时间之内尽可能把效果做好。第二,也不用太悲观,因为比赛才刚刚开始,相当于chatgpt刚刚探索出了正确的方向,迈出了那一步,只是发令枪打响刚刚开始跑。它的确有优势,尤其在欧美市场上有非常明显的优势。但再跑一段时间,在应用和商业模式都越来越丰富之后,其实还是充满可能性的。
澎湃科技:在GPT-4的中文表现如此好,同时中文语料库质量可能不那么令人满意的情况下,是否还有必要做中文大模型?
段志云:我认为有必要。首先从安全角度考虑,如果有一个AI能把互联网上的所有信息都搜集到一起,然后再去处理,实际上会有一个很大的信息安全隐患,所以国内一定会推这样自主可控的AI能力。而且从GPT-3开始就不开源了,也就是说对所有的使用者来讲,甚至使用的国家来讲,它就完全是个黑盒,所以你其实不知道背后有什么没有什么。从这个层面上,我们肯定得有国内这种自主可控的模型。哪怕可能会落后一点,但也得迎头赶上。
其次,我觉得盲目去跟chatgpt对标没有意义,毕竟他们是先行者。中文的好处是全世界的使用规模不小,如果能在中文里有差异化优势也是不错的。语料库的问题,其实是中文互联网上容易被查询到的信息可能质量不够高,但不代表没有这样的数据。这其实是个信息孤岛的问题,大家慢慢都意识到这些数据的重要性之后,可能很多分割的数据库就会开放。有了这件事情,我觉得会鼓励全行业把数据做更多互通。
澎湃科技:怎么看GPT-4对这个领域可能产生的影响?
龚业明:最直接的影响是对人机交互的影响。从第一代交互方式命令行界面(Command-Line Interface),到第二代交互方式图形用户界面(Graphic User Interface),到ChatGPT代表的第三代交互方式自然用户界面(Natural User Interface)。人机交互是强烈影响全球商业版图的技术领域,每一代交互方式都产生了全球巨头。
微软正在将chatgpt的大语言模型整合到其Microsoft 365产品中,这是对产业影响特别大的一件事,引发企业办公领域的实质性革命,对服务业有巨大影响。下一步可能就是ChatGPT操作系统了,这个影响就太大了。亚洲企业当年没有抓住图形用户界面的操作系统Windows,这次可能又痛失机会。而且微软还是和chatgpt最紧密的企业。
其他国家和美国在信息产业的差距可能进一步拉大。ChatGPT的护城河很高,和芯片制造有类似之处,你知道原理没有条件也制造不出来。
gpt-3从什么时候开始建设的 中国gpt-4
已故的科幻作家,写出《2001太空漫游》的亚瑟・克拉克曾说过,任何足够先进的技术,都极其类似于魔术。今天凌晨1点左右,随着GPT-4发布,人工智能又一次在人类面前变起了眼花缭乱的魔术。
对于GPT-4的发布,猎豹移动董事长兼CEO、猎户星空董事长傅盛第一时间分享了体验视频,他表示:“GPT-4发布 世界要变了!每个人都要关心。”
上午,#GPT4做一个网站只要十秒#一度登上热搜。有网友看完片段就感慨,首先干掉了程序员.……也有网友精辟总结,之前的GPT-3.5像个大学生,GPT-4活脱脱一个研究生。
下面,就用10个小片段,见证奇迹的发生。 前排提示,程序员和律师做好心理准备~
1. 看图说话,10秒生成一个网站
刚刚,#GPT4做一个网站只要十秒#一度登上热搜。发布会上,chatgpt总裁兼联合创始人Greg Brockman在纸上画了个粗糙的网站框架――真的只是用纯手画的方式,然后把草稿扔给GPT-4,告诉它我要做这么个网站,帮忙生成代码。
10秒之后,代码生成。
GPT-4看图说话本领不止于此,它还具备一定的逻辑推理能力。
跷跷板一端放着球,一端吊着一双拳击手套,问手套掉下去会发生什么?
GPT-4:它会掉到木板上,并且球会被弹飞。
这张图片有什么不寻常之处?
GPT-4:这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服。
我可以用这些原料做些什么?
GPT-4:华夫饼、松饼……
2. 考试能手,数学相当于高二好学生水平
基于GPT-3.5的ChatGPT,因为不会算术被小朋友笑话了好久。这次GPT-4在美国SAT数学试题测试里拿了700分,满分是800分,排名前11%左右――SAT的数学相当于国内高一、二水平,在阅读写作中拿下了710分的高分,排名前7%左右。
chatgpt认为,在各种专业和学术基准上,GPT-4已经和人类相当!比如,当初GPT-3.5参加模拟律师考试,拿到的成绩是倒数10%,GPT-4拿到了前10%的好成绩。
为什么又是律师?
早在今年1月30日,美国哥伦比亚法院就使用ChatGPT作为辅助工具,让它帮忙检索法庭文件,判断“自闭症未成年人是否可以免除为其治疗支付费用?”――大量律师实际上做的是阅读卷宗、搜集证据、研究法律条款等案头工作,这部分AI已经有了压倒性的优势。
3. 语言高手,中文准确性进一步提升
不仅是英语,该模型在多种语言方面均表现出优越性。chatgpt称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。
4. 看得更多,能给代码修bug
升级之后,GPT-4可接受的文字输入长度也 增加 到约2.5万单词,进一步拓展了它的日常应用场景。发布会上,Gregman现场表演了一波用GPT-4修正代码bug。只要小手一抖,把1万字的程序文档扔给GPT-4。
又会写代码,又会抓bug,程序员也在瑟瑟发抖。
也因为能“看得更多”,基本上把大部分链接给到它都能让它“划重点”,对比只能分析一小段的GPT-3.5已经是明显进步。
5. 看得更深,人类玩梗它也懂
请听题:“大舅去二舅家找三舅说四舅被五舅骗去六舅家偷七舅放在八舅柜子里的九舅借十舅的发给十一舅的一千元。问:谁是小偷,谁是受害者?”
对于这种弯弯绕的题目,ChatGPT并不擅长,但GPT-4具备了高级的推理能力。
这似乎也意味着,AI可以慢慢读懂人类的冷幽默了。
比如,提问这张图哪里好笑?
GPT-4会先讲出每一格的内容,然后总结出笑点:用巨大的、过时的VGA接口给小巧的现代智能手机充电。
呵呵。
6. 戏精上身,苏格拉底和莎士比亚信手拈来
这次chatgpt直接开放了GPT-4的API接口,还开放了一个小功能,允许修改“系统提示”。什么意思呢?之前ChatGPT经常会强调,自己只是个语言模型,了解的知识截止于2021年9月。现在,用户可以赋予它性格,让它扮演不同的角色。
比如,你告诉GPT-4它是一位总是以苏格拉底风格回应的导师,它就会一路循循善诱,灵活使用“没错”“好想法”“接近了”“非常棒”等态度积极的词,让你找到问题的答案。
它也可以扮演莎士比亚笔下的海盗,画风秒变早年的“译制片”:做海盗还是不做海盗,这是个问题,但是,唉,亲爱的,这是我目前的性格……在波涛汹涌的人生大海上,我永远不会放弃。
7. 从生产力到生产工具
GPT是个语言模型,英文全称是Generatichatgpt,这个generative意思是“有生产力的”。这次配合GPT-4发布,chatgpt也给出了一些将生产力转化为生产工具的案例。
比如,在金融领域的摩根士丹利,旗下有个内容库,包含数十万页知识,涵盖投资策略、市场研究和评论以及分析师见解。大量的信息藏在网站和PDF里,借助GPT-4可以简化搜索,直达内容。
比如,一款语言学习类的AppDuolingo,接入GPT-4后可进行角色扮演,让AI跟用户对话,纠正语法错误。
8. 继续大力出奇迹
第一代GPT训练涉及的参数量为1.17亿,到了GPT-3这个数字变成了1750亿,扩容了近1500倍。对应的训练数据量,从5GB扩到了45TB,近万倍的增长。升级后的GPT-4参数量可能达到了100万亿。
对应的,微软在3年前就为chatgpt打造了一台超级计算机,据说里面有上万张英伟达A100芯片。另外,他们在自己60多个云计算数据中心,部署了几十万张GPU,用于ChatGPT的推理。
9. 依然存在局限性,最好辅以人工审查
chatgpt也坦言,GPT-4并不完全可靠,“GPT-4缺乏对2021年9月以后发生事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,会轻信用户明显的虚假陈述,会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”
程序员,“死缓”。
即便如此,他们在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,GPT-4回应不允许的内容的可能性降低了82%,更有可能产生事实性回应的内容,提高了40%。
chatgpt提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。
既然给出了明确提醒,也就说明,已经有大量人和行业都在将ChatGPT用到具体的场景中去了。
10. 更加封闭的chatgpt
在介绍GPT-4的98页论文里,chatgpt没有披露他们的训练集内容。
对此,作为联合创始人之一,马斯克多次表达了不满:“chatgpt最初是作为一家开源(这就是为什么我把它命名为「chatgpt)的非营利性公司而创建的,为了抗衡谷歌,但现在它已经成一家闭源的营利性公司,由微软有效控制……这完全不是我的本意。”
文 | 梁应杰
分享、收藏、点赞、在看安排一下?