庆云古诗词

庆云古诗词

一文读懂有关chatgpt的十个问题 chatgpt为什么那么强大

淘文章 0
一文读懂有关黄金的,关于char,关于chat币最新消息,关于ch

ChatGPT?又刷屏了!

万众期待的?GPT-4?语言模型在今天凌晨突然发布,OpenAI?称它为「最先进的系统,能生产更安全和更有用的回复」。

我们第一时间为大家汇总了?GPT-4?更新的主要内容,简单来说就是:

  • 1逻辑分析能力更加全面、「考试」能力大幅提升
  • 2拥有了识图能力,可以进行更多元的交流
  • 3回答更有条理,理解更加准确
  • 4创作力大幅提升,可以进行更全面的创作双击编辑块引用内容

更重要的是,OpenAI?可不是「画大饼」,【【微信】】?用户现在已经能够使用?GPT-4?模型,体验除图片输入(仍是研究预览版本,尚未公开)外的功能。

上一个版本?ChatGPT(使用?GPT 3.5 turbo?模型,以下为阅读方便简称为?GPT 3.5)让创作者们感受到职业危机了,升级到?GPT-4?后能真的取代人类工作吗?

让我们用亲身体验告诉你。

10+?提问,让你全面了解全新?ChatGPT

先来给出结论,从实际体验来看,GPT-4?的回答逻辑更清晰,内容也更优质,减少了反复提问,但反应速度会慢一些。

如果你是?【【微信】】?用户,进入后就可以在页面顶部看到模型选择的按钮,OpenAI?也用能力表直观的展示了两者的区别:GPT-3.5?的速度更快,GPT-4?的推理更出色,语句也更精炼。

GPT-3.5

GPT-4.0

ChatGPT,会读图的加州司机

GPT-4?最疯狂的地方在于,它几乎通过了所有理论考试,而且全是几乎满分通过。

图/OpenAI

对此我们也进行了测试,找到了?20?道高级调酒师题库中的问题和?16?道加州驾照考试题目,分别询问?GPT-3.5?和?GPT-4。

先公布答案,20?道调酒师题目中,GPT-3.5?错了?4?题(正确率?80%),GPT-4?错了?1?题(正确率?95%)。

而?16?道加州驾照考核中,GPT-3.5?同样错了?4?道题(正确率?75%),GPT-4?则满分通过(正确率?100%)。如果仅凭理论就能上路,那?GPT-4?一定是一名好司机。

GPT4.0 的「试卷」

此外我们还测试了大学英语六级、二级建筑师等考试项目,GPT-4?和?GPT-3.5?的成绩都不错,但前者总是比后者多对几道。

要注意的是,虽然?GPT-4?的综合准确率高于?GPT-3.5,但在回答客观选择题时,两者均会出现多次回答相同问题,但答案却不同的情况,如果你想用?ChatGPT?检查考卷,它或许不是一个合格的老师。

不过?GPT-4?在回答时多了一些提示,告诉你这些答案不一定全对,而不是像?GPT-3.5?那样理直气壮的给你错误答案。

GPT-4.0 会有免责声明

在?ChatGPT?刚推出时,有不少人用它「刷题跑分」,上版本的它只能在?SAT(美国高考)考试中排到倒数?10%,但?CPT-4?模型则可以超过?90%?的考生水平,「在多种专业和学术指标下展现了人类水平的表现」。如果光是「跑分」,ChatGPT-4?可以考进哈佛、斯坦福。

全新的?GPT-4?还拥有了新能力:读图。

你可以给它看一张梗图,让它分析其中的笑点。

GPT-4

可以给它一张表格,进行数据分析,并展示推导过程。

GPT-4

甚至还有用户给?GPT-4?看了自家冰箱里有什么菜,然后让它提供菜谱。

来自推特用户@ Gaura【【微信】】

不过这一功能暂时还没有进入公开测试阶段,等更新后我们会在第一时间体验分享的。

日常沟通,GPT-4?更有条理

刚上手?GPT-4?时,我与它闲聊了几句,在问「你是谁」时,虽然?GPT-3.5?和?GPT-4?给出的回答类似,但?GPT-4?的说法会更像一个朋友。

GPT-3.5

GPT-4.0

我也和它聊了一些其他问题,比如「1+1?在什么情况下等于?3」,GPT-4?不仅进行了解读,还把?GPT-3.5?中未说明的隐喻进行了解释(生育问题),它似乎更懂人类了。

GPT-3.5

GPT-4.0

读文章的能力上,GPT-4?的表现也要优于?GPT-3.5,不仅对文章内容进行了总结,还对重点进行了梳理,让总结拥有了更高的可读性。

利用?GPT-4?超强的总结能力,我们可以实现传说中的「量子速读」。

GPT-3.5

GPT-4.0

前两年尼尔・斯蒂芬森的科幻小说《雪崩》因为元宇宙的概念而大火,我们试着用?GPT 3.5?来总结这部「元宇宙圣经」。

GPT-3.5

GPT 3.5?总结得只能说中规中矩,基本概述了《雪崩》的主要内容和中心思想,但表达地比较笼统,看起来就像是豆瓣里的简介。

我们再用?GPT-4?来总结,对比下来可以看到,GPT-4?的回答要更加细致一点,并且在讲到《雪崩》的主题以及作品影响时,会提到具体的风格和领域,看起来不那么像「套话」。

即便你从未读过《雪崩》这本书,也应该能大致了解到其中的故事情节和文学意义。

GPT-4

这里说一个有趣的小插曲,此前尼尔・斯蒂芬森在接受一个电台采访时曾提到了他对?ChatGPT?等?AI?的看法。

他认为?ChatGPT?只会生成安全、中立的内容,缺乏创造力和深度,虽然它能解决某些问题,但它的思考和创新能力无法达到人类的水平。

由于?ChatGPT?没有有趣和独特的观点,尼尔・斯蒂芬森认为它不可能写出像《雪崩》这样的小说。

为了验证他的观点,我让?GPT-4?根据《雪崩》仿写了一篇小说,看看升级过后的?AI?创作能否跟上人类的水平。

GPT-4

满分?10?分,你会给这部《数据风暴》打几分呢?

体验到这里,GPT-4?比?GPT-3.5?更会聊天这件事已经毋庸置疑了,但我还想进行最后一个测试:骗它提供不符合道德、法律或有害的内容。

当我询问如何制作安眠药时,GPT-3.5?和?GPT-4?均拒绝了我的请求,并提出了一些建议,但正如你所见,GPT-4?的建议更加系统全面。

GPT-3.5

GPT-4.0

更强的创作力,GPT-4?的笑话更有趣

在?ChatGPT?刚推出时,我曾经让它扮演脱口秀演员,讲了一段关于加班的故事。不得不说,它讲得真不怎么样。

GPT-3.5

看着它的故事,我脑海中甚至浮现出了一个脱口秀演员,说着如同加班到凌晨购买的咖啡一般、苦涩又冷的笑话,这或许可以给演员一些创作灵感,但距离令人捧腹的幽默还有很远。

升级到?GPT-4?后,我再次尝试用它创作关于加班的故事,或许是上次的内容太过枯燥,这次的故事真的让我笑出了声。

GPT-4

「加班>回家少>妈妈不认识」,「加班多>孩子应该学习加班>加班成为学校必修课」,GPT-4?创作的内容更加符合笑话的逻辑,而?GPT-3.5「因为加班所以更加了解咖啡口感」的故事,只让人觉着苦涩。

还是会算错题,但逻辑更强了

除了止于?2021?年的知识库,ChatGPT?还有一个弱点,那就是不会算数,如果你想用它来检查计算题,那你大概率要失望而归了。

正确答案应该是?34646751912

不过,GPT-4?的逻辑能力得到了进一步提升,使用?GPT-3.5?询问逻辑问题时,它只会给我标准答案和简易的推导过程。

GPT-3.5

但当我使用?GPT-4?询问相同问题时,它展示的推导过程更加全面、专业。

GPT-4

GPT-4?的提升不仅在解答逻辑问题上,它的语义理解也更强了。比如「小明一把把把把住了」这句话,GPT-3.5?是无法理解含义的。

GPT-4

但最新的?GPT-4?就可以看明白,并解释清楚(虽然逻辑上还是有些小问题)。

GPT-4

GPT 在帮我们做什么?

上面这些体验虽然已经让我们足够惊叹,但?GPT-3.5、GPT-4?能做到的远不止这些,在官网,OpenAI?展示了?GPT?正在改变世界的地方。

英语学习软件?【【微信】】(多邻国)正在转向?GPT-4,用来推进?Role Play(角色扮演)和?an AI con【【微信】】(人工智能对话伙伴)的功能,让用户可以更加游戏化的学习外语,更加身临其境。

图/【【微信】】

来自丹麦的?Be My Eyes,利用?GPT-4?的视觉输入能力,在?app?中加入了虚拟志愿者?TM,可以生成与人类志愿者几乎相同的内容,帮助视力低下或盲人完成数百项日常生活任务。

游戏开发公司?Inword,利用?GPT-3.5?作为机器学习模型之一,去构建?NPC?的情感、记忆、行为,让?NPC?变得有个性。这对资源有限的初创公司来说既节约时间,又经济实用。

这些应用中最酷的还是冰岛政府,拥有蓬勃旅游业和技术产业的冰岛,因与美国、欧洲的融合,导致本国母语冰岛语面临消失的风险。如今,冰岛政府正与?OpenAI?合作,使用?GPT-4?来保护冰岛鱼,将对冰岛语的保护,变成了技术创新。

OpenAI?的?GPT?模型是针对互联网中大量模型进行训练的,所以像冰岛语等小语种并没有足够的深度。GPT-3.5?没有生成语法正确的冰岛语的能力,但?GPT-4?已经可以让冰岛公司拥有用冰岛语聊天的机器人了。

Mieeind?的人工智能研究人员团队一直在研究冰岛语的?GPT-4?培训

在哪体验?

目前体验?GPT-4?最方便的方式就是将你的?ChatGPT?帐号升级成?【【微信】】,然后切换成?GPT-4?模型就能直接使用。

那么问题来了,如果你不想交?【【微信】】?每月?20?美元的订阅费,有没有免费的方式可以体验呢?

还真的有,那就是新?Bing!

虽然?GPT-4?才刚刚发布,但微软消费营销主管?Yusuf Mehdi?表示,Bing?其实一直都在悄悄使用为搜索定制的?GPT-4,如果你通过了新?Bing?的申请,就可以直接在?Bing?搜索引擎或者?Edge?浏览器中体验到最新的语言模型了。

这也解释了,为什么在一些对比测试中?Bing?总是会比老版本的?ChatGPT?表现得更「聪明」。

写在最后

一番体验过后,GPT-4?给我的感觉就像是一个刚出校园的毛头小子换上了西装,突然间变得成熟稳重了起来。

此前,大家对?GPT 3.5?版本的?ChatGPT?诟病最多的就是它总是会一本正经地胡说八道。

升级到?GPT-4?模型后,虽然它也会回答错一些问题,但在态度上已经没有过去那般强硬,在一些拿不准的问题上,它会询问提问者意见,并让提问者注意甄别真伪。这些语气上的细微变化,足以让人感受到它变得更加可靠。

而在?AI?领域,可靠性就是绝对的竞争力。

OpenAI?这一次并没有像过去那样大肆宣传?GPT-4?模型的具体大小,与之相反的是,它现在更像要故意隐藏?GPT-4?的技术信息。

GPT-2?模型有?15?亿个参数,表现更好?GPT-3?有?1750?亿个参数,比它的前任大?100?多倍。

那么多模态的?GPT-4?模型比?GPT-3?大多少呢?只有?OpenAI?知道。从发布的信息来看,OpenAI?似乎已经不屑于与外界做技术交流,因为它们已经做到了在这领域实现领先。

从目前?GPT-4?的表现来看,它可能是迄今为止最好的多模态模型,在短期内难有对手能将之超越。

就在今天,Google?也公布了一系列与?AI?有关的更新,你可以在?Google Docs?上实现自动排版和自动写邮件。 但从人们的反应来看,好像没有人在乎。GPT-4?的光芒几乎掩盖掉所有对手的努力。

如果未来人们只会选择最可靠的?AI?作为生产工具,那么就会形成一个很有意思的现象:越多人使用?GPT-4,它的学习机会就越多,成长得越快,变得更加可靠,最终会让更多人使用它。

这是?Google、Meta?和百度等竞争对手可能遇见的最坏情况。AI?对大数据学习的依赖让人为的努力失去了意义,最终,AI?模型领域可能会形成难以打破的垄断。

Sam Altman?在创立?OpenAI?时有一个美好的愿景:通过人工智能造福全人类。他认为?AI?可以赋予每个人不可思议的新能力,放大每个人的聪明才智和创造力。

这很美好,但如果驱动这一变革的只是一家公司的话,整件事情将变得非常可怕。


new bing new bing 被重定向了


春天来了,草地绿了,足球场上人声鼎沸。小伙子们穿上新球衣,踢起了一场激烈的比赛。他们奔跑、传球、射门,汗水洒在春风里。观众们为他们加油呐喊,欢呼声震动了天地。夏天到了,太阳热了,足球场上火焰燃烧。小伙子们不畏高温,踢起了一场艰苦的比赛。他们拼搏、防守、进攻,汗水流在夏日里。观众们为他们挥手鼓掌,掌声响彻了云霄。秋天来了,树叶黄了,足球场上风景如画。小伙子们换上暖色球衣,踢起了一场优雅的比赛。他们跳跃、盘带、配合,汗水落在秋叶里。观众们为他们点头微笑,笑声洒满了枫林。冬天到了,雪花飘了,足球场上银装素裹。小伙子们穿上厚重球衣,踢起了一场勇敢的比赛。他们冲刺、抢断、射门,汗水冻在冬雪里。观众们为他们举旗呼唤,旗帜飘扬在寒风中。四季轮回,足球不息,足球场上永远有激情。小伙子们用心打造梦想,踢出了一生的精彩。他们快乐、坚强、团结,汗水浇灌着青春里。观众们为他们感动流泪,泪水闪耀着光辉。