庆云古诗词

庆云古诗词

chatgpt老板是马斯克还是比尔盖茨 盖茨说chatgpt不会威胁人类工作

互联资讯 0
chatgpt是什么意思,chatgpt怎么用,chatgpt怎么读,chatgpt使用

当地时间23日中午,人工智能公司OpenAI推出了旗下ChatGPT的重大升级,通过插件功能授予机器人访问第三方知识源和数据库(包括网络)的权限来扩展机器人的功能,其中最新发布的网络浏览插件可以允许ChatGPT能直接检索到最新新闻,从网络上提取数据以回答向它提出的各种问题。此前ChatGPT的知识仅限于2021年9月之前的日期、事件和人物。现在,它已经可以给出2023年的数据和结果。

ChatGPT插件发布页面

在官方演示中,ChatGPT还能通过与5000多个第三方插件交互,实现的功能包括:查询世界各国语言词汇、短语;查询实时股票、航班、酒店信息,规划差旅;访问各大电商数据,帮你比价甚至直接下单;另外还支持个人或企业把私有数据(文档、笔记、邮件等)发给ChatGPT,成为人的“第二大脑”或企业的智能助理。

对于ChatGPT,世界范围内已经有许多各领域的“大佬”对其提出了自己的见解和看法,有的觉得这是革命性的技术,也有人觉得它还不成熟,保持观望态度。近日,微软公司创始人比尔・盖茨在他的个人博客“GatesNotes”上发表了一篇千字的博文,他觉得“人工智能时代真的到来了”。

比尔盖茨在博文中写道:“自2016 年以来,我一直与 OpenAI 的团队会面,他们的稳步进步给我留下了深刻的印象。 2022 年年中,我对他们的工作感到非常兴奋,于是我给了他们一个挑战:训练人工智能以通过大学预修生物学考试。使其能够回答未经专门培训的问题。 (我选择 AP Bio 是因为测试不仅仅是对科学事实的简单反省――它要求你批判性地思考生物学。)如果你能做到,我说,那么你就取得了真正的突破。”

“同年9 月,当我再次见到他们时,他们让GPT进行了一场AP Bio考试,一共60道题,其中 59 道是正确的,这让我不禁感到敬畏。然后,它在考试中的六个开放式问题写下了出色的答案。我们让一位外部专家给测试打分,GPT 得到了 5 分――最高分,相当于在大学水平的生物学课程中获得 A 或 A+。”

在博文中比尔盖茨提到,ChatGPT是他一生当中遇到过的两次革命性的技术之一,在经过大量学习的之后,ChatGPT会变得越来越智能。比尔盖茨觉得,ChatGPT会给人类在生产力、健康和教育领域带来帮助,不过比尔盖茨也担心人工智能会带来一些风险。


解剖chatgpt背后的核心技术 ChatGPT越用越聪明吗

解剖c7,解剖body,解剖全程,解剖aj

当前,很多自然语言处理(NLP)应用需要高质量的标注数据来支撑,特别是当这些数据被用于训练分类器或评估无监督模型的性能等任务中。

例如,人工智能研究人员通常希望过滤嘈杂的社交媒体数据的相关性,将文本分配到不同的主题或概念类别,或衡量其情绪或立场。

而且,无论这些任务使用什么具体方法(监督、半监督或无监督),都需要标注好的数据来建立一个训练集或黄金标准。

然而,在大多数情况下,要完成高质量的数据标注(data annotation)工作,依然离不开数据标注平台上的众包工作者或诸如研究助理等训练有素的标注者来手动进行。

通常情况下,训练有素的标注者先创建一个相对较小的黄金标准数据集,然后雇用众包工作者来增加标注数据的数量,进行重复性工作。根据规模大小和复杂程度,数据标注任务有时会非常费时费力,不仅需要花费一定的人力成本,而且也不能保证数据标注的质量。

那么,能否让机器帮助人类完成这一基础任务呢?

在以往的认知中,机器并不擅长这类“慢工出细活”的任务,但出乎意料的是,“数据标注”这件事已经让 ChatGPT 完成了,而且比大多数人做得还更好。

在一项今天发表的新研究中,来自苏黎世大学的研究团队使用由 2382 条推文组成的样本,证明了 ChatGPT 在相关性、主题和框架检测等标多个注任务上优于众包工作者。

相关研究论文以 “ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks” 为题,已发表在预印本网站 arXiv 上。

具体来说,ChatGPT 在五项任务的四项中的零样本(zero-shot)准确率超过了众包工作者;在所有任务中表现出的编码者间一致性(intercoder agreement)方面,ChatGPT 不仅超过了众包工作者,也同样超过了训练有素的标注者。

图|ChatGPT 零样本文本数据标注表现。(来源:该论文)

值得一提的是,ChatGPT 的每个标注成本只有不到 0.003 美元,而比数据标注平台便宜约 20 倍。

研究团队认为,虽然需要进一步的研究来更好地了解 ChatGPT 和其他 LLMs 在更广泛的背景下的表现,但该研究结果表明,它们有可能改变研究人员进行数据注释的方式,极大地提高文本分类的效率,并破坏数据标注平台的部分商业模式。

至少,从目前来看,这些发现表明了更深入地研究 LLMs 的文本标注特性和能力的重要性。

未来,研究团队将在 ChatGPT 在多种语言中的表现、ChatGPT 在多种类型的文本(社会媒体、新闻媒体、立法、演讲等)中的表现、使用思维链(CoT)提示和其他策略来提高零样本推理的性能等方面继续努力。

值得一提的是,研究团队在进行这项工作时,OpenAI 还没有发布 GPT-4,如果让 GPT-4 来完成数据标注任务,又会是怎样的结果呢?

论文链接: