ai产品经理视角下的chatgpt全解析 ai研究专家谈chatgpt
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
图片来源@视觉中国
文|AI产业研究中心
在2023年一季度的三个月里,美国给全世界送了两份大礼。一份是硅谷银行、签名银行在几天里莫名其妙的倒闭,另一份就是“现象级应用”ChatGPT在短时间内就全球风靡,成为AI界的“顶流”。
如果说两家银行的倒闭,暴露的是美国金融领域的系统性风险,那ChatGPT的风靡,则是在全球资本市场掀起了一股疯狂蔓延的 AI 浪潮。
由此,在今年3月,迎来了堪称有史以来最壮观的“AI集体爆发月”。在短短半个月里,微软的Microsoft 365 Copilot、Google PaLM API、百度“文心一言”、英伟达的A100芯片等AI应用和产品先后登场,公之于世。
可以这么说,ChatGPT几乎以一己之力,打开了混沌许久的全球AI产业。
一夜风靡,ChatGPT到底强在哪儿?
作为一款由美国人工智能公司Open AI推出的聊天机器人,它拥有一定的思考、总结、分析能力,堪称一位贴身的“聊天助理”。一经问世,就受到了亿万人的追捧。
一位太原的女白领在体验后,就感慨道:“ChatGPT在书写邮件、校对文书方面表现出色。”而国外有一名大学生,让ChatGPT帮他写了一篇论文,结果这篇论文被教授直接评了“优”。
据说,谷歌为印证ChatGPT的能力,曾把程序员招聘面试卷交给它来做,最终它的卷面成绩达到了谷歌三级软件工程师的录取分数线,那可是一个起薪就是18万美元的职位。
北京华碳绿能科技有限公司总经理王勃霖在使用后,就向记者表示,ChatGPT通过其海量数据资源精准匹配与整合能力,可以实现跨行业、跨领域精准的信息推介。
可以减少机械性的重复劳动,节约时间、降低成本,这正是ChatGPT强大所在。
人机大战,ChatGPT到底抢了谁的饭碗?
2月11日,央视网发布了一条微博,罗列出了#可能被ChatGPT取代的10大职业#,其中居然包括了程序员、媒体人、法律工作者、市场分析师、教师等让人意想不到的职业。那ChatGPT真的有如此神力吗?
其实从技术层面上来讲,ChatGPT就是一个兼具关键词智能检索、模型智能匹配功能的通用内容生成机器人,具备检索速度快、操作简单轻松、信息量大以及可迅速自动生成内容四大优势,人类完全无法与之匹敌。
因为从生理角度来讲,人不可能在几秒钟内完成一项写作;从心理角度来看,人如果长时间写作,一定会产生疲劳和厌烦;而从物理角度来看,一个人也不可能像百科全书一样,样样懂、万事通,什么都会。
ChatGPT这四大优势,是人类生理、心理、物理极限永远无法企及的。因为,ChatGPT是“机”不是人。
但凡事都有两面性。所谓成也萧何,败也萧何。正因ChatGPT不是人,所以它也就没了人的灵气。它生成的内容受计算模型库和数据库框架的限制,既缺乏创造力和想象力,也没有人情味,完全靠堆砌而成,有逻辑但不严谨、没感情。正如ChatGPT自己所言:“我是基于2021年以前的2021年以前的数据库和概率性语言模型,通过对人类语言的高效模仿来生成文本。”
因此,我个人认为央视网给出的这个列表,有待商榷。因为它忽略了职业中所必需的创造力、情感和严谨性,以及世界本身的变化万千,尤其对媒体人、法律工作者、教师、设计师等职业来说。
就以教师为例,如果只是对现有知识做传授,那ChatGPT完全能够胜任,但如果要对一个全新知识点做解读、延伸,并教会学生灵活应用及创新,那就做不到了。但这不正是教师真正应该做的吗?
也许老师对现有知识的认知,并不像ChatGPT那么完美,但正是由于不完美,才会激发人的思考和探索精神。林语堂在《人生不过如此》中写到:“不完美,才是最完美的人生。
还记得几年前的AlphaGo吗?它在围棋领域,把人类杀得毫无招架之力。但人类发明棋类游戏,目的并不是为了战胜对手,而是为了挑战自己。
因此,能被ChatGPT取代的,一定是那些不用深入思考、只要机械操作的职业或者是那些不想去思考的人,而并非是职业本身。
是创世,还是故事?AI到底应该给人类带来些什么?
自从ChatGPT问世以来,社会上出现了这样一种焦虑,那就是很多人觉得 ChatGPT 已经可以和 “人” 一样了。
2月13日,猎豹移动CEO傅盛就曾兴奋地发帖称:“被ChatGPT给惊到了,因为它居然猜出了我家狗狗叫3万的原因……”
乍一看来,这一反应没毛病。但仔细推敲,你还是会发现ChatGPT的成功,依然有迹可循。因为它在回答前,通过提问已经在记忆库中框出了答案范围,它只是选择了其中可能性最大的答案,整个过程有点像机器人算命。假如我来回答,不用提问就会想到两个答案,一个是为这条狗花了三万,另一个是在第一次见到它时正好和了一把三万。
另外,也有网友做了这样一个测试,它让ChatGPT参照杜甫的《春望》,以相同的句式结构,根据提供的关键词,创作一首诗。
结果不言而喻,这两首诗根本不在一个档次上,杜甫的诗饱含情思、意境深远,哪怕跨越千年,也能直击人心,而ChatGPT的诗作只是辞藻堆积,空有形,却无一点内心情感和意境表达,完全不知所云。但不能体现人类情感的诗,那还是诗吗?
由此可见,ChatGPT 本身并没有达到人类智慧的水平,只能做有迹可循、机械反复的事情,只有算力,没有智力,更没有感情,更不能突破创新。它给AI发展带来的巨变,主要是技术路线、模型设计和训练方式上。
正如百度创始人李彦宏所说:“技术积累到这儿了,数据积累也到这儿了,计算能力积累也到这儿了,正好这三者在这个时点具备了爆发的能力,AI技术的进一步成熟,可以运用于很多领域,大幅提升效率,并改变人们的生活方式”。据报道,这是他2020年参加一次行业峰会时,就类ChatGPT产品爆发做的一次预测。可见ChatGPT的问世,只是水到渠成而已,并不是横空出世。
那人工智能到底应该给我们带来什么呢?
3月31日,在今年的博鳌亚洲论坛期间“人工智能赋能美好生活”主题分享会上,华为云人工智能领域首席科学家田奇提出了“AI for industries将成为人工智能新的爆发点”这一观点。他指出人工智能的真正用途,是促进人类生产效率的提升,应用场景应该从热门的消费端,扩大深入到生产端,就像电一样,如果只用来照明,并不能推动人类生产力的进步,只有运用到各行各业生产上,才会推动全社会生产效率提升。”
正如他们所讲,ChatGPT带来的真正价值,绝不是自主内容生成,而是NLP大模型的训练与部署在AI领域的成功应用,它将带动全球对AI的关注与投入,最终在各个领域推动了产业智能化、社会智能化,如同当年AlphaGO战胜人类最强棋手后的爆火一样。
在“2022世界人工智能大会(WAIC)”上,深兰科技创始人陈海波在一次主题演讲中就表示,人工智能是底层赋能技术,就像电和网一样,到处都能用,不光可以助力个体、改变生活,也能赋能社会,实现产业整体升级、改造世界。
没错,ChatGPT就应该成为一种技术工具,为人类开创一个生活更加美好的俗世,而不只是一个被人们到处宣讲的故事。
是做燎原星火,还是做白日焰火?中国AI应该以何种方式火爆?
借着ChatGPT的东风,创新工场CEO李开复、美团联合创始人王慧文、阿里副总裁贾扬清、搜狗创始人王小川等商业大咖接连出场,纷纷计划下场孵化 AI 大模型。
对此现象,国内一位 AI 龙头企业的CEO反而向《钛媒体》泼冷水道,ChatGPT引发的这一波大模型热,最终肯定会是“一地鸡毛”,因为技术这件事还真不是“大力出奇迹”能解决的,五、六个月之后,AI行业一定会出现很多“泡沫”。
据了解,ChatGPT在技术上走的是“大数据+大算力+强算法=大模型”路线,且又探索出新的“基础大模型(类似于大脑)+指令微调(指交互训练)”范式,通过两者融合实现逼近人类语言的智能,其中“大数据、大算力、强算法”是支柱。据悉,Open AI为了让GPT-3的性能更接近人类,动用了45TB数据和近1万亿个单词对其进行训练。根据国盛证券的估算,仅训练一次就要花费约140万美元,而对于一些更大的LLM(大型语言模型),成本更高达上千万美元。
可见,ChatGPT的成功是靠Open AI长期投入和深耕一点点积累出来的,这就不难解释李彦宏为什么一直强调“积累”这个词了。
其实,ChatGPT从本质上来讲,也是AIGC技术的一种表现形式。所谓AIGC,就是用人工智能自动生成内容,包括文字、图片、音频、视频、动作等。
而关于生成式AIGC和NLP大模型这两大技术,早有不少中国科技企业在该领域深耕多年了,如今也有成熟产品问世,并应用到商业、媒体、服务等相关领域之中。
如去年3月3日,百度推出的服务于听障人士的AI手语数字人――智能云曦灵AI手语平台,就是基于自然手语NLP手语翻译大模型,生成近千万“自然手语语料”句子作为训练数据,并通过AIGC技术生成手语视频,为听障人士提供线上交流、休闲、学习等方面的服务帮助,千字文本转手语仅需几秒钟。
而去年11月20日,诞生于【【微信】】(数字人实验室)的华为云数字人――云笙,在上海举行的首个“华为云开发者日(HDC.Cloud Day)”上公开亮相。有AIGC技术和盘古CV大模型加持的【【微信】】,不仅让人人都能拥有自己的数字“分身”,还提供写实建模、视频制作、语音合成、虚拟直播、虚拟视频制作等服务。
今年1月16日,宁波银行上海分行001号数字人员工“小宁”主持了一场虚实结合、打破次元壁的线上直播活动,不仅风趣、幽默地介绍了自己的工作内容,还专业、亲切地向网友推荐宁波银行的多种金融产品和优惠福利。该数字人员工是由商汤科技为宁波银行专属打造的“虚拟IP”,基于商汤原创的“虚拟IP解决方案”及多种领先的AI技术,可以实现高效率、低成本的AIGC内容创作,助力银行实现前端业务的用户积累和营销转化。
今年2月20日,媒体报道了深兰科技为武汉江汉路智慧街区工程研发的IP数字人――江妮正式登台的新闻。据介绍,数字人江妮使用深兰自主研发的metamind产品核心技术,NLP预训练多模态大模型,具有语音识别合成、用户对话意图理解、情感分析等能力。通过大量的AI预训练,建立街区相关的知识图谱,“她”可以在江汉路步行街小程序上自然地交流,亲切地解答关于街区的问题,介绍江汉路的百年历史,引导游客至目标商户消费,推送街区优惠信息等。
很显然,以上几种数字人,都是采用AIGC相关技术打造,走的也都是类似ChatGPT“大数据+大算力+强算法”的“NPL预训练大模型”技术路线,堪称国内AIGC和NLP大模型的应用典范。
另据东华大学人工智能研究院相关人士透露,AIGC应用中国早有先例,并且有领先技术。例如在2019年4月举行的“2019中国国际服装设计创新大赛”中,被誉为中国版阿法狗的AI设计师DeepVogue夺得该赛事亚军成绩,它采用了AIGC人工智能内容生成技术,设计了三款不同的服装,还获得了由50位大众评审投票选出的“最受大众欢迎奖”。
通过以上这些成功案例,不仅展现出中国科技企业在类ChatGPT产品开发上的技术实力和发展潜力,也证明了我国在AIGC和NLP大模型的开发和应用上,非但不落后,而且还已经为行业赋能。
数字科技的发展,已经先后走过了“互联网+”、“物联网+”、“大数据+”、“云计算+”,今天ChatGPT的出现,意味着“大模型+AIGC”的雏形已现,这是具有划时代意义。
今年1月,微软宣布扩大同Open AI的合作,并追加投资100亿美元。就此,美国《福布斯》杂志评论称,尽管ChatGPT尚无清晰盈利模式,但人工智能的发展潜力是巨大的。
客观地讲,ChatGPT确实带动了全球AI产业的变革。北京智源人工智能研究院院长黄铁军在接受记者专访时就说:“ChatGPT的成功不应仅仅被看作新一代聊天机器人的突破,而应该重视其对人工智能乃至整个信息产业带来的革命。”
但我们也要明了,目前 ChatGPT 还只是一个技术范式探索,功能也主要聚焦在一些开放、规范、通用性的任务上,它的智能还停留在过去完成时,真正颠覆性的技术突破还未到来。对这一点,我们应该有清晰的认识。
总而言之,学习他人所长,抓紧发展契机,无疑是正确的,但发挥自身优势,坚持赛道方向,也是必需的。只有步步为营,走服务民生、赋能百业的道路,未来才会有更多像华为、百度、商汤、深兰这样的中国科技企业在全球大放异彩,AI技术才会如星星之火,燎原中华大地上的各行各业。
大仲马在《三个火枪手》中有句名言:人人为我,我为人人。既然人类迄今所取得的所有AI技术成就,都离不开各行各业的助力,那我们就应该把这些成就,回馈给各行各业,为它们的发展赋能,这才是中国AI发展的正道。返回搜狐,查看更多
责任编辑:
chatgpt应用前景及布局策略 解剖chatgpt背后的核心技术
chatgpt官网,chatgpt国内能用吗,chatgpt怎么用,chatgpt怎么读本文来自微信公众号:硅星人(ID:【【微信】】),作者:章姝敏,编辑:【【微信】】,题图:由Midjourney生成
一个阳光明媚的早晨,住在旧金山的软件工程师Anna像往常一样,坐在电脑前,打开ChatGPT,输入“帮我规划我的一天”。
ChatGPT回答“当然可以!”,随机给出从早上到晚上的日程计划,并提示“你可以根据自己的情况进行调整。”
Anna想了想,在对话框里补充,“我晚上9点要哄娃睡觉,重新帮我规划。”
这一次,ChatGPT的帮她在晚上的日程里添加了“帮助孩子准备第二天上学准备物品”和“帮助孩子洗漱并睡觉”等事项。
随着ChatGPT等AI工具的风靡,Anna身边越来越多的人开始将其作为日常生活和工作的助手。事实上,Anna 不仅会向 ChatGPT 咨询生活安排,也会让它处理一些简单的工作,比如给一段代码添加一个功能等。
不过,当涉及到比较复杂的任务时,即便知道 ChatGPT 很强大,Anna 也觉得有点力不从心,“说了一堆要求,但是它给出的代码经常不是我想要的。”
Anna 的这句话道出了目前困扰不少科技公司的一个问题:在强大的工具面前,如何更好地与它对话,来完成专业任务?
对此,一个新兴职业――提示工程师(Prompt Engineer)应运而生。不少公司对这一职位求贤若渴,开出的薪资甚至高达33.5万美元一年。
提示工程师的主要职责是帮助训练大型语言模型(LLM),让AI能更好地理解需求,完成专业任务。简而言之,他们的任务就是将一个复杂的任务拆分,提炼成长度有限的自然语言,来一步步查询AI工具,从而获得更准确的回答。
用自然语言对话,这听起来是一件再日常不过的事情,可它为什么一下子成为了香饽饽?
重启对话:逻辑让AI更懂需求
在旧金山,AI 研究公司 Anthropic 为提示工程师开出的薪水高达 33.5 万美元。在职位描述中,该公司提到,“这是编程、指导和教学的结合”,主要职责是帮助公司构建提示库,让 LLM 完成不同的任务。
那么,到底什么是提示?提示工程又是什么?
按照学者们的定义,提示是一组输入文本或指令,用于指导 ChatGPT 等 AI 模型生成所需的输出。换句话说,提示是一种特定文本,它的目标是让 AI 模型产出符合特定标准或参数的结果。
提示工程则是创建和完善这些提示,以生成所需结果的过程。提示工程的目标是创建准确有效的提示。提示工程师使用自然语言,并将纯文本命令发送到 AI 模型,让其执行实际工作。相比之下,传统程序员则使用编程语言,通常需要更多的代码编写和技术知识,以执行相同的任务。
而提示工程师的薪资如此之高,很大程度上是因为语言模型的成功取决于编写清晰的提示。这需要工程师们开发复杂的策略,将简单的输入转化为高质量的结果,避免出现离题或者不一致的输出。
目前最出名的提示工程师可能是名为Riley Goodside的程序员,就是他发现,只要提示ChatGPT“忽略之前的指示”,ChatGPT就会说出自己从OpenAI那里获取的“出厂设置”信息。
不仅如此,他还凭借出色的提示技术,把ChatGPT玩出了不少花样,并在Twitter上一炮而红。随后,他高薪加入了创业公司【【微信】】,成为了“世界上第一个被招聘的提示工程师”。
在【【微信】】看来,AI大模型可以被视为一种新型计算机,而“提示工程师”则相当于其编程人员。通过提示工程找到最合适的提示词,可以激发AI大模型的最大潜力。所以,Riley Goodside完全配得上这份薪水。
不止Riley Goodside,还有越来越多的人正在加入这个行业。
29 岁的 Albert Phelps 是AI金融咨询公司 Mudano 的一位提示工程师。他和同事们的日常就是为 OpenAI 等工具编写提示。这些提示可以作为预设,保存在 OpenAI 的 Playground 中,供其客户使用。Phelps 介绍,他们每天需要编写 5 个不同的提示,与 ChatGPT 进行大约 50 次交互。
和大多数程序员不一样的是,Phelps 并没有计算机相关背景,而是毕业于历史系。事实上,对于提示工程师而言,最重要的是逻辑。虽然编程知识和机器学习的背景对工作很有帮助,但却并不是必要条件。
Anthropic 的技术人员 Matt Bell 就曾提到,“我们最好的提示工程师是一位哲学家。好的提示包括写出极其清晰的解释,并找出造成误解的原因以及如何避免误解。”
也就是说,当AI模型的使用者像软件工程师Anna一样,一次性“说了一堆要求”时,可能会因为提示不清晰,而导致AI误解,给出离题的答案。
对此,阿德莱德大学澳大利亚机器学习研究所(AIML)的高级讲师 Ling【【微信】】 指出,好的提示工程的关键是将一项复杂的任务分解成一组简单的任务。
他介绍,如果你问这些模型一个简单的问题(称为“零样本提示”),它通常会以缺乏细节或结构的“普通”答案作为回应。为了让 AI 模型给出更加符合标准的结果,用户可以采取以下几种方式:
第一种方法是一次性提示,即用户给出一对问答示例,让 AI 了解需求,并按照该模板处理后续请求。比如,在咨询关于某一种动物的信息时,让模型根据特点、居住区域、饮食习惯等来给出信息。
第二种是角色提示,例如告诉模型“我是一个妈妈,想要知道每天行程规划”,从而让模型根据“妈妈”的角色来给出具体安排。
第三种方法是引入关键代理。例如,你可以让 ChatGPT 写一个关于机器人的故事,然后让它根据自己的建议进行批评和改写。
最后一种方法是思维链,即先让AI对回答某个问题给出具体步骤,然后再鼓励它依照自己给出的步骤,来推理更复杂的问题。
如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作,或许可以尝试一下这一条来自 PromptHero 的高赞提示:
我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述,以激发 AI 独特而有趣的图像。请记住,AI 能够理解多种语言并能解释抽象概念,因此请尽可能发挥想象力和描述性。例如,您可以描述未来城市的场景,或者充满奇怪生物的超现实景观。您的描述越详细、越富有想象力,生成的图像就会越有趣。这是你的第一个提示:“一望无际的野花田,每一个都有不同的颜色和形状。在远处,一棵巨大的树耸立在风景之上,它的树枝像触手一样伸向天空 。”
总之,对于生成文本的AI模型而言,如何编写出逻辑清晰的提示至关重要。不过,在其他领域,好的提示可能需要更多元素。
构建图像:关键词拓展想象力
随着提示工程的价值被挖掘,这股新鲜血液开始涌向更多场景。图像则是其中最受关注的领域之一。
就图像生成而言,创造者们认为提示的好坏与否取决于关键词。
七个月前,Jason Allen 凭借着下面这张在 Midjourney 上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛。
为了这幅作品,他耗时约 80 小时,在 Midjourney 中测试不同的美学元素,给出不同的主题提示,才呈现出自己想要的图像。
“我想创造一个电影场景,就像你在电影中看到的那样,”他说,“所以我上网查找了所有与电影摄影相关的关键词。基本上就是在学习成为一名电影摄影师。”
通常,AI模型会从互联网上抓取大量图像及其相关文本进行训练。例如,它可能会对一幅婚纱照打上“新娘”、“婚纱”、“捧花”、“微笑”等不同标签,并标记上不同的权重。每个标签会给AI模型相应提示,产生可预测的美感。
“AI艺术的关键在于知道正确的词。就像工程师将设计转化为数学图形一样,它将图像的离散美学元素,比如光线追踪、边缘照明等,转化为模型的特殊语言”,和 Jason 一样通过 AI 来进行创作的另一位艺术家 JHawkk 提到。
JHawkk 在 Stable Diffusion 中制作了上面这张图,其提示包括“模拟风格”、“佳能EF 50mm f/1.8 STM 镜头”等15个短语,以及“恶心”等他不希望出现在图像中的31个负面词汇。
“有时你看到一幅图像,可以将他分解成更小的短语,本质上,这是你描述图像的方式,并且是实际模型本身可以理解的方式。”他说。
JHawkk 居住在美国中西部,他平时喜欢在 PromptHero 上分享自己的作品和相应的提示。
PromptHero 是去年9月成立的在线社区,目前拥有15万名用户,其中 活跃用户就超过1万名。在这里,用户可以找到直接在 ChatGPT、Midjourney 等AI模型和平台中使用的提示。
“我发现了这个问题,当你第一次用它完成某件事时,你的第一次尝试是非常糟糕的,”PromptHero 联合创始人 Ja【【微信】】 说,“你需要以正确的方式提示以获得高质量的输出。”
无论是文本还是图像,如何给出正确提示是一个需要反复试验的过程,正因如此,在过去半年,才会有大量类似 PromptHero 和 PromptBase 等提示交流和买卖平台涌现――他们将验证过的提示直接摆在用户面前。
想做一张可爱考拉的图片?下面这则提示或许可以直接拿走。
觉得英语不过关?下面这则提示或许能让ChatGPT成为你最好的英语老师。
热闹背后的担忧
不管是科技公司开出的高薪,还是提示交流平台的流行,它们无一不在揭示提示工程是一个被多么看好的领域。
不过,这样的热度也引起了不少争议。
首先,AI通过提示创作的作品,版权归谁?
目前,通过提示工程生成的作品与大多数版权法的解释相冲突。在美国,当 Jason Allen 对获奖作品《太空歌剧院》申请版权时,版权局拒绝了他的申请,称“它不包含任何人类作者身份”。
其次,提示工程师的高薪值得吗?
“这可能是泡沫的迹象,” 为亚马逊 Alexa 开发语音控制功能的对话设计工作室 labworks.io 的创始人 Tom Hewitson 说, “最适合做这件事的人是熟悉 AI 的产品设计师或业务分析师,他们的年收入往往在 10 万到 15 万英镑之间。”
最后,提示工程师的职位会存在多久?
不少人认为,提示工程只会成为一种技能,并不需要一个专门的职位。随着AI工具在理解人类查询方面变得越来越好,这个职位会变得越来越过时。
沃顿商学院教授 Ethan Mollick 在 2 月份发推文说:“我强烈怀疑‘提示工程’从长远来看不会有什么大不了的,提示工程师也不是未来会存在的工作。”
剑桥大学机器学习研究主任 Adrian Weller 认为,虽然能够通过提示与AI交互“具有很高的价值”,但“我不确定它是否会继续下去很长一段时间。不要过多关注提示工程的当前。它会很快发展的。”
尽管提示工程师的职业当前备受瞩目,但它到底能够走多远,恐怕只有时间才能解答了。
本文来自微信公众号:硅星人(ID:【【微信】】),作者:章姝敏,编辑:【【微信】】