人工智能饭碗能抢掉吗 人工智能引发的失业怎么看
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
【深圳商报讯】(记者涂竞玉)3月14日,ChatGPT开发机构OpenAI正式发布其具有里程碑意义的多模态大模型GPT-4;微软也在3月16日宣布,让AI替程序员开发App的功能问世。
被誉为ChatGPT之父的阿特曼16日接受美国ABC访问时表示,ChatGPT可能是“人类迄今最伟大的技术”。这项“最伟大的技术”的出现,让很多人担忧自己在未来“饭碗不保”。
“GPT-4太吓人了,未来人类互联网大部分工种岌岌可危。”一名受访者说。
欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松日前在接受采访时曾表示:“GPT-4可能会给从事相对简单编程工作的程序员带来一定的压力,但这种压力也会促使程序员追求自身进步。对于程序员来说,需要提高写复杂代码、处理复杂问题的能力,程序员能解决的问题越困难,机器能做到的可能性就越小。”
对此,他并不认为人工智能会大范围替代人。“从机理来说,机器的定位还是帮助人,作为人的得力助手帮人做相对简单的智力工作,让人从一些繁复的智力工作中解脱出来。而人在做复杂工作的时候,机器也可以帮人省掉一些事,大幅提高工作效率和质量。”
“本质上看,人工智能难以取代高级的智力活动,反而可能使人受益。越能体现人智慧、体验、悟性的深层次的东西,对机器来说就越复杂、越难以取代。”
北京大学深圳研究院5G&6G课题组组长胡国庆认为,人工智能在短时间内有可能会取代部分人的一个工作,这是技术发展的必然。但是从长远来看,它所带来的变化是大范围缩短我们劳动时间,在某些领域,它仍然无法完全取代人类。“例如在需要人类创造力、判断力和创新能力的领域,如艺术、设计、创意等,ChatGPT仍然无法与人类相媲美。此外,对于涉及到人际交往、情感认知和道德判断等领域,如医生、心理咨询师、社会工作者等,ChatGPT也难以取代人类的角色。”
深圳商报记者通过注册用户向GPT-4提问道:“人工智能的出现,会导致一批人失业,还是在一些职业中会创造新的机会?”
它表示,人工智能的出现确实会对某些职业造成影响。但它认为,人工智能将为许多行业和职业带来新的机会和创新,例如医疗保健、金融服务、交通运输等行业。 “因此,虽然人工智能可能会对某些职业产生影响,但它也会创造新的机会和就业,而且许多职业也需要学习新的技能,来适应人工智能时代的发展。”
(文章来源:深圳商报)
上线一个月成为准独角兽、上万人排队注册,AI Art是下一个NFT?| 全球行业mapping
一个月能上王者吗作者 | 刘雨洁、王与桐
如果说人们对于效率性人工智能的定义是自动驾驶、数据分析、无人工厂等等,那么创造性人工智能的边界在哪里?
在文字创作领域,彩云小梦、Jasper、清华九歌等AI写作服务早已给出过令人震撼的答案。为无数网文作者开拓了思路,也在将文字创作的门槛压得更低的同时,收到了种种非议。而在美术创作领域,一直到今年上半年Disco Diffusion红极一时,才引发热议。
短短几个月内,AI Art成为了全球VC都在追捧的赛道:符合目前最火的PLG模式、拥有底层壁垒的AI技术、是科技和人文完美的交叉点、大批体验者蜂拥而至。
来源网络
上图为国内最大的平面设计师社区UISDC上首次出现关于Disco Diffusion的科普文章,设计师是对图像创作工具最敏感的群体之一,彼时大多数C端用户还并不知道这一“黑科技”的存在,即使知道,也会因为它复杂的调试环境失去参与测试的欲望。
不过五个月,Disco Diffusion的流行引发了一场从Google Colab Notebook发酵而来的共享式实验革命。据知情人透露,解决了Disco Diffusion技术痛点的追随者、上线于2022年8月22日的Stable Diffusion,目前正在以5-10亿美元的估值接触融资。上线一个月,就有望跻身全球独角兽阵营,足以见得一级市场对于AI Art未来的看好。
网友十月十七用Disco Diffusion生成了24节气。
AI Art即AI生成艺术,是AIGC里面的一个分支。AIGC(Artificial Intelligence Generated Content)是“继专业生成内容(Professional Generated Content,PGC)和用户生成内容(User Generated Content,UGC)之后,利用人工智能技术自动生成内容的新型生产方式”。在国际上对应的术语是“人工智能合成媒体(AI-generated Media或 Synthetic Media)”,其定义是“通过人工智能算法对数据或媒体进行生产、操控和修改的统称”。
事实上,AI生成图像与画作,从技术和商业化角度,也已经分别拥有相当长的历史,并非新兴领域,而是一个不断革新迭代的技术领域。
早在2015年,Google就发布并开源了DeepDream,通过算法生成迷幻和超现实的图像。近十年的时间里,大到数字化合成,小到曾经风靡互联网的“一键生成新海诚风格照片”、“生成童年照片”等图片效果等,都在体现着AI能力和算力基础的不断优化成熟。
Google DeepDream生成效果,生成痕迹非常明显
AI Art今年以来的热度,是因为一种呈现为文字转图像(Text-to-image)特性的崭新交互方式,正在向大众宣告AI Art正在进入一个“民主化”的时代。使用文字描述,或者基于画面意象和故事,或者基于艺术家风格、构图、色彩、透视方法等专业名词,就能在数十秒内生成完整的绘画作品,这让艺术创作成为了一件像跑步一样的事:人人都会跑步,只不过是专业的人跑得更快。
还原到底层技术方面,则是一场Diffusion对GAN的彻底革新。
传统AI Art的的技术原理是生成对抗网络(GAN)或VAE等,目前,GAN作为上一代AI Art工具与平台最主流的图像生成模型,在模型训练方面已经有了很大的突破,但在实际应用的过程中仍然拥有严重的结构性问题。
随着热度升温,可能会取而代之的是Diffusion。Denoising Diffusion Models(去躁扩散模型)作为一种基于分数的生成模型,是一种非常强大的新型生成模型。其工作原理就是通过反复地向训练数据添加高斯噪声来破坏训练数据,然后通过反转添加噪声的过程来学习如何取回数据。Diffusion还提供大量样本多样性和学习数据分布的准确模式覆盖,这意味着Diffusion适用于具有大量不同和复杂数据的学习模型,从而解决了GAN的问题。Diffusion缓慢改变输入数据将数据映射到噪声的正向变换,通过学习的、参数化的反向过程来完成数据生成。该过程从随机噪声开始,一次一步地进行清理。
来源网络
Diffusion对图像生成效果的提升十分显著,数字生成的痕迹也得到了有效削弱,用户自己可选执行步数,步数越多图像越精细的特点也激起了更多的“硬核”需求。
来源网络
这也就是为什么AI Art工具其实从很早之前就有了,但此前的图像效果经常会有“太假”或者不够完整等种种问题,甚至不如直接用Photoshop做一些风格化处理,因此这些作品也就失去了如今Diffusion时代作为艺术品的收藏与分享价值。
通过指数级爆发的帖子和作品展示,以Disco Diffusion、Stable Diffusion、DALL-E2、MidJourney这些算法和工具为代表的生成器,已经成为了AI生成向C端落地、以及更广阔的元宇宙世界的先发力量。
上图记录了足以让人们真正关注到AI Art领域的一起标志性事件:一副AI生成艺术作品在科罗拉多州博览会艺术比赛中获得了第一名。
目前,AI Art工具主要也还在欧美等国家发展较快,国内起步稍晚,参与者主要是在AI 领域或者图片编辑领域有较多积累的大厂,比如百度、美图等。
本文,36氪梳理了全球范围内正在流行的AI Art工具,分析其差异和共性,给国内有类似想法或者能力的创业公司、想要在AIGC方面做出投资的投资从业者以借鉴。
由于目前市场上的AI Art工具和服务中仍然有相当一部分使用的底层算法是DeepDream或者GAN,而近期热度主要来自Diffusion,因此我们把它们分成了两类。
Stable Diffusion是时下最先锋、也是最流行的AI绘画机器学习模型,上线于2022年8月22日,由StabilityAI开发,Web演示版本搭载于AI开源社区Huggingface。StabilityAI是一家创立于2019年的人工智能初创公司,总部位于伦敦,致力于构建以AI为技术载体的解决方案。目前,Stable Diffusion正在测试其商业版本DreamStudio,后者具有更快的生成速度,同时即将上线API功能。据知情人士透露,StabilityAI正在被Coatue、Lightspeed等知名VC考虑以5-10亿美元的估值进行投资。
开源,免费使用支持文本生成图像、图像生成图像两种模式Web演示版本生成速度非常快,预计生成图像只需要1到15分钟(生成时长与排队有关)
来源:Stable Diffusion
Disco Diffusion具有一个强大的开源 CLIP-Guided Diffusion 模型,基于谷歌技术架构,可以创建详细、逼真的图像。上线于2021年10月29日,由Accomplice开发,Accomplice是一家创立于2016年的公司,致力于帮助每个团队和个人找到适合他们的 AI 驱动的图像工作流程。
开源,免费需要通过Google Colab生成,没有更友好的用户界面,有使用门槛用户可以自己定制步数等高级选项
来源:Disco Diffusion
DALLE2可以从自然语言的描述中创建逼真的图像和艺术,上线于2022年4月6日,由OpenAI开发。OpenAI由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得・蒂尔等硅谷科技大亨在2015年创立。此前,在DALLE2尚未正式发布时,每周仅向1000名用户发布,9 月 29 日,OpenAI 已经取消了访问其文本生成图像系统 DALL-E 2 的等待名单,任何人都可以立即注册使用。OpenAI 称,大约 150 万 DALL-E 用户每天生成超过 200 万张图像。
文本到图像生成仅仅需要几分钟,生成的图像的多次迭代编辑和修饰功能,可以自定义多层图像渲染人脸方面,为了防止图片造假,DALL-E2会故意生成歪七扭八的眼部,或是扭曲的嘴唇任何注册访问 DALL-E 的人都将免费获得 50 个点数,此后每月可再获得 15 个点数,每个点数可用于生成一张图片,点数可以购买,115 个售价 15 美元
来源:DALLE2
Mid Journey是一个流行但尚未普遍可用的AI艺术生成器。Midjourney 是一个独立的研究实验室,探索新的思想媒介并扩大人类的想象力。Midjourney 是一个小型自筹资金团队,专注于设计、人类基础设施和人工智能。Midjourney 是托管在 Discord 服务器上的 AI 文本到图像扩散模型。目前已经有150万用户。
演示版易于使用,仅需要提供一个小文本输入基于Discord,有良好的社区生态文档详尽,对开发者友好
Mid Journey
TIAMAT是由国内团队研发的一款人工智能绘画工具,于2022年7月22日上线,公司总部位于上海。目前还处于内测版本。
支持中文输入主要面向中国用户群体,更理解东亚艺术风格基于飞书社区,申请制内测
TIAMAT
Photosonic由AIGC公司Writesonic开发,位于美国旧金山,此前专注于AI文本创作。目前,Photosonic已经生成了超过一百万张图像。Photosonic在Stable Diffusion上线后一周上线,据Stable Diffusion创始人形容,Photosonic AI是抄袭了Stable Diffusion的开源版本。
Photosonic AI
DeepDream作为市场上最受欢迎的AI艺术生成器之一,上线于2015年6月,是由谷歌工程师 Alexander Mordchatgpt 创建的计算机视觉程序,可以探索不同的 AI 算法。目前,市场上大量艺术效果生成应用都基于这一开源技术
NightCafe(https://nightcafe.studio/)
NightCafe上线于2019年11月,由Reddit开发。Reddit是一娱乐、社交及新闻网站,创立于2005年2月3日,总部位于旧金山,致力于为世界上每个人带来社区和归属感。通过NightCafe,用户可以获得所生成艺术作品的所有权,也可以购买作品的打印版本。
Artbreeder上线于2019年5月,由Joel和 Studio Morphogen创建。Artbreeder旨在成为一种新型的创意工具,通过让协作和探索变得更容易来赋予用户创造力。Artbreeder 使用BigGAN和 StyleGAN 模型。其中一个使用BigGAN的最小开源版本。
Big Sleep是一个基于Python的AI艺术生成器。由谷歌开发,其使用 BigGAN 和 OpenAI 的 CLIP 通过 Google Colab 笔记本从 Twitter 用户 Adverb 生成文本到图像。需要通过Python编程语言生成,处理图像需要一段时间和大量内存,有可能无法在计算机上运行脚本。
StarryAI是一个AI艺术生成器App,目前在Google play上已经有超过50万的下载量。作为移动应用,有iOS和Android版本,可以在移动端使用,支持创建NFT,同时支持生成步数等进阶选项。
Wombo是一家总部位于多伦多的合成媒体公司,曾于2021年3月推出了一款由AI驱动的对口型App,允许用户上传任何静止的肖像并对其进行动画处理,以唱出他们选择的歌曲,该产品引发了爆发式裂变。目前,WOMBO Dream算法应用的是OpenAI开发的CLIP所引导的方法。
于2017年成立于旧金山,曾于2019年获得种子轮融资。DeepAI使用HTML5、Google Analytics和jQuery等12项技术产品和服务。DeepAI的技术包括chatgpt、iPhone/Mobile兼容和GoogleFontAPI等。最初其功能是将黑白照片自动上色为彩色。
Imagen
2022年5月,Google Research发布了Imagen。此次谷歌的Imagen抛弃了从文本特征映射到图像特征再用GAN或扩散模型生成图像的常规思路,而是使用纯语言模型只负责编码文本特征,把文本到图像转换的工作丢给了图像生成模型。这里的图像生成模型,依然是扩散模型,是一系列的扩散模型。这就意味着其纯文本数据获取方面和全面性方面比获取图文对数据容易,其文本理解能力上比图文对数据的理解能力强。
Parti
2022年6月,Google公布了其Parti文本到图像的计算机模型,该模型通过研究数百亿个参数来渲染超现实图像。Parti 全称为“Pathways Autoregressichatgpt”(路径自回归文本转图像)。随着可使用参数数量的增长,其输出的图像也能够更加逼真。该模型在生成最终图像之前研究了200亿个参数。
Parti与Imagen不同,Imagen是一种文本到图像生成器,谷歌设计用于扩散学习。该过程通过在图像中添加“噪声”来训练计算机模型,使其变得模糊。然后,该模型学习对静态图像进行解码,以重新创建原始图像。随着模型的改进,它可以将看起来像一系列随机点的东西变成一幅图像。
目前,谷歌没有向公众发布Parti或Imagen。
Meta于2022年7月官宣Make-A-Scene的存在,目前,该团队正在测试并收集 Meta 员工的反馈,Make-A-Scene 正在Meta内部开放使用权限。Make-A-Scene可以捕捉预先设置的场景布局,使草图也成为输入内容的一部分,然后用户通过文本输入来对框架进行填充。该模型还可以通过输入文本来创建自己的布局,但这意味着用户放弃了部分控制权。
2022年3月,微软亚洲研究院最新推出的多模态模型 NüWA。NüWA 支持八大视觉生成和编辑任务。其中,支持图像的四类任务包括:文本到图像,草图到图像,图像补全,图像编辑;支持视频的四类任务包括:文本到视频,视频草图到视频,视频预测,视频编辑。7月,微软亚洲研究院公开发表了新的研究成果:NUWA 的升级版――无限视觉生成模型 NUWA-Infinity,可生成任意大小的高分辨率图像或长时间视频。
文心・一格是基于文心大模型的文生图系统实现的产品化创新。上线于2022年8月19日。这是百度依托飞桨、文心大模型的技术创新推出的“AI 作画”首款产品。百度的AI-飞桨文心大模型,是产业级知识增强大模型。文生图领域的大模型服务,支持输入一段文本描述,并选择生成风格和分辨率,模型就会根据输入的内容自动创作出符合要求的图像。
涵盖了国潮,国风等风格依靠百度的算力,出图快,完成度高操作简单的同时也可以高级自定义
美图AI开放平台是美图公司推出的AI服务平台,专注于人脸技术、人体技术、图像识别、图像处理、图像生成等核心领域,为客户提供经市场验证的专业AI算法服务和解决方案。
美图在人脸技术、图像分割、图像增强、图像生成等多个方向存在优势拥有长期的审美积累,能够把握美的趋势,实现艺术与技术的有机结合前沿技术能快速与产品结合,日调用量逾亿次,兼具稳定性与实用性
AI生成在社交媒体上的泛滥讨论一直带有科学伦理方面的色彩和偏见,而关于图像生成技术的讨论则始终由艺术爱好者、设计师、艺术家这类人群在推动,因此,AI Art所带来的关于艺术设计生产效率、知识产权、图像数据复用等方面的延展和保护性服务可能会是下一个市场风向。
另外值得一提的事,近期在全球最大的产品社区Product Hunt上,已经出现了针对AI Art的艺术作品交易市场。这可能是自NFT流行以来又一个新兴的垂类版权交易赛道。
AI Art交易市场
如果优质的AI Art可以卖出一个好价钱,那无疑将会出现一个“全民艺术家”的时代。
当然,任何新兴的技术,在开始都会经历万众瞩目的阶段,之后不免会被市场“失望”之音淹没。AI Art现在正在早期繁荣期,未来,的确也还有一些难点需要攻克。