ai绘画会取代画师吗个人观点 ai绘画为创作者提供灵感
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
如果要评选2023年到目前为止最热门的话题榜,相信AI人工智能一定榜上有名。从文字、图片、甚至视频,AI都能快速生成足以以假乱真的内容,也引发了越来越多人的关注和讨论。
从网上各种声音的变化可以明显看出,大家的心态也从一开始的好奇和好玩,逐渐变成了对AI生成内容真实度的感叹,陆续也开始有了担心被AI替代的焦虑。
其实,科技的发展必然会带来人类做事方式的变化。就像当年汽车替代马车一样,马车车夫的需求量虽然下降了,但汽车司机的需求量上升了。
拿AIGC(AI Generated Content,AI生成内容)中的大热领域AI绘画来举例。如果在社媒上搜索相关话题,可以看到网友已经在讨*司要求美术员工学会AI绘画出图了,据说有严重的甚至开始末位淘汰,学不会就得下岗。
这和汽车替代马车的情况类似:以前绘画的工具是纸笔,后来是Photoshop和Illustrator等软件,未来(甚至已经开始)可能会变成AI绘画工具。不变的是灵感创意(开头)和内容产出(结尾),变的是工具和中间过程。
对于内容生产者而言,需要继续抓牢“开头”的创意能力和“结尾”的把控能力,中间过程的工具变了,就去学习新的工具,变得快,需要学的也快。
一、什么是AI绘画?
AI绘画是通过AI(人工智能技术)实现的一种绘画形式,它使用算法和机器学习模型来生成艺术作品。这些技术使得计算机可以模拟人类艺术家的绘画技巧和风格,并且可以产生视觉上令人满意的结果。AI绘画的应用包括图像处理、虚拟现实、游戏开发、动画制作等领域。
二、什么是念咒(Prompt)?
在AI绘画中,Prompt是指用户输入的文本或图像,用于指导模型生成艺术作品。Prompt通常包括描述作品主题、风格和视觉要素的关键词和短语,模型会根据这些输入生成一幅新的艺术作品。Prompt也可以是一张图片,模型会尝试在该图片的基础上进行创作。
其实就是通过输入文字指令和图像等方式,“”引导“AI生成所需内容的过程。用广告人的话,相当于是给AI下“brief”。
因为AI只是工具,它并不知道你想要的是什么,而且往往很难一步到位一次念咒就生成想要的结果,所以需要多次和AI“念咒”一次次引导和微调,直到生成想要的结果。
网友们形象地给Prompt起了个“外号”叫做“念咒”。就像是魔法世界的魔法师一样,通过念咒吟唱,变出想要的结果。
现在甚至已经有了念咒师这么一个新的职业,英文叫Prompt Engineer,中文叫提示工程师。据网传,2022年12月,第一位被正式聘用的念咒师已经出现。
而AI绘画念咒有可能会变成未来创意内容行业的一个基本技能,就像Photoshop技能一样,写进相关岗位职位要求。
三、AI绘画对哪些职业可能有帮助?
艺术家和设计师:更快速生成草图、原型和设计概念,至少可以作为灵感或草稿再进一步通过人工加工来完成,提高效率,节省时间。
游戏开发者:辅助生成游戏中的环境、角色和道具等元素,节省制作成本和时间,提高游戏视觉效果。
媒体和广告行业: 辅助生成媒体和广告中的视觉元素,如海报、广告牌、标志和漫画等。
建筑师和城市规划师:辅助生成建筑外观和内部布局,以及城市规划方案的可视化呈现。
工业设计师:辅助生成产品的外观设计和造型,进一步提高产品开发的效率和质量。
四、AI绘画如何快速上手?
要想知道梨子的滋味,就要亲口尝一尝。我们以目前最热门的AI绘画平台 【【淘密令】】 (简称SD)为例,参考下面的5个步骤:
1)安装部署AI绘画工具
可以直接到【【淘密令】】的官网注册使用(免费账号会有使用额度限制),也可以安装部署到本地。网上已经有热心网友做好了【【淘密令】】-Webui傻瓜安装包,解压即用。可以在B站搜索”【【淘密令】】 下载 安装”等关键词。为了避免有广告嫌疑,这里就不具体给链接了。
2)先从抄咒语开始模仿体验
就像学习一门新的语言都是先从模仿开始,念咒这门新语言虽然不难(相对于其它编程语言而言),但还是有一定的规则和门槛的。如果完全按照我们平时说话的自然语言念咒,很难得到我们需要的结果。
所以一个很快上手的办法,就是先“抄咒语”(模仿),在一些AI作品交流网站或者社群,经常会有网友分享自己生成的作品和对应“咒语”,包括输入的指令和设置等。可以先拷贝粘贴一些作品的咒语来模仿生成类似的作品,然后再对个别咒语进行微调,从而获得自己想要的结果。这个过程就慢慢的入门了。
3)“学语法”和“背单词”
语法包括咒语的一些规则和写法(比如英文逗号用于分隔不同词组,英文括号用于强调/增强权重等),以及工具设置;单词则是一些常用的词组(目前SD只支持英文)。在Prompt框中输入时,下拉菜单里也会自动弹出一些提示词组用于辅助。比如可以用【【淘密令】】官网的Prompt Search Engine作为辅助,了解一下实际的Prompt的写法“词组搭配”作为参考。
学会了语法和单词,就能逐渐不再需要从抄咒语(模仿)开始,而是从0开始自己和AI对话念咒,从而生成想要的内容了。
做完以上3步,至少就可以开始尝试生成一些内容了。但我们会发现生成的和网上咒语对应的作品差别太大了,甚至可能是很奇怪的图。这是为什么呢?因为网上的作品可能用到了不同的模型。如果想要模仿的像,就得去下载相应的模型文件。
傻瓜安装包里自带的有AI模型,直接可以使用。如果想要体验不一样的效果和风格,就需要下载更多的定制化主模型。有很多网站可以下载到,如某C开头的网站。
下载的定制化主模型文件放在本地根目录下的 Models/Stable-diffusion文件夹里。
5)下载微调训练模型
有很多种fine-tune微调训练模型,如DreamBooth、TextualIn【【微信】】、ControlNet、LoRA等。以LoRA为例,英文全称是 Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应。可以理解为大模型基础上的一个小模型或插件,已经按照某个方向训练过大模型,并“冻结”了相关参数,从而让使用者不再需要从0开始往某个方向训练模型。
打个可能不一定准确的比方:类似于“预制菜”,比如买一盒“猪肚鸡”预制菜,用户可以直接在这个基础上按照自己的口味添加或修改(比如额外加一些“蔬菜”进去,或者多放一些“盐”),就可以做出猪肚鸡这道菜了,最多就是蔬菜放多了或者太咸了,或者是有所创新的猪肚鸡,但它大方向还是猪肚鸡,不会说做出来发现是宫保鸡丁。
比如如果是某个游戏人物角色的LoRA,就可以通过在念咒中加上这个LoRA,让生成作品里的人物特征符合这个游戏人物角色,看起来就像是这个游戏人物角色的新的原画。
当然,如果找不到现成的微调训练模型,也可以自行训练模型(很多玩家称之为“炼”)。这个就属于比较进阶的玩法了,这篇文章里不做展开。
下载的LoRA文件放在本地根目录下的 Models/Lora文件夹里。
通过上述5个步骤,只要有基本的电脑使用能力,应该就可以开始上手体验AI绘画了。当然,上手容易精通难,想要熟练掌握AI绘画,还需要更多练习与实践,我也还在学习摸索中。相信随着AI的进一步进化以及人类的进一步推动(比如微软把AI集成到Office套件中),未来AI生成内容的门槛会越来越低。
张亮(Leon Zhang),BCW博雅公关北京数字与创意董事总经理,中国传媒大学广告学院专业讲师,曾就职于竞立媒体/群邑集团、博雅公关、麦肯光明、微软,持有中国人民大学商学院企业管理硕士学位,系福布斯中国撰稿人,表达观点仅代表个人。
AI军备竞赛七日谈:巨头八倍速狂飙!一文看懂近期AI行业“排位赛”战况
alyx军备竞赛,ai军事,ai评估军事战备水平,军备竞赛b站财联社3月22日讯(编辑 唐叶天)2023年的人工智能赛道,自微软打响注资OpenAI头一炮后,热度逐渐升温。海内外科技巨头纷纷加入AI军备竞赛,至3月中下旬渐至白热化。从底层硬件至终端应用,近一周时间内,各家头部竞争者纷纷加快产品发布节奏,本文将盘点一周AI行业竞争白热化的战况。
[云服务]谷歌向开发人员开放其大语言模型PaLM的API接口
PaLM是是谷歌在2022年发布的语言大模型,而后又在此基础上发布了逻辑性更强的大模型PaLM-E,可处理多模态信息。本次API接口开放后,用户能通过谷歌云和AI建构工具MakerSuite来构建AI模型,并根据特定要求定制API,比如将聊天机器人功能编程到特定的应用程序中。
[AI+办公]谷歌所有Workspace办公组件将上线生成式AI功能
Google Workspace是谷歌的一整套办公组件,包括Gmail以及Google Doc、Sheets、Slides等。谷歌将生成式AI模型接入后,用户将拥有通过剪短摘要在Gmail中生成完整电子邮件的选项,以及生成AI图像,音频和视频等新应用。此举显示了谷歌在AI军备竞赛中保持领先地位的决心。也喻示着AI协同办公新时代开启。
[大模型] OpenAI发布多模态预训练大模型GPT-4
相比上一代模型,GPT4.0升级显著,文字输入限制提升了7倍、开始支持图像输入、回答准确性显著提高、创作能力进一步提升、幻觉问题得到改善、安全防护能力增强。在解释梗图和对创造力要求较高的人类考试中表现亦优秀。但随着模型复杂度加大,也大幅提升了算力需求。
[大模型]百度发布大语言模型、生成式AI产品文心一言
发布当日,百度展现了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大方面的能力。背后是百度从芯片层(昆仑芯)、框架层(飞桨)、模型层(文心大模型)、应用层(C端应用、B端应用)的全栈人工智能技术。在3月27日,百度将召开新品发布会,发布文心一言云服务及应用产品。
[AI+办公]微软发布Microsoft 365 Copilot,将AI功能全面接入Office等应用软件
Microsoft 365 Copilot无缝集成了GPT-4模型,提供的功能包括包括编写和编辑文档、制作演示文稿、完成数据分析和制成可视化图等。使办公场景的AI助手应用跨入新阶段。机构认为有望从根本上改变人们的工作方式,并开启新的生产力增长浪潮。
[AI+图像]Midjourney生成的人类情侣图片刷爆互联网
Midjourney v5是AI图像生成式应用Midjourney的最新迭代版本,解决了手指无法准确描绘的问题。经测试,Midjourney v5生成的1990年代中国情侣照片效果逼真。机构认为,随着AIGC工具加速迭代,各类场景下的商业应用有望率先落地。
[底层硬件]NVIDIA在2023GTC大会上发布四种配置与体系架构的推理平台L4|L40|H100 NVL|【【微信】】、GPU光刻软件N【【微信】】
其中,H100 NVL是两个H100 GPU通过NVLink拼接在一起的非消费级GPU,专门用于训练大型语言模型(LLM)。机构认为,计算成本是讨论AI应用发展的核心问题,本次英伟达推出更高效算力方案为行业解决基建痛点。
[云服务]人工智能云服务N【【微信】】、NVIDIA Base Command?平台软件
N【【微信】】使企业不需要采购与拥有服务器设备,可通过云服务供应商合作托管的DGX Cloud基础设施租用算力,价格为37000美元/月。随着算力租用的开放,任何企业都可拥有构建AI的可能。英伟达方面表示,甲骨文将成为租用服务的第一个合作伙伴,微软、谷歌云也将加入。
[云服务]谷歌Bard有限开放公测
Bard是ChatGPT的竞品,曾于2023年2月8日,微软将ChatGPT接入Bing搜索引擎时短暂上线,因出错遭谷歌撤下相关演示的官方视频。3月重新发布的Bard测试版目前仅支持英语,且不具备编码能力。但谷歌强调本次为“早期实验”。
[AI+视频]Runway发布文字生成视频模型Gen-2
[AI+图像]Adobe发布创意生成式AI应用Firefly
机构表示,应用端在AIGC的加持后,有助于提升数字内容的体验,从文字、图片、视频、短视频、沉浸式、互动式等媒介的演变,均说明新技术可带来内容、媒介发展新红利。”