庆云古诗词

庆云古诗词

广发策略优选基金270006净值查询 广发策略今日行情

互联资讯 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

广发策略优选基金净值,广发策略优选基金净值历史,广发策略优选基金今日净值查询,广发策略优选基金 270006分红

报告摘要

● 我们自 23.3.2 持续六篇报告推荐数字经济 AI+ 投资机会,判断 AI 的“奇点时刻”已经到来,将贯穿 23 年投资机遇。

在本篇报告中,我们试图从策略视角,自上而下理解本轮“AI+”的行情。

结合策略的DDM框架以及产业发展趋势的研究,我们发现本轮“AI+”行情与13年“移动互联网+”行情十分相似,因此我们在本文中从策略角度提供一个对“AI+”行情理解的新视角――

为何说“AI+”与13年“移动互联网+”十分相似?策略视角下5大相似点。

①技术的革命性突破,带来新一代场景革命,“移动互联网+”和“AI+”分别是两大场景革命;②均是产业生命周期迎来彻底的应用拐点,产业内生性催化剂不断喷薄而出的同时,外部政策催化剂进一步刺激;③海外宏观背景:美联储货币政策边际转松。12年末美联储开启QE3 &;;;;;;; QE4;23Q2美联储加息周期尾声,全球流动性将迎拐点;④国内宏观背景:经济处在复苏通道上,但复苏弹性偏弱如地产弹性不足;社融持续改善;外需对出口拉动不足,出口增速回落;⑤股市微观流动性:市场以“存量博弈”为主导,显著的增量资金尚未明晰。

短期节奏和长期战略来看,行情上涨的时间和空间如何判断?

①本轮“AI+”的第一波上涨波动加大但趋势未变,拥挤度的极致并不一定引发行情结束;②类似行情下,行情的首次回调幅度并不大;③中长期来看,行情空间较大,时间跨度较长,且“盈利印证”重要但并非行情持续性的决定性条件。我们认为本轮“AI+”行情可能小荷才露尖尖角!

上涨的路径:贯穿行情的主线具备怎样特征?行情节奏的线索为何?

①借鉴13年“移动互联网+”两大主线数字媒体与影视院线的行情,贯穿行情的主线必须同时具备三大要素:内生产业发展催化、外部政策持续刺激、盈利印证;②行情分三阶段,沿着产业链轮动:第一阶段行情以上游硬件为主,第二阶段扩散到中游软件、服务,第三阶段进一步下沉至下游应用;③如何判断不同阶段行情的切换信号?三大指引指标:外部政策催化、行业内生催化、阶段性回调;④借鉴13年“移动互联网+”行情,我们认为本轮“AI+”行情也将分三阶段走:上游算力→中游软件服务→下游应用。当前行情仍在第一阶段,我们重点首推“上游算力”(AI芯片/服务器交换机/光模块光芯片/液冷温控/互联网)同时投资者需要关注向第二阶段“中游软件服务”(网络安全/AI大模型/数据平台/分布式数据库)和第三阶段“下游应用”(办公软件/智能家居/游戏/教育/智慧工厂)的切换信号。

风险提示:疫情控制反复,全球经济下行超预期,全球通胀超预期,AI发展和政策不及预期。

报告正文

引言:AI奇点时刻到来,“AI+”堪比13年“移动互联网+”!

我们自23.3.2持续六篇报告推荐数字经济机遇,这是23年最值得重视的或将贯穿全年的投资机遇!报告详细梳理数字经济“三大预期差→三大趋势→三大投资线索”、数据要素&;;;;;;;数字基建两大基石,数字经济“位置感”,以及由AI引发第四次场景革命。我们于4.3发布《与风共舞:从经典科技牛看AI浪潮》提出,AI的奇点时刻已经到来,我们当前站在新一轮产业浪潮的拐点,AI技术的革命性突破让世界对通用人工智能的可能性打开了想象空间,产业前景带来的投资机遇不仅局限于“主题”范畴,可能是新一轮指数级别产业行情的拐点。从具体投资视角来看,我们于4.2《主线抓牢――“思?变”的Δ三重奏》中提示,基于五大相似点,本轮“AI+”类似13年的“移动互联网+”,中长期来看当前AI行情可能小荷才露尖尖角!

在本篇报告中,我们进一步深度挖掘“AI+”与13年“移动互联网+”的异同,试图从策略视角,自上而下理解本轮“AI+”的行情。结合策略的DDM框架以及产业发展趋势的研究,我们发现本轮“AI+”行情与13年“移动互联网+”行情十分相似,因此我们在本文中从策略角度提供一个对“AI+”行情理解的新视角――

站在策略DDM框架和产业发展趋势研究视角,如何理解当前“AI+”与13年“移动互联网+”5大的相似点――技术革新引发场景革命、内外催化剂加持、海外宏观环境、国内宏观环境、股市流动性?

?行情的时间和空间维度上,借鉴13年“移动互联网+”行情,如何展望本轮“AI+”的行情和节奏?如何理解“业绩印证”对于“场景革命”技术引领下的行情的作用?

? 投资的具体实施路径上,“AI+”细分环节的投资顺序和路径为何?行情发生切换的触发原因,是内生产业催化剂、外部政策催化剂,还是交易拥挤度抑或是估值要素?

“AI+”与13年“移动互联网+”:5大相似点

站在策略DDM框架和产业发展趋势研究视角,基于“技术革新引发场景革命、内外催化剂加持、海外宏观环境、国内宏观环境、股市流动性”五大相似点,我们认为本轮“AI+”与13年的“移动互联网+”十分类似――

2.1 相似点1:技术革新引发“场景革命”

技术的革命性突破,带来新一代场景革命,“移动互联网+”和“AI+”分别是两大场景革命。“移动互联网+”是智能手机与APP开启的,以外卖、团购、打车为代表的移动互联网场景革命;而本轮的“AI+”,则是以AI技术突破,推动从“万物互联”到“万物赋能”的跨越的新一轮场景革命(详见3.30《AI:第四次场景革命》)

1. 2013年移动互联网技术下的“场景革命”:智能手机与APP拉开“移动互联网”序幕,4G技术为移动互联网插上翅膀,PC互联网时代迈向移动互联网时代。

2007年苹果公司发布第一代iPhone,同年谷歌正式推出Android操作系统,成功占领移动终端市场,标志着移动互联网时代的正式开启。2008苹果正式推出应用商店App Store,带动了整个互联网开发和应用模式的重大变革。中国移动互联网萌芽于2000年,中国移动推出了移动互联网业务品牌“移动梦网",涌现出一大批基于梦网的服务提供商,用户可以通过短信、彩信、手机上网等模式享受移动互联网服务。2009年,工业和信息化部为中国移动、中国电信和中国联通发放第三代移动通信牌照,标志着中国正式进入3G时代,移动网速的大幅提升初步破解了手机上网带宽瓶颈,移动智能终端丰富的应用软件让移动上网的娱乐性得到大幅提升。

2010年以后随着智能手机的全面崛起,中国移动互联网得到飞速发展,更加深入地改变着人们的日常生活,迎来了移动互联网场景革命。2010年国内微博迎来春天,基于微博平台的政民沟通、公益参与、信息公开体系迅速发展;2011年腾讯推出为智能终端提供即时通讯服务的应用程序微信,2012年微信朋友圈上线,彻底改变了传统的社交方式;2013年余额宝上线,大幅降低理财门槛,唤醒了公众的理财意识。尤其是2013年工信部正式发放了4G牌照,网速的大幅提高推动互联网应用全面发展。2014年“滴滴打车”上线,改变了传统的扬招叫车模式,“互联网+”交通出行深入人心;各大网游公司纷纷推出各类手游,抢占市场份额,其便捷性与移动性对端游造成较大冲击。在21世纪的第二个十年,社交、电子商务、餐饮出行、教育等领域出现了前所未有的变化,构成了本世纪第二次场景革命。

2. 本轮AI下的场景革命:2023年,以AIGC(ChatGPT)为首的AI下游应用迅速铺开,标志着“场景革命4.0”到来,推动完成从“万物互联”到“万物赋能”的跨越――

(1)三大“场景革命”驱动力:①数据要素:自5G技术大范围应用开始,数据要素逐步起量,至AI技术应用场景铺开,数据要素重要性进一步凸显(正向影响经济增长/企业盈利)。②数字技术:同时赋能数据的六大使用环节,推动B端、C端、G端场景全方位变革。③政策加持:数字转型同时作为产业升级与消费升级的重要抓手,持续获得政策加持,上升至国家战略层面。

(2)“场景革命4.0” 11大新场景赋能:AI为首的数字技术赋能出行、社交、办公、搜索、娱乐、居住、教育、生产、管理、金融、医疗等11大场景、37个细分场景。

(3)新场景新应用:B、C、G端优质数字新场景:①B端:生产场景:智能工厂(数字化车间、工业机器人);管理场景:企业云服务(云ERP);运输场景:智慧供应链(无人矿车、无人港口集装)。②C端:工作场景:在线办公(办公云平台、AI辅助办公软件);生活场景:智能家居(对话式AI操作助手)、聊天机器人(ChatGPT);学习场景:智慧教育(教育新基建、教育云)。③G端:政务服务:智慧政务(政务云);城市治理场景:智慧城市(智慧交通、智慧安防)。

2.2 相似点2:内外催化剂持续刺激

本轮“AI+”与13年“移动互联网+”均是产业生命周期迎来彻底的应用拐点,产业内生性催化剂不断喷薄而出的同时,外部政策催化剂进一步刺激。

1.产业内生性催化事件不断:

(1)2013年被视为中国智能手机发展元年,智能手机的广泛普及为移动互联网+的应用和并购投资热潮做了铺垫。苹果4G手机“iphone5”的首次发布更是把智能手机的技术推向了高潮。而后中国三大移动网络运营商开始布局相关4G通信,4G牌照的正式颁发更是标志着我国电信产业进入4G时代。移动互联网的爆发给众多领域带来了变革,最重要的是移动APP市场的蓬勃发展。腾讯在2013年推出的微信5.0正式开启了微信的商业化版图,其中“微信支付”等功能的推出更是为“移动互联网+”行情起到了推波助澜的作用。

传统行业也逐步与互联网几乎结合,形成“互联网 +”模式,包括电子物流、电子商务、互联网教育、互联网医疗和互联网金融等都是传统行业在移动互联网下的升级创新,P2P、余额宝等相关线上金融产品也陆续浮现。同样的,“移动互联网+”也加快了新兴行业的发展,包括手机游戏、移动视频和移动阅读等,移动端娱乐成为了人们日常生活的必需品,内需的逐步扩大业带来产业的深化发展。

在技术升级的牵引下,互联网行业迎来一轮并购热潮,阿里巴巴5.86亿美元入股新浪微博,腾讯4.48亿美元注资搜狗,百度宣布19亿美元全资收购91无线,创下中国互联网并购案的金额新纪录。并购热潮进一步洗牌行业、升级行业,移动互联网行业的资本运作在13年显得格外热闹。

(2)本轮AI+,则是在ChatGPT的带动下,首次将AI推进到社会生活中,而后3月发布的GPT-4,作为chatgpt3.5模型的升级,则是在技术面对AI的持续深化起到催化作用。

在AI应用方面,短短3个月的时间,微软先后从代码优化、数据安全以及办公软件等方面发布了Microsoft 365 Copilot、Security Copilot、GitHub Copilot通过ChatGPT完成对各类应用的优化升级。除此之外,GPT也在一些传统互联网企业中发挥出自己独特的智能作用。微软开始找寻Azure OpenAI服务在游戏开发中的应用场景;第五代Midjourney结合ChatGPT,修复了手部绘画不逼真等难题。同时,在国内AI方面,百度推出“文心一言”产品,首次提出“中国GPT”概念。

本轮AI行情下,模型的研发投资和使用成为了互联网投资并购的核心。2023年1月,微软以678亿元收购OpenAI的49%的股权。对于国内方面而言,2023年4月核芯互联完成数亿人民币B轮融资,本轮融资金额在本年度所有B轮融资中排名前5%。

在此类内生性催化剂的推波助澜下,AIGC产业或将成功落地,颠覆各行各业,掀起内容生产力改革。目前AIGC产业的相关应用仍如雨后春笋般涌现,AI技术的突破会持续带来内生性的催化剂,新型应用将持续不断的映入我们眼球。

2. 外部政策持续催化:

(1)2013年,外部政策持续催化移动互联网的发展。2月《关于促进信息消费扩大内需的若干意见》、8月《关于促进信息消费扩大内需的若干意见》、9月《关于组织实施2013年移动互联网及第四代移动通信产业化专项的通知》纷纷表明国家对移动互联网发展的大力支持及普及移动互联网的决心。

传统行业寻求“互联网 +”模式的浪潮下,相关政策出台鼓励产业共振。例如13年1月,国家广电总局下发《广电总局关于促进主流媒体发展网络广播电视台的意见》,鼓励电台电视台与宽带互联网、移动通信网等新兴媒体结合。

在移动互联网蓬勃发展的背景下,叠加美国“棱镜事件”爆发,信息安全也受到重视,与网络信息安全相关的政策也陆续出台。例如,2013年7月,工信部公布《电信和互联网用户个人信息保护规定》,充分维护网络信息安全。

(2)本轮AI+,数字中国相关政策持续推出,数字经济按下加速键。在短短的2个月,国家便多次出台利好数字经济相关行业的政策,2月发布的《数字中国建设整体布局规划》明确表明数字中国建设的重要性,数字经济和实体经济深度融合将是不可逆的时代潮流。

产业共振方面,2月23日国务院办公厅印发《关于进一步深化改革促进乡村医疗卫生体系健康发展的意见》,大力推进“互联网+医疗健康”。在AI+与各产业深度融合的浪潮下,预计国家将出台更多产业共振政策,鼓励产业的深度数字化。

数字安全方面,2月《个人信息出境标准合同办法》公布,规范个人信息出境活动。在AIGC引发信息安全热议的背景下,国家政策出台有利于维护使用者权益,进而保障AI行业的可持续发展。鉴于本轮AI+对数据流动共享的高要求,预计国家将出台更多数字安全相关政策。

2.3 相似点3:海外宏观环境

13年初和当前,海外宏观环境均迎来了相似的环境:美联储货币政策边际转松。12年末美联储开启QE3 &;;;;;;; QE4;23Q2美联储加息周期尾声,全球流动性将迎拐点。

1. 12年末:QE3 &;;;;;;; QE4重新释放流动性,海外市场流动性持续宽松。12年9月美联储宣布了第三轮量化宽松货币政策(QE3),同年12月美联储宣布了第四轮量化宽松货币政策(QE4),全球流动性和风险偏好均迎来改善。

2. 23年二季度:美联储加息路径愈发清晰,全球流动性迎来拐点。从去年3月至今,美联储已进行9次加息。但随着SVB、瑞士信贷事件相继发生,美债深度利率倒挂的副作用已经显现。美联储在3月FOMC中对加息的表述由“为控制通胀而持续加息”转为“一些额外的政策紧缩可能是合适的”,叠加3月FOMC会议美联储加息至4.75%-5%之间,散点图显示2023年政策利率预期中位数为5%-5.25%,指向本次加息或已至尾声。北京时间3.31美国2月核心PCE物价指数出炉,美国通胀数据重回“低预期”轨道,上一次美国通胀数据从略高于预期进入略低于预期是22年11月10日;美国3月ADP就业人数低于预期、3月Markit服务业PMI低于预期等数据,进一步提升了市场对于美联储即将停止加息甚至年内降息的预期。我们在12.27《美加息尾声,关注大类资产拐点!》指出,鉴往知今,美债利率的顶部拐点领先美联储最后一次加息2个月左右。在美联储加息路径愈发清晰的背景下,当前全球流动性也将迎来拐点。

2.4 相似点4:国内宏观环境

13年“移动互联网+”行情国内宏观环境背景,与当前的具有相当的相似性:①经济处在复苏通道上,但复苏弹性偏弱如地产弹性不足;②社融持续改善;③外需对出口拉动不足,出口增速回落――

1. 13年宏观经济背景:整体呈现复苏,但复苏力度不算强劲;基建强于地产;外需对出口拉动不显著。

(1)2012年初随着经济增速的快速下行,政府采取了“新一轮”的经济刺激政策,推动基建投资增速快速拉升。地产销售降幅收窄、地产新开工逐步回暖,地产行业景气有所回升,但复苏弹性较弱;基建投资增速自12年起不断回升,虽于13年4月触顶,但此后保持在较高增速。

(2)社融得益于基建的宽松得到明显的改善,2012年4月开始,社融企稳,13 年上半年社融增速大幅回升,政策的宽松逐步传导到信用端。但经历6月“钱荒”后, 13年下半年起,社融增速有所回落。

(3)外需对出口拉动较弱。13年,在QE的助推下美国经济有所回暖,零售数据、财政赤字等多项数据表明经济有所好转,但QE退出的预期与债务上限谈判使美国复苏程度有限。在德法等国的带动下,欧盟经济衰退也有所减缓,但债务危机阴霾未全部消散,仍对欧盟经济复苏有较大阻碍。整体而言,海外经济体弱复苏,13年出口增速回落。

2. 23年宏观经济展望:经济整体复苏,但地产复苏向上弹性不强且存在滞后期,叠加“此消彼长”下本轮中国经济复苏缺乏外部共振,经济复苏的弹性受到压制。社融开始上行,国内宏观经济环境与13年相似。

(1)一方面,23年地产渐进复苏,但地产链修复力的政策力度介于12年与15年之间,地产投资修复动能较弱。当前地产销售“量价”数据均有所改善,1-2月商品房销售面积同比下降3.6%,降幅明显收窄;2月份全国70个城市新建商品住宅价格指数环比涨幅为0.3%,为21年9月以来首度转正。考虑到本轮地产链“稳增长”迫切性明显强于12年,但在本轮“房住不炒”下,地产投资修复动能较弱,预计修复弹性同样将较小,修复力度或将介于12年与15年之间。地产销售修复到投资启动一般要8-10个月的滞后期,即便23年初地产销售“量价”数据改善,地产投资改善也要等到4季度以后,对23年经济的拉动效果有限。

(2)本轮中国经济的复苏缺乏外部共振,导致经济复苏的弹性受到压制。历史上的A股盈利周期与海外经济周期往往共振,而23年外需回落+出口下行的背景下(类似13年、19年),23年A股的盈利上行周期或与历史周期相比缺乏弹性。

(3)历史上来看,类似当前“商品房销售增速下行的底部区域+企业信贷规模与居民信贷规模显著劈叉”并存出现后,广义流动性往往得到显著的改善。历史上类似组合期间共有4个:08年12月、12年2月、15年2月、2020年2月。其中,08年12月和12年2月前后基建政策出现显著的改善,基建增速的快速提升带来广义流动性的改善;而15年2月、2020年2月前后则是房地产等部门的信用环境出现了显著的改善。鉴古知今,我们预计在2023年1月再次出现“商品房销售增速下行的底部区域+企业信贷规模与居民信贷规模显著劈叉”的情况后,广义流动性有望出现持续的改善。

2.5 相似点5:股市微观流动性类似

13年和本轮的股市微观流动性具备类似的特征:市场以“存量博弈”为主导,显著的增量资金尚未明晰。

1. 13年:增量资金有限,市场“存量博弈”。在“移动互联网+”行情主导的2013年,证券市场交易结算资金基本保持在5500-6500亿元的区间内波动,没有大幅增加,而同期股票+混合型基金的份额自2.0万亿不升反降、至1.8万亿左右水平,表明市场维持存量资金。存量资金格局下,13年投资者经历了明显的换仓行为。

2. 23年:增量基金尚未明确,新成立基金份额尚未显著回暖。新成立基金份额持续上行往往需要同时具备两大要素:①显著持续的赚钱效应;②居民其他可配置资产收益率趋势性下行。当前新成立基金份额大幅上行的重要条件“显著持续的赚钱效应”尚未完全满足,基金份额的大幅回暖尚需时日。

“AI+”展望之1:行情上涨的时间和空间研究

全方面对比下,本轮“AI+”的第一波上涨因交易拥挤波动加大但趋势未变;中长期来看,当前AI行情可能小荷才露尖尖角!

3.1 第一波行情 &;;;;;;; 第一波回调的时间与空间

第一波行情:时长来看,13年“移动互联网+”行情第一波持续快速上涨时长为93天,截止4月6日AIGC指数的第一波上涨时长为66天,尚有一月之距离;涨幅空间来看,截止4月6日本轮AIGC上涨的幅度47.1%,尚远低于“移动互联网+”时期的第一波上涨幅度67.7%;而本轮AIGC估值的拔升幅度32.7%,也低于“移动互联网+”第一波行情时拔升的72.1%。

首次回调:拥挤度是催化剂,行情波动增大,但回调幅度并不大。13年“移动互联网+”第一波回调时,TMT的拥挤度(成交额占比)达到过去三年新高11.9%,市场波动增大;回调的持续时间和幅度分别为40天和-11.5%。但后续市场继续上涨,拥挤度持续创下新高,行情中拥挤度最高接近30%。当前TMT的拥挤度达到38.2%(截至2023年4月6日),接近19年拥挤度极值。但19年拥挤度两次触及39%,TMT的总行情均未结束,仅引发短暂的回调或波动性增大,之后TMT行情继续上行。我们认为,本轮“AI+”的第一波上涨因交易拥挤波动加大但趋势未变。

3.2中长期来看,“AI+”行情小荷才露尖尖角

中长期来看,AI+行情空间较大,时间跨度较长,且“盈利印证”重要但并非行情持续性的决定性条件:13年A股“移动互联网+”行情几乎贯穿全年,总时长达到322天,总涨幅则是超过了250%。具体来看,以互联网指数为代表,13年的“移动互联网+”总共经历过3次较为典型的回调,回调时长分别为40、17、19天,回调幅度分别为11.5%、9.5%、13.7%,整体回调时长和幅度并不大,而每一次回调均是买入的机会。

“盈利印证”重要但并非行情持续性的决定性条件。而移动互联网场景革命下的“移动互联网+”行情还有一个重要的特征:行情中估值的贡献远大于盈利。在整个 “移动互联网+”行情中,整合行情中涨幅最高、占据行情主导地位的互联网指数几乎所有涨幅均由估值贡献,即“盈利印证”虽重要但并非行情持续性的决定性条件;但我们将在下文进一步论述,能够实现“盈利印证”的行业更容易具备持续地、贯穿整个行情的上涨动力。综上所述,我们认为中长期来看当前AI行情可能小荷才露尖尖角!

“AI+”展望之2:上涨的路径―催化剂、盈利印证还是估值更重要?

复盘13年“移动互联网+”行情,我们发现有两条明确的主线:一方面存在两大贯穿整个行情阶段的主线行情;另一方面,市场行情又大体沿着“移动互联网”产业链,呈现“自上而下”的轮动行情。

主线行情方面,能够贯穿整个行情的主线行情(涨幅接近甚至超过200%)需要同时具备三大要素: 内生产业发展催化、外部政策持续刺激、盈利印证。但我们进一步研究发现:①同时具备内


平息画师怒火:Stable Diffusion学会在绘画中直接“擦除”侵权概念

平息怒火表情包,平息怒火图片,平息怒火是什么意思,平息怒火的方法

选自arxiv

机器之心编译

编辑:rome rome

Stable Diffusion 学会了「偷天换日」的本领。

任何一个创作过程,都是始于「模仿」、终于「创造」。对于 AI 来说,这一学习过程也是相同的。

近期,开源版本的 Stable Diffusion 文本到图像的扩散模型,使图像生成技术得到极为广泛的应用,但是如何规避*或风格侵权是需要解决的问题,作者提出 Erased Stable Diffusion(ESD)方法,有效的解决了前面的问题。

文本到图像生成模型备受关注,其具备优秀的图像生成质量和看似无限的生成潜力。诸如此类的生成模型都是基于大规模的互联网数据集进行训练的,这使它们能够学习很广泛的概念。然而,模型生成的一些概念是不受欢迎的,比如受版权保护的内容和*内容。

如何尽量避免模型输出这些内容呢?在最近的一篇论文中,来自美国东北大学、麻省理工学院的作者提出了一种在预训练之后有选择地从文本条件模型的权重中删除单个概念的方法。

论文链接:【【网址】】/pdf/2303.07345v1.pdf

此前的方法侧重于数据集过滤、post-generation 过滤或推理指导,而本文提出的方法不需要重新训练,这对于大型模型来说是不可思议的。基于推理的方法可以审查或有效引导模型输出的方式以避免生成不需要的概念。相比之下,本文的方法直接从模型的参数中将概念移除,从而可以安全地分配其权重。

图像生成中的安全问题

Stable Diffusion 文本到图像扩散模型的开源,让图像生成技术得到了极为广泛的应用,但也带来了一些问题。

为了限制不安全图像的生成,第一个 Stable Diffusion 版本绑定了 NSFW 滤波器,以便在滤波器被触发时审查图像,但由于代码和模型权重都是公开可用的,因此滤波器很容易被禁用。

为了防止敏感内容的生成,随后的 Stable Diffusion 2.0 模型对过滤的数据进行训练,以删除明显有问题的图像,实验是在 50 亿张图像的 LAION 数据集上进行的,消耗了 15 万个 GPU 时。

如此一来,整个过程的成本之高,使得在数据发生变化与涌现能力之间建立因果关系这件事极具挑战性。有些研究人员反映,从训练数据中删除明显问题图像和其他主题可能会对输出质量产生负面影响。?

尽管作者们付出了一系列努力,涉及*的内容在模型的输出中仍然很普遍:当作者使用 Inappropriate Image Prompts (I2P) 基准测试的 4703 个 prompt 来评估图像的生成结果时,他们发现当前流行的 SD1.4 模型生成了 796 张暴露的身体部位的图片,而新的受训练集限制的 SD2.0 模型产生 417 张类似图片。

另一个问题是,文本到图像模型所模仿的作品可能是受版权保护的。AI 生成的艺术作品不仅在质量上与人类生成的艺术相媲美,而且还可以忠实地复制真实艺术家的艺术风格。Stable Diffusion 和其他大型文本到图像合成系统的用户发现,诸如「art in the style of [artist]」之类的 prompt 可以模仿特定艺术家的风格,从而有可能产生侵权的作品。此前,也正是因为多位艺术家的担忧,导致了一场针对 Stable Diffusion 制作主体的法律诉讼 ―― 艺术家指控 Stable Diffusion 侵犯了他们的作品。为了保护艺术家,最近的一些工作尝试于在线发布艺术作品之前对艺术作品应用对抗干扰,以防止模型模仿它。然而,这种方法并不能从预训练模型中删除模型本已学习到的艺术风格。

因此,为了解决安全和版权侵犯的问题,本文的作者们提出了一种从文本到图像模型中「擦除概念」的方法,即 Erased Stable Diffusion(ESD),可以通过微调模型参数来实现擦除,而不需要额外的训练数据。

相比于训练集审查方法,本文提出的方法速度更快,并且不需要从头开始训练整个系统。此外,ESD 可用于目前已有的模型,无需修改输入图像。相比于 post-generation 过滤或简单的黑名单方法,「擦除」是不容易被绕过的,即使用户可以访问参数。

方法

ESD 方法的目标是使用自身的知识从文本到图像扩散模型中擦除概念,而不需要额外的数据。因此,ESD 选择微调预训练模型而不是从头开始训练模型。本文方法专注于 Stable Diffusion(SD),一个由三个子网络组成的 LDM,包括一个文本编码器 T、一个扩散模型 (U-Net)θ 和一个解码器模型 D。

ESD 通过编辑预训练的扩散 U-Net 模型的权重 θ 去除特定的风格或概念。ESD 是受到了无分类器指导方法和基于分数的合成等工作的启发。具体来说,使用无分类器指导的原则来训练扩散模型,将模型的分数从想要消除的特定概念 c 中擦除,例如「【【微信】】」这种词语。利用预训练模型对概念的认知,同时让其学习将微调输出的分布的质量从该概念中移除。

扩散模型的 score-based 的公式中,目标是学习条件模型的分数。使用贝叶斯规则和

可得出:

这可以解释为具有来自分类器 pθ(c|xt) 的梯度的无条件 score。为了控制条件性的影响,作者为分类器梯度引入了一个指导因子 η

作者希望通过反转的行为来否定概念 c,因此使用负面版本的指导来训练 θ。此外,受到无分类器引导的启发,作者将等式 5 的 RHS 从分类器转换为条件扩散。

基于 Tweedie 公式以及重新参数化技巧,对数概率 score 的梯度可以表示为通过时变参数缩放的 score 函数。修改后的 score 函数移动数据分布以使对数概率 score 最大化。

方程 7 中的目标函数通对参数 θ 进行微调,使得 θ(xt,c,t) 来模拟负向引导噪声。因此,在微调后,编辑过的模型的条件预测会远离被擦除的概念。

下图展示了训练过程。利用模型对概念的知识合成训练样本,从而消除了数据收集的需要。训练使用几个扩散模型实例,其中一组参数被冻结(?),而另一组参数(θ)被训练以擦除概念。使用 θ 对条件 c 下的部分去噪图像 xt 进行采样,然后对冻结模型进行两次推理以预测噪声,一次在条件 c 下,另一次是没有任何条件。最后,线性组合这两个预测结果以抵消与概念相关的预测噪声,并将新模型朝着新目标调整。

实验

艺术风格去除

为了分析对当代实践艺术家中的艺术模仿情况,作者选取了 5 位现代艺术家和艺术作品进行考察,分别是:Kelly McKernan、Thomas Kinkade、Tyler Edlin、Kilian Eng 以及「Ajin:Demi-Human」系列作品。据报道,这些作者或作品都曾被 Stable Diffusion 模型模仿。虽然作者没有观察到该模型直接复制某些特定的原创艺术作品,但不可否认的是,该模型必然捕捉到了这些艺术风格。

图 5 展示了相关定性结果,作者还进行了用户研究(图 6)以衡量人类对艺术风格去除效果的感知。最终的实验结果验证了该观察结果,即模型已经去除了特定艺术家的风格,同时保留了 prompt 内容和结构(图 5),并且对其它艺术风格的干扰最小。

显式内容删除

在图 7 中,与 Stable Diffusion v1.4 相比,*分类样本的百分比变化。作者通过使用推理方法(SLD)和过滤再训练方法(SD V2.0)研究了 ESD 的有效性。对于所有模型,使用的都是由 I2P prompt 生成 4703 张图像。他们使用 Nudenet 检测器将图像分类为各种*类别。结论是,在弱擦除比例 η=1 时,在所有类别中,ESD 方法在擦除*方面效果更显著。

物体去除

表 2 中展示了原始 Stable Diffusion 模型和 ESD-u 模型在训练过程中擦除目标类时分类准确性的对比结果,同时展示了在生成剩余的九个类时的分类准确性。结果表明,ESD 能够在大多数情况下有效地去除目标类,尽管有一些类别(比如教堂)比较难去除。但未被去除的类别的分类准确性仍然很高,即使某些情况下会有一些干扰,例如,去除「法国圆号」会对其他类别造成明显的失真。作者在补充材料中提供了物体去除后的视觉效果图像。

更多研究细节,可参考原论文。