【AIIG观察第160期】布鲁金斯学会：欧洲GDPR对美国新隐私法的参考价值

互联资讯 2023-05-15 21:32:03 0

淘宝搜：【天降红包222】领超级红包，京东搜：【天降红包222】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

观察记录30篇,观察记录范文大全,观察.cn,观察记录大全

海外智库观察

「布鲁金斯学会：欧洲GDPR对美国新隐私法的参考价值」

2023年3月1日，布鲁金斯学会 (Brookings?Institution)?发布其非常驻高级研究员马克・麦卡锡（Mark MacCarthy）撰写的评论文章《美国政策制定者可以从欧洲关于个性化广告的决定中学到什么(What U.S. policymakers can learn from the European decision on personalized ads)》。文章表示，欧洲数据保护委员会（European Data Protection Board, EDPB）依据欧洲《通用数据保护条例（General Data Protection Regulation，GDPR）》裁定了Meta定向广告对提供社交媒体服务来说并非严格必要，并驳回其“广告是提供社交媒体服务所必需”的主张。如果EDPB对Meta公司个性化广告做法的驳回决定得到了欧洲法院的支持，可能会进一步要求社交媒体公司和其他网络企业大幅修改以数据为重点的广告业务模式。目前，美国总统拜登以及美国国会两党正在重新推动国家隐私立法，作者认为，在这样的背景下寻求建立新的隐私法的美国政策制定者应考虑在欧洲方法的基础上进行修改，将可供选择的合法性标准，如服务的必要性、同意或合法利益等关键思想纳入美国法律，使其成为美国新国家隐私法的一部分。

作者首先介绍了两种制定隐私制度的方法。GDPR采用的是规范性的标准，当数据处理符合“对于提供服务是绝对必要的”、”经用户同意“、”数据处理者或第三方的合法利益需要“这三个标准时，数据处理是合法的。这种方法所蕴含的规范理论是，数据的使用是合法的，因为它维护了用户的自主权，或者是为了数据处理者或公众的合法利益。并且，法律基础制度不需要宣布具体列举何种做法是合法的。例如，法规中无需说明公司为信息安全目的使用个人数据是合法的。相反，它提供了显示特定数据使用的标准，如用于信息安全将被认为是合法的。公司和监管机构可以使用这样的标准，将广泛的数据做法视为合法。而另一种方法是列举法，即简单列出批准或允许的用途。如去年颁布的《美国数据隐私和保护法（American Data Pri【【微信】】, ADPPA）》，其中列举了合法且具体数据做法。但列表法的局限性在于没有统一标准，仅列举了合法的用例，这样无法证明公司其他使用数据的方式是合法的。随着商业用例和技术的发展，这样的静态清单将是不全面的。作者对此表示，隐私法应纳入一些开放式的标准，以使法律能够及时跟上创新发展。

其次，作者指出，美国目前的隐私法中缺少定义“合法利益”和“同意”作为合法标准的解释。GDPR的合法利益标准采用了开放式的标准，并创建了一个平衡测试来界定是否合法。其中规定，任何数据处理只要是“为了公司追求的合法利益所必需的”，都是合法的；当数据处理违反用户利益、基本权利、自由时，是不合法的。因此，作者认为应将合法利益标准或类似内容纳入隐私提案，并结合列举法在其中附上一份国会认可的合法数据处理活动清单，来为一些典型的商业数据做法提供合法依据。此外，基于合法利益的法律可以使企业在获得监管部门批准的情况下，证明不在预先批准的清单上的特定数据使用符合合法的标准。根据GDPR，”同意“意味着，即使用户拒绝同意，企业也必须在相同的条款和条件下提供相同的服务，或者向用户提供合理的激励措施以促使其同意。但目前，企业已经滥用了该标准，并用侵入性和不具信息性的通知来轰炸用户。因此，隐私法不仅要限制企业反复征求用户同意和提供无用信息，还要避免过度依赖将用户同意作为数据合法用途的唯一标准或最重要的方式。以GDPR的模式为基础的强有力的同意制度与目前美国的通知和选择制度非常不同，后者通常依赖于较弱的选择形式。例如，当苹果为用户提供是否让应用程序以广告为目的跟踪他们上网的选择时，绝大多数用户都表示他们不想被跟踪。ADPPA采用了这一强有力的同意概念，但在ADPPA允许的数据使用清单中明显缺乏同意的要素，这意味着公司不能以用户同意为法律依据来证明其数据处理的合理性，也意味着用户将无法通过拒绝同意来保护自己免受破坏性数据行为的影响。

作者进一步指出，解释和执行这样法律基础的隐私制度，需要一个警觉的、灵活的和资金充足、拥有大量的自由裁量权和规则制定权的隐私监管机构，并配备知识丰富的技术专家和行业专家，以确保法规可以切实落地。美国可以参考英国在解释合法权益标准和欧洲数据保护机构在解释其自身有关合同必要性，以及同意的关键条件的法定文本方面所做的工作。如果国会想进一步限制监管的自由裁量权，并确保解释的一致性不随机构官员变化而变化，它可以直接将英国合法利益准则中出现的一些因素纳入法规中。目前，联邦贸易委员会（Federal Trade Commission，FTC）作为国家的数字隐私监管机构需按照ADPPA要求提供充分的资金，包括建立一个单独的隐私局来实施新法律。

最后，作者针对定向广告指出，ADPPA和GDPR都采取了将直接营销视为合法利益，同时给予消费者绝对的权利来选择退出定向广告的方式，而给予用户反对权力的关键问题在于公司可以在多大程度上为允许个性化广告提供奖励。例如，加州隐私法禁止对“不公正、不合理、胁迫性或高利贷性质”的数据共享提供经济激励。ADPPA可能需要规定在选择退出定向广告方面的标准，来帮助执行隐私监管机构界定经济激励是否合法。美国的隐私立法应该明确规定执行隐私机构有制定规则的权力，以解决定向广告问题。此外，在数据处理的法律基础方面，也有类似的解释和执行问题。新的隐私法规应该为该机构提供规则制定权，以解释和实施同意、合同必要性和合法利益的法律标准。最终，美国新的国家隐私法应该建立在ADPPA的坚实基础上，要求公司有数据处理的法律依据，并应在现有包含合法的服务必要性标准的基础上，将同意和合法利益相关的表述作为额外的合法性标准添加到ADPPA中，这些措施将在法律中规定一个可行的框架，以评估商业行为是否侵犯了用户的隐私权，同时也将有力地表达国家对隐私的承诺。

马克・麦卡锡（Mark MacCarthy）：布鲁金斯学会技术创新中心非常驻高级研究员, 乔治敦大学研究生院传播、文化和技术项目以及哲学系的兼职教授，专注于研究新兴技术治理、人工智能伦理、隐私、技术竞争政策等问题。

原文链接：

https://www.【【淘密令】】.edu/blog/techtank/2023/03/01/what-u-s-policymakers-can-learn-from-the-european-decision-on-personalized-ads/

行业舆情追踪

国内动态

政府规划

「国际数据公司：2026年中国人工智能市场总规模预计将超264.4亿美元，五年复合增长率将超20%」

3月30日，美国国际数据公司（International Data Corporation，简称IDC）最新预测数据显示，中国人工智能（AI）市场支出规模将在2023年增至147.5亿美元，约占全球总规模十分之一。受疫情、地缘政治及宏观经济等因素的影响，IDC小幅下调了2022年中国AI市场规模，相比2021年增长约为17.9%。长远来看，AI技术的创新迭代驱动了应用场景的进一步落地，同时企业对自身“数字化”、“数智化”转型的积极推动催生出对AI技术的多元化需求，为中国AI市场规模的长期增长奠定了基础。IDC预计，2026年中国AI市场将实现264.4亿美元市场规模，2021-2026五年复合增长率（Compound annual growth rate，简称CAGR）将超20%。在五年预测期内，AI领域的主要支出仍将来自于专业服务领域的行业用户，紧随其后的是政府和金融行业，三者合计约占市场总量的一半以上。增长最快的行业分别为银行和地方政府，五年CAGR均超23%。

来源：和讯网、环球网科技

「惠州：培育壮大数字政府产业生态，推动人工智能等数字产业企业落户」

3月30日，《惠州市数字政府2.0建设赋能实体经济发展十条措施》（简称《措施》）正式印发，旨在推动数据要素、数字技术和实体经济深度融合，释放海量数据价值，赋能实体经济特别是制造业高质量发展。《措施》指出，要强化低空经济产业发展优势，建设“惠云眼”全方位社会感知体系，加强物联网、人工智能、虚拟现实技术等新一代信息技术与地理信息数据融合应用，鼓励惠州无人机制造及应用领域企业参与“数字湾区”“硬联通”建设，打造具有本地特色的无人机产业集群。同时，要培育壮大数字政府产业生态，推动惠州市数字政府建设产业联盟实体化运营，成立惠州市数字政府网络和数据安全协会，利用相关奖补措施推动5G、大数据、人工智能、工业互联网等数字产业企业落户惠州。

来源：惠州发布

科技公司

「华为计划扩大在拉丁美洲和加勒比地区的云生态合作伙伴网络」

3月31日，在阿根廷布宜诺斯艾利斯举行的华为云拉丁美洲合作伙伴峰会上，华为拉美云业务总裁Fernando Liu表示，华为云业务部门将采用全服务战略，依靠产能和创新，寻求扩大其在拉丁美洲和加勒比地区的合作伙伴网络，从而发展华为全球云生态系统。华为将致力于在拉丁美洲建立新的云区域（核心数据中心集群）和可用性区域（A【【微信】】，简称AZ，即较小的数据中心枢纽）。Liu还表示，华为云目前在拉丁美洲和加勒比地区的云生态系统中拥有1400多个合作伙伴，是增长最快的云服务之一。长期以来，华为努力通过与中小型公司以及加速器和孵化器合作来发展其合作伙伴生态系统，在拉美地区总共有九个可用区。华为云以“E【【微信】】”（一切皆服务）为理念，致力于构建智能世界的云基础。华为全球云生态系统总裁Ken Kang表示，华为持续扩展其全球云基础设施KooVerse，目前拥有29个云区域和75个可用性区域，服务于170多个国家和地区。

来源：Bnamericas

「阿里巴巴新专利公布，可根据文本自动生成推广文案」

3月31日，阿里巴巴（中国）申请的一项“文案生成方法、文案优化方法、模型生成方法及计算设备”专利获批公布。根据摘要，该专利可从目标对象的相关信息中，提取至少一个文本元素，并组合生成待处理文本，利用文案生成模型，生成目标对象推广文案。其中，所述文案生成模型利用对象推广样本文案及其乱序样本训练获得。基于该专利，阿里可以实现根据既有的词条或其他文本元素，自动生成与产品相契合的推广文案，并能够确保质量。

来源：快科技

「百分点科技发布数据科学基础平台DeepMatrix」

3月31日消息，国内数据科学基础平台及数据智能应用提供商百分点科技宣布推出数据科学基础平台DeepMatrix，该平台将助力数据工程师、数据分析师和数据科学家们便捷高效地将数据转化为业务知识并辅助决策和行动。据悉，该平台具备两大特征：一是知识化，平台不断沉淀领域中的数据科学知识，包括程序性知识、事实性知识和概念性知识，助力传统企业的数字化转型；二是智能化，平台内置了智能辅助开发系统，可以自动化地辅助开发者选择方案以及完成数据适配，并智能化地进行方案精调和改进，同时还能在数据治理的多个环节依托知识库及语义理解等智能技术帮助开发者提高效率。其中，在数据建模方面，平台内置了机器学习算法以及在行业里面积累领域模型，支持语义分析能力；在知识应用层面，平台支持包括数据搜索、人工智能+商业智能分析（AI+BI）、智能辅助开发以及通过对话形式实现代码编写和智能问答。

来源：TechWeb

「杉数科技发布智能决策新产品，助力企业实现精细化管理」

3月31日消息，杉数科技日前发布两大智能决策产品平台，面向零售快消的决策优化产品“计划宇宙”（Planiverse）与面向工业制造的决策优化产品“数弈”（LibraMind）。据悉，Planiverse基于新一代智能决策技术，帮助企业构建预测优化-模拟-协同的供应链计划分析决策闭环，精准感知需求，敏捷响应变化，智能辅助决策，有效助力企业实现精细化、一体化、差异化运营管理。LibraMind则是工业智能制造决策优化平台，以新一代智能决策技术直面复杂决策难题，统筹全业务要素，高效求解，全局优化，构建工业制造“决策大脑”，打破企业数智化转型核心壁垒，帮助企业实现前瞻性规划、高柔性响应意见多目标优化，完成从“制造”到“智造”的跨越。

来源：TechWeb

「腾讯发布人工智能（AI）创作助手，可创建数字人分身」

3月30日，腾讯公司发布消息称，正式发布AI智能创作助手“腾讯智影”，并推出智影数字人、文本配音、文章转视频等AI创作工具。其中，智影数字人能实现“形象克隆”和“声音克隆”，创作者通过上传少量图片、视频和音频素材，就能得到自己的数字人分身和定制音色，进而快速生成数字人播报视频。此外，腾讯智影还接入了数字人直播，在视频影像剪辑创作AI方面，生成式人工智能的文本自动生成视频技术，是一项革命性的技术创新，大幅提升了视频内容的生产效率和质量，同时也为创作者提供了更多的创意空间和自由度。

来源：每日经济新闻

「阿里妈妈序列化智能投放技术发布，实现新一代人工智能技术的快速集成」

3月30日，阿里妈妈宣布其核心技术升级，并发布了序列化智能投放技术。据悉，序列化智能投放技术，即消费路径全域全旅程归因技术MTA+（Multi-touch Attribution）、内容化智能营销快车ACE+（Alimama Content Express）、营销隐私计算平台SDH（Secure Data Hub），实现了新一代人工智能技术的快速集成，有助于商家进行有序的组合投放，实现全域经营力的提升。

来源：36氪

技术应用

「全球首个商用海底数据中心首舱在海南陵水下水」

3月31日，全球首个商用海底数据中心首舱在海南陵水下水，这也是海南海底数据中心示范项目的首舱。据悉，该海底数据中心设在陵水黎族自治县英州镇清水湾，由岸站、水下中继站、水下数据终端和海缆组成，具有省电、省水、省地、高安全、高算力、低延迟的综合优势。在项目建设过程中，海南电信在海底数据舱部署天翼云海南海底媒体存储节点、内容分发网络（Content deli【【微信】】，简称CDN）节点以及海南省国资云节点，为海南省各行各业打造数字化转型支撑底座。下一步，海南电信将启动亚洲快链海缆（Asia Link Cable System，简称ALC）等国际海缆和国际海缆登陆站的建设，海缆主干道连接香港和新加坡，海缆总长度超5000公里，助力陵水打造区域数据汇聚流转枢纽。

来源：中国新闻网

「腾讯云数据库性能打破世界纪录，每分钟处理8.14亿笔交易」

3月30日消息，权威机构国际事务处理性能委员会（Transaction Processing Performance Council，简称TPC）披露，腾讯云数据库TDSQL性能成功打破世界纪录，每分钟交易量达到了8.14亿次。这标志着我国国产数据库技术取得新的突破。据悉，TPC-Benchmark C（简称TPC-C）是全球数据库厂商公认的性能评价标准（Benchmark），它模拟超大型高并发的极值场景，同时有一套严格的审计流程和标准，对数据库系统的软硬件协同能力要求极高。为通过这一考验，腾讯云数据库把单机性能优化到极致，同时利用分布式数据库的优势，成功抗住了每分钟8.14亿笔交易。单节点最高支持180万每秒请求量（【【微信】】，简称QPS）。同时在超高压下稳定运行8小时无抖动，波动率仅为0.2%，远超TPC-C审计要求。此外，审计员还对TDSQL数据库进行了两次随机物理机器断电和一次腾讯云实例的故障模拟，TDSQL在18秒内迅速完成了故障容灾切换，并保持了大盘稳定。这得益于TDSQL数据库日常积累的容灾、备灾能力。

来源：北京科协、澎湃新闻

元宇宙

「爱奇艺奇遇与京东科技达成战略合作，布局产业元宇宙方向」

3月30日消息，爱奇艺旗下扩展现实（Extended reality，简称XR）品牌奇遇所属母公司青岛梦想绽放科技有限公司与京东科技近日签署战略合作协议，将在品牌业务智能化平台建设、全域用户增长、产业元宇宙等领域展开创新合作。据悉，双方将以数智化为支点，推动品牌营销提效及XR消费者体验升级。同时，结合双方产业元宇宙发展战略与诉求，二者将联合探索在元宇宙园区、元宇宙文旅等方向线上线下融合等新业务模式，共同拓展在企业端和政府端双方业务的合作。

来源：新京报

国际动态

政府监管

「美国国会讨论是否应暂停“大型人工智能实验”」

3月31日，在以埃隆・马斯克（Elon Musk）为代表的科技领袖联盟签署反对“大型人工智能实验”的公开信后，美国国会议员就是否应该暂停高级人工智能训练展开讨论。佛罗里达州共和党众议员Brian Mast表示赞成，他认为暂停“大型人工智能实验”是为了保护美国人民的数据和网络隐私。众议员【【微信】】认为“大型科技公司正在利用无限豁免权来压制人们的权利”。

来源：Fox News

「意大利为调查涉嫌违规行为封锁ChatGPT」

3月31日，意大利数据保护监管机构宣布暂时屏蔽人工智能聊天机器人 ChatGPT，并对其涉嫌违反数据隐私规则的行为展开调查。据悉，意大利数据保护机构已下令即刻限制ChatGPT背后的美国公司OpenAI对意大利用户的数据处理。该机构强调，此举意在回应该人工智能平台于3月20日发生的数据泄露事件。除此之外，该机构还认为人工智能在训练算法时大规模收集和存储个人数据的行为缺少法律依据，并指出ChatGPT在实际运行中违反自身数据保护规则的可能。

来源：比特币电讯报

国际合作

「新加坡和马来西亚推出跨境二维码付款连接」

3月31日，新加坡和马来西亚推出跨境二维码（QR code）付款连接，两地旅客可在实体商店扫描NETS QR或【【微信】】完成付款，也能进行网上跨境电子商务交易。到今年底，两国人民也将可以通过PayNow和DuitNow进行实时跨境转账。新加坡金融管理局和马来西亚国家银行发布联合文告称：“新加坡和马来西亚持续合作改进跨境付款连接性，这个NETS-【【微信】】码付款连接是个重要的里程碑。”据悉，两国之间在疫情前的每年平均访客量达1200万人次，这个付款连接将为商家和顾客提供更无缝和有效率的方法付款和收款。这个项目展示两国承诺改进跨境付款服务的成本、速度、获取和透明度，这符合东盟付款连接性计划和20国集团改进跨境付款的发展计划。

来源：联合早报

科技公司

「苹果公司在英国反垄断监管机构调查的上诉中取胜」

3月31日，英国竞争上诉法庭（Competition Appeal Tribunal，简称CAT）裁定，苹果公司在英国反垄断监管机构对其移动浏览器和云游戏服务展开调查的上诉中胜诉。去年11月，英国监管机构竞争与市场管理局（Competition and Markets Authority，简称CMA）对苹果公司和Alphabet公司的谷歌在移动浏览器中的垄断地位，以及iPhone制造商通过其应用商店限制云游戏市场的可能性展开了全面调查。当时，苹果公司辩称，CMA“没有权力”发起这样的调查，于是就其调查决定进行上诉。在上诉法庭作出最终判决后，CMA表示对裁决感到失望，并表示这有可能大大削弱CMA有效调查和干预市场无序竞争的能力。而苹果公司在裁决后发表的一份声明中表示，它对上诉法庭的决定感到满意，并表示其相信“（在）充满活力和竞争的市场中，创新可以蓬勃发展。”

来源：路透社

「在线超市和技术集团Ocado在伦敦高等法院的机器人专利纠纷中击败AutoStore」

3月31日消息，伦敦高等法院驳回了挪威机器人公司AutoStore对英国在线超市和技术集团Ocado提起的专利侵权诉讼。Ocado和AutoStore均是全球仓储自动化技术的先驱，两者目前正在全球多个司法管辖区对峙，以保护他们宣称的知识产权。此前，Ocado与AutoStore均将其技术授权给世界各地的零售商，并将其用于英国的日用杂货配送服务。AutoStore 最初于2020年10月向 Ocado主张了仓储机器人六项专利，其中两项在判决下达前被欧洲专利局（European Patent Office）宣告无效，两项在听证会开始前不久被AutoStore撤回，其余两项专利在本轮判决中被宣告无效。目前，双方在德国和美国新罕布什尔州的知识产权诉讼仍在进行中。

来源：路透社

行业自治

「人工智能发展促使美国新闻媒体联盟重新考虑广告费用」

3月31日，美国两党议员共同提出一项法案，允许新闻机构联合起来与谷歌等科技巨头谈判广告费率。媒体贸易协会新闻/媒体联盟（The News/Media Alliance）表示：“人工智能等新兴技术使人们更加清楚地认识到，当内容创作者预期的未来回报不如当下所得时，他们需要制度上的调整。” 该联盟称这项法案将保护并维持地方新闻业的发展。这项措施将允许全职员工少于1500人的新闻广播公司和出版商共同协商广告费率。多年来，新闻机构一直声称他们没有从生产用户内容吸引读者这一项上得到足够的补偿。该法案也在上届国会被提出，但未能成为法律。

来源：路透社

技术应用

「普华永道：人工智能生成内容在文本和程序代码方面已经极具实用性」

3月30日，普华永道发布了针对新消费领域人工智能生成内容（AI Generated Content，简称AIGC）业态和模式的分析。分析显示，对于不同形式的内容创作而言，目前技术的成熟度是完全不同的，相对而言，文本技术及程序代码生成领域已经具有极高的实用性。同时，音频及图像生成已经初步可用，但是仍然具有很强的辅助属性。视频领域，乃至于不同内容形式的多模块结合串联是具有极高想象空间的，不过技术上还需要不断改进。研究显示，由于人工智能（AI）工具可以全天候工作，并实时反馈，AI文本交互功能使得类似ChatG

人工智能chatgpt用什么语言编写 chatgpt强大自然语言的处理能力

人工智能chatGPT用,人工智能cs,人工智能tts,人工智能 f1

- 一、背景
- 二、Visual ChatGPT
- - 2.1 对系统规则的提示管理
  - 2.2 基础模型的提示管理
  - 2.3 . 用户提问的提示管理
  - 2.4 基础模型输出的提示管理
- 三、实验
- - 3.1 实验设置
  - 3.2 多轮对话的完整案例
  - 3.3 Case Study of Prompt Manager
- 四、当前的局限性
- 五、总结

论文：Visual ChatGPT ：Talking, Drawing and Editing with 【【微信】】ls

代码：https://github.com/microsoft/【【微信】】

出处：Microsoft Research Asia

时间：2023.03

Visual ChatGPT 是一个能够调动多个不同基础视觉模型来理解视觉信息并生成对应回答的系统。

近期， Large Language models（LLMs）发展非常快，如 T5[32]、BLOOM[36]、GPT-3[5] 等。

尤为引起人们注意的是 ChatGPT（基于 Instruct-GPT[29] 而来），能够以真实对话的方式实现和人类的交互。

但是 ChatGPT 是使用语言模型训练的，不适用于图像方面的生成任务。

图像方面，【【微信】】ls (VFMs) 也有很好的效果，BLIP[22] 能够很好的理解图像并输出对图像的描述，【【微信】】和 Stable Diffusion[35] 在图像理解和生成方面有很好的效果。

但上述的先进的语言模型和图像模型只能接收特定模态的输入和输出。而且图像模型有较高的固定输入输出格式，使得图像模型没有语言模型灵活。

能否构建一个类似于 ChatGPT 的系统来实现图像的理解和生成呢？

本文作者提出了一种 Visual ChatGPT，不需要从头开始训练多模态 ChatGPT，而是基于 ChatGPT 和多种 VFMs。

为了弥补 ChatGPT 和这些 VFMs 的 gap，作者又构建了一个提示管理器（Prompt Manager）来支持如下的功能，通过 Prompt Manager 来指导 ChatGPT 使用这些 VFMs，并迭代反馈：

直观的告诉 ChatGPT 这些 VFMs 的能力和输入输出形式
将不同的视觉信息，如 png 图像、深度图像、掩码矩阵转换为语言形式的信息帮助 ChatGPT 进行理解
处理不同 VFMs 的优先级和冲突

Visual ChatGPT 能够通过如下三步来实现图像模型和语言模型的交互：

能够同时接收语言和图像作为输入
提供需要多个人工智能模型与多个步骤协作的复杂视觉问题或视觉编辑指令
提供反馈意见并告诉系统纠错后的结果，即可以将视觉模型信息注入到 ChatGPT 中，并考虑多个输入/输出的模型和视觉反馈的模型

示例如图 1 所示：

用户上传一张黄色花的图片并输入：“请根据预测的图像深度，生成一朵红色的花，然后逐步变成卡通的样子”
Prompt Manager 可以帮助 Visual ChatGPT 启动相关 VFMs 的执行链，首先使用深度估计模型来检测深度信息，然后利用深度图像模型生成一个红花的深度信息，最后使用风格迁移模型将风格转换为卡通
Prompt Manager 通过提供可视化的类型和记录信息来记录转换过程，当获得 “卡通” 的提示后，结束整个过程

本文贡献：

提出了 Visual ChatGPT，打开了 ChatGPT 和 VFMs 结合的大门，让 ChatGPT 能够处理更复杂的视觉问题
设计了一个 Prompt Manager，包含 22 个不同的 VFMs 并且定义了它们之间的内部相关性，以便更好的互动和结合
验证了 Visual ChatGPT 对视觉的理解和生成能力

假设一个有 NNN 个【【微信】】的对话系统为 S={(Q1,A1),(Q2,A2),...,(QN,AN)}S=\{(Q_1, A_1),(Q_2, A_2),...,(Q_N, A_N) \}S={(Q1?,A1?),(Q2?,A2?),...,(QN?,AN?)}

为了从第 iii 轮对话中得到响应 AiA_iAi?，需要使用一系列的 VFM 和这些模型的中间输出 Ai(j)A_i^{(j)}Ai(j)?。jjj 表示第 jjj 个 VFM (FFF) 的输出。

也就是说在时域 Prompt Manager MMM 协调时， Ai(j)A_i^{(j)}Ai(j)? 的形式需要不断修改来满足每个 FFF 的输入。

最后，如果表示为最终响应，则系统输出 Ai(j)A_i^{(j)}Ai(j)? ，不再执行 VFM。

Visual ChatGPT 的表达形式如下：

System Principle PPP：系统规则为 Visual ChatGPT 提供了基础规则，需要对图像文件名敏感，能够使用 VFM 来处理图像。
【【微信】】l FFF：Visual ChatGPT 能够很好的组合不同的 VFM（ F={f1,f2,...,fN}F=\{f_1, f_2, ..., f_N\}F={f1?,f2?,...,fN?}），每个基础模型 fif_ifi? 都是具有显式输入和输出的确定函数
History of Dialogue H<iH_{<i}H<i?：定义第 iii 轮对话的历史为前面 “问题-回答” pairs 的串联形式，即 {(Q1,A1),(Q2,A2),...,(Qi,Ai)}\{(Q_1, A_1),(Q_2, A_2),...,(Q_i, A_i) \}{(Q1?,A1?),(Q2?,A2?),...,(Qi?,Ai?)}。此外，还有一个最大长度阈值来截断历史信息，来满足 ChatGPT 模型的输入长度
User Query QiQ_iQ
本文地址： https://www.528683.com//show-409269.html

版权声明：除非特别标注原创，其它均来自互联网，转载时请以链接形式注明文章出处。