chatgpt语料库来源 chatgpt有专门的中文语料库吗
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
近日马斯克等发公开信,呼吁暂停训练比GPT-4更强大的AI系统,至少6个月!原因担心“AI可能杀死全人类”,反正说的挺吓人的。我认为是挺上头的
在国内外巨头纷纷披露AI大模型,在AI领域3大核心是数据、算力、算法,该行认为,数据将成为如ChatGPT等AI大模型的核心竞争力,高质量的数据资源可让数据变成资产、变成核心生产力,AI模型的生产内容高度依赖源头数据。
ChatGPT的中文答案不准确主要在于目前中文语料学习库少,ChatGPT中文资料比重还不足千分之一,为0.09905%,而英文为92.64708%。
中文公开语料远不足英文,这也成为“中国版ChatGPT”的痛点。
ChatGPT能够提炼的语料是开放的、共享的和免费的”,而“中国版ChatGPT”所需要的大量高质量中文数据资源大多被存在各家企业或机构的“后花园”里无法共享,这不是一两间公司能够解决的问题。
针对到这些问题的出现,中国信息通信研究院现启动大模型技术及应用基准构建工作,针对当前主流数据集和评估基准多以英文为主,缺少中文特点、文化以及难以满足关键行业应用选型需求等问题,
联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel,推动我国大模型技术及应用的引领创新。
中网文公司拥有广泛应用场景,AIGC加速形成从内容到商业化落地的闭环,中文数字内容将成为重要稀缺资源,用于国内AI大模型预训练语料库。
维持互联网传媒行业“买入”评级,拥有中文语料、专业数据资源及数据处理的公司或将持续受益于AI大模型发展。
第一家:浙数文化
围绕数字娱乐、数字体育、大数据产业三大业务板块加速建设数字产业生态圈,是浙江省唯一一家持数据交易牌照的省级数据交易中心,可提供数据流通服务及配套数据增值服务,实现多场景的数据交易,主要客户涉及金融、传媒、公共服务等领域。
第二家:中国科传
围绕专业学科知识库、数字教育云服务、医疗健康大数据、期刊融合平台等方向,公司传统业务所收集的庞大文献数据可运用于ChatGPT的辅助创作、文档撰写方面。
第三家:掌阅科技
以出版社、版权机构、文学网站、作家为正版图书数字内容来源,对数字图书内容进行编辑制作和聚合管理,面向互联网发行数字阅读产品。
第四家:是最具有潜力的
理由一:与清华相关院系长期深入合作,知网具备国内首屈一指的中文知识库,在于算力、算法和数据等要素齐全,资源整合和服务能力强,能给“中国版ChatGPT”带来很大的进步。
理由二:公司控股股东是国资委,背靠大树好乘凉。
理由三:技术上主力洗盘充分,处于历史低位10元以下,近期处于上升趋势,成交量堆量,上涨放量下跌缩量,筹码集中且没有松动,说明主力还在收集筹码,准备干一波大的,我也非常看好这股启动一波主升浪,今年至少100CM+。
具体就不在这里讲了,启动就在一瞬间,有想要了解的朋友呢,往评论区看看。
国产AI开启大乱斗;东方甄选派发7.75亿元股份奖励;微信内测多项新功能|一周简讯
国产ai开启大乱斗,国产ide,国产alpha,国产io大家好!这里是一周行业简讯,每周六更新,带你回顾过去一周最热的行业新鲜事!
(本期整理 |?云飞扬)
1.?国家网信办就《生成式人工智能服务管理办法》公开征求意见
据网信中国?4月11日,为促进生成式人工智能技术健康发展和规范应用,根据《中华人民共和国网络安全法》等法律法规,国家互联网信息办公室就起草的《生成式人工智能服务管理办法(征求意见稿)》,向社会公开征求意见。
2. Meta人工智能主管:AI对世界的了解不如你的猫?
据第一财经 ?近日,Meta公司人工智能实验室主任杨立昆(Yann Le Cun)在法国电台的一次公开访谈节目中详细回答了他对人工智能的发展以及AI聊天机器人ChatGPT的看法。Le Cun认为,AI聊天机器人仍然“非常肤浅”,因为它的知识结构只存在于“大量的文本库中”,而缺乏对现实物理世界的理解。他表示,这类AI系统对现实世界的了解比你家的猫少得多。
3.?阿里云峰会发布AI大模型“通义千问”,阿里系产品将全线接入
综合消息 4月11日,2023年阿里云峰会在北京召开,正式推出AI大模型“通义千问”。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在会上表示,阿里巴巴所有产品未来都将接入“通义千问”大模型,进行全面升级改造。
阿里云智能首席技术官周靖人介绍,“通义千问”支持多轮对话,文案创作,逻辑推理,多模态理解,多语言支持。并现场演示了利用“通义千问”提升工作效率的多种场景,比如调用差旅接口推荐差旅产品,视频会议中自动生成会议摘要;作为智能购物助手,自动推荐品牌、产品等。
近日,阿里巴巴达摩院基础视觉团队总监赵德丽也在公开活动中发表演讲称,“我们的路线图在Text-to-Image方面先后经历过Foundation Models、Customized Generation与Controllable Generation三个阶段,今年已发布ControlNet、Composer 2.0 以及T2 I-Adapter。基于阿里云我们构建了一个‘通义万相’产品,将于月底开放给大家。”
4. 亚马逊推出大语言模型泰坦及生成式AI服务Bedrock
据新浪科技 ?4月14日,亚马逊云服务部门(AWS)宣布,推出Bedrock生成式人工智能服务,以及自有的大型语言模型泰坦。此前,亚马逊CEO安迪・贾西(Andy Jassy曾提及要大力投资的领域是大型语言模型和生成式人工智能。
据悉,亚马逊的大语言模型泰坦接受了大量文本训练。公司称,最初会发布两个泰坦模型,一款用于生成文本,用于总结内容、撰写文章草稿或参与开放式问答环节。另一款可能有助于网络搜索个性化等。亚马逊并未透露大型语言模型泰坦的具体参数和数据集,也拒绝透露亚马逊用于训练泰坦的数据。
Bedrock目前则处于有限预览阶段。亚马逊称,Bedrock最重要的功能之一是定制模型非常容易。
5.?京东版ChatGPT将在今年发布
新榜讯?4月10日,京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上表示,针对真实产业需求,京东计划在今年发布新一代产业大模型,将是千亿级言犀大规模预训练语言模型。
据了解,京东云旗下言犀人工智能应用平台将推出京东版ChatGPT――ChatJD,其预训练参数达到千亿级、品类覆盖3000+、人工审核通过率95%+、生成文字30亿+。
6.?360版GPT“360智脑”将面向企业用户开放内测
综合消息?近日,360宣布,4月16日基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。
据了解,企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。未来,360智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合,全面提升用户生产力和创造力。
7. 知乎和面壁科技合作发布中文大模型“知海图AI”
综合消息?4月13日,知乎召开“2023知乎发现大会”,宣布了“海盐计划5.0”的发力方向并锚定职人创作者群体,给予权重提升。此外,即将于5月上线的新版知乎App 9.0首次对外公布,讨论场场景进一步全面升级。
知乎创始人、CEO周源在会上宣布,知乎和面壁科技合作的中文大模型“知海图AI”正式开启内测。同时,基于人工智能的“热榜摘要”开启内测,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
8.?王小川创立百川智能,已获5000万美元启动资金
综合消息?4月10日,搜狗创始人王小川正式宣布入局中国大模型创业,和前搜狗COO茹立云联合创立人工智能公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。
王小川在公开信中表示,新公司名为“百川智能”,目前已初步组建了50人的团队,获5000万美元启动资金,争取年内发布国内最好的大模型和颠覆性的产品,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。
百川智能以前搜狗团队为基础,快速融合了来自百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖AI人才。公司也得到清华相关院系及多位院士和教授的鼎力支持,建立合作突破通用人工智能基础科学问题,并吸引清华优秀学子。
9. 华为盘古系列AI大模型即将上线?知情人士:疑似资本炒作
据每日经济新闻?近期市场频繁传出消息称:“华为云官网即将上线盘古系列AI大模型,分别为NLP大模型、CV等,已被标注为即将上线状态。”对此,华为云方面暂未回应。
与此同时,经从华为云官方微信、微博等官方渠道查证,华为云从未明确表示4月将发布新的大模型,也从未透露过有关盘古大模型的产品计划。另外,田奇也并未在本次论坛中透露盘古大模型的产品上市计划。知情人士透露,华为云即将上线盘古系列AI大模型疑似资本炒作。
10. 全面拥抱AIGC,蓝色光标全面暂停外包?
据澎湃新闻?4月12日,一张网传邮件截图显示,知名公关及广告服务商蓝色光标华东区总部运营采购部下发邮件要求全面停用文案外包,有蓝色光标员工向记者证实了该邮件属实。
该邮件写道,“为了遏制核心能力空心化的势头,也为了给全面拥抱AIGC打下基础,管理层决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。”
此前,蓝色光标在互动平台表示已于4月11日获得微软云官方AI调用和训练许可,公司与微软广告达成了核心代理的战略合作,探索New Bing不仅给出海广告主带来了更多新可能,同时也开启了未来共同探索AIGC的新方向。
11. 百度发布打假声明:目前文心一言无官方App
新榜讯?4月8日,“百度AI”发布声明称,目前文心一言没有任何官方App,在公司官宣前,凡是在App store和各种应用商店看到的“文心一言”App都是假的,凡是声称有“文心一言源代码”的都是骗子。
百度目前已向北京市海淀区人民法院对苹果公司及相关开发者团队发起诉讼。
12. 中国支付清算协会:从业人员谨慎使用ChatGPT等工具
新榜讯?近日,中国支付清算协会向行业发出倡议,从业人员需谨慎使用ChatGPT等工具,以防止和应对跨境数据泄露等风险,保护客户隐私、维护数据安全,提升支付清算行业的数据安全管理水平。倡议的具体内容如下:
一是提高思想认识,依法依规使用。支付行业从业人员要遵守所在地区的网络使用规定,正确认识ChatGPT等工具的机遇和风险,全面评估使用ChatGPT等工具处理工作内容的风险,依法合规使用ChatGPT等工具。
二是不上传关键敏感信息。支付行业从业人员在使用ChatGPT等工具时,要严格遵守国家及行业相关法律法规要求,不上传国家及金融行业涉密文件及数据、本公司非公开的材料及数据、客户资料、支付清算基础设施或系统的核心代码等。
三是会员单位加强内部管理和引导。会员单位要进一步健全信息安全内控管理制度,开展有针对性的数据风险防控工作,加强宣传和引导,提升员工的风险防范和数据保护意识,切实维护国家金融及支付清算行业安全。
13. 马斯克暗中推进AIGC项目,此前曾呼吁暂停AI开发
据IT之家?自从2022年10月份完成推特收购以来,马斯克对这家社交媒体平台进行了多方面的重大改革。最近,他为推特购买了大约1万个图形处理器(GPU),用于公司的两个数据中心之一。考虑到新技术所需要的计算工作量,科技公司通常使用 GPU 来处理大型人工智能模型数据。知情人士称,马斯克购买如此多的额外计算能力表明他对人工智能项目给予了很大期望,但目前该项目应该还处于早期阶段。
14. 微信内测多项新功能
新榜讯?4月13日,微信官方发布8.0.35安卓内测版,有多处页面设计和功能更新。
1)新增精选小程序,页面设置中有显示开关按钮,左右滑动可看到“身心健康好管家”“亮眼动作游戏”“多彩卡牌游戏”“心理测试”“清晨一小时”五类小程序清单列表。
2)视频号动态提示可关闭。
3)可不接收订阅号文章推送。
4)收藏页面更新,顶部的分类标签栏支持折叠和下拉,搜索按钮从右上角移至第一行,搜索框变宽。
此外,近日,部分网友发现微信朋友圈已支持置顶功能,被用户置顶的朋友圈将在个人朋友圈页面顶部长期显示。目前该功能尚处于内测阶段,仅有小部分微信版本8.0.34的用户可使用。
15.?抖音电商新增“电商MCN机构等级体系”
新榜讯 ?4月13日,抖音电商MCN机构等级体系正式上线。据介绍,电商MCN机构等级体系是抖音电商全新上线的对电商MCN机构进行等级评定、并给予不同等级机构相应权益激励的一套体系,激励电商MCN机构不断提升作者供给、改善用户体验、拓展全域经营、提供优质商品和服务,助力电商MCN机构更好成长。
据悉,MCN机构等级每月3日进行数据更新,根据机构上一个自然月的推广数据进行综合计算。平台综合考核MCN机构在平台的推广表现计算MCN机构等级。MCN机构等级由经营力、成长力、服务力、附加分综合评估确定,机构可通过附加分获取加分。
16.?抖音否认电商团队换血
综合消息?近期有消息称字节电商正进行一轮人员换血,比例或达20%,抖音电商和国际电商均涉及。对此,抖音电商相关负责人表示:消息不实。
17. 东方甄选派发7.75亿元股份奖励,董宇辉或拿到千万
综合整理?4月11日,东方甄选公告向154名合格参与者(承授人)授出股份奖励3045.9万股。按照东方甄选当天收盘价29港元计算,本次股份奖励总价值约8.83亿港元,约7.75亿元人民币。
公告显示,新东方创始人俞敏洪以及东方甄选高管孙东旭、尹强均在此次股份奖励名单中。不过,公告并未披露董宇辉等核心主播是否囊括在其中。
据潮新闻报道,“董宇辉肯定在股权激励行列,当时他出名后,很多机构去挖他,开千万年薪都挖不动,这次肯定拿到股权激励的。”杭州一MCN机构高管表示,董宇辉这次不仅拿到股权激励,很可能拿到股权数量跟高管一个层次。
18. 淘宝天猫新一轮调整:成立三个行业发展部,集团相关中台并
据36氪?4月12日,阿里巴巴CEO张勇宣布启动“1+6+N”组织变革后,淘宝天猫正在经历新一轮调整。以下为调整细节:
原产业运营及发展中心负责人吹雪因个人原因离开,该中心掌握着淘宝天猫全部的商家资源,此后将分拆为三个行业发展部:
1. 行业发展1部,由原淘特、1688负责人汪海(七公)负责,包括b系(1688),淘特,服饰行业等,以丰富度驱动;
2. 行业发展2部,由原天猫国际负责人刘鹏(花名:奥文)负责,包括电器、快消等五大行业,以品牌驱动;
3. 行业发展3部,由原猫超负责人刘一曼(花名:一漫)负责,主要是食品、生鲜等商超领域的高频业务,该业务由原本地零售的天猫超市、淘菜菜、淘鲜达整合而来。
原产业运营及发展中心的变化之外,用户运营和平台策略两大中心仍保留,玄德和思函继续担任负责人。
一位淘宝天猫中层人士表示,“淘宝天猫的核心运营思路是没有变化的,戴珊的理念一以贯之。”今年初,淘宝天猫对内宣布了今年的五大战略,分别是直播、私域、内容化、本地零售和价格力。
除了淘宝天猫本身的架构调整之外,原来集团的部分和淘宝天猫强相关的业务中台和供应链中台,也在这轮调整中并入淘宝天猫;
原集团中台供应链统一收归淘菜菜负责人陈明(花名:红方)管理,他曾是盒马供应链、MMC供应链的负责人,后随淘菜菜业务来到大淘宝板块;
原阿里巴巴集团中台CCO/CRO(即客户体验事业部)负责人郑俊芳(花名:师太)在去年兼任大淘宝CCO/CRO后于近期调职,去往阿里云,如今该部门向淘宝天猫平台策略中心负责人思函汇报。
19. 张兰称不会再招聘低学历主播:“野孩子”太容易膨胀了
新榜讯?近日,张兰团队前员工发文称离职并申请劳动仲裁的消息引发热议。对此,张兰在直播时表示,“我现在招一些有学历的主播,原来总想带一些所谓的小野孩,但还是不行,他的心态会随着企业的发展而膨胀。
20. 小红书出版物含危害公德内容被罚
新榜讯?4月12日,信用中国网站显示,小红书关联公司行吟信息科技(上海)有限公司因违反《网络出版服务管理规定》第二十四条第(九)项规定,被上海市文化和旅游局罚款3.5万元。
上述规定内容为:网络出版物不得含有危害社会公德或者民族优秀文化传统的内容。
这并非小红书第一次被处罚。2021年4月20日,行吟信息科技(上海)有限公司违反了《互联网视听节目服务管理规定》第十六条第(九)项的规定,被上海市文化和旅游局依据《互联网视听节目服务管理规定》第二十四条第二款的规定罚款1万元。
21. 字节组建自营服饰团队,推出抖店“飞云织上”
据Tech星球 4月11日消息,字节组建了一个自营服饰团队,并于近期在抖音APP中推出一家名为“飞云织上”的店铺。根据店铺的工商信息可以发现,该店铺背后的主体运营公司为“上海歆湃信息科技有限公司”,据天眼查显示,该公司实际由抖音集F(香港)有限公司100%控股。对于上述信息,字节跳动方面暂无回应。
22.?腾讯定性此前微信QQ故障为一级事故,总办成员遭处罚
据界面 3月29日凌晨,腾讯旗下的微信和QQ等业务曾出现崩溃状况,包括微信语音对话、朋友圈、微信支付,以及QQ文件传输、QQ空间和QQ邮箱在内的多个功能无法使用,该故障在当天稍晚时候被修复。
据了解,本次事故由广州电信机房冷却系统故障导致,腾讯将它定义为公司一级事故。
腾讯管理层认为,这次事故暴露出容灾设计方案和应急预案不完善的隐患,有关业务部门的风险防范意识不到位,所以对大量相关领导做出了处罚。其中包含公司高级执行副总裁、TEG(技术工程事业群)总裁卢山(LS)和WXG(微信事业群)副总裁周颢(har【【微信】】)在内的管理者承担领导责任,被予以通报批评。值得注意的是,卢山目前为腾讯总办(腾讯总经理办公室,为公司最高决策机构)成员。
此外,TEG华南数据中心的两位总经理和总监被处以降级和免职处罚,WXG技术架构部的两位总监和组长当期绩效考核给予Underperform等评级(二星级别,最高为五星)。
23. TikTok邀请美国卖家测试应用内购物功能
综合消息 ?近日有消息称,TikTok正在美国邀请新卖家测试其应用内购物功能,为他们提供大量的运费和销售补贴,并向用户提供优惠券以促进卖家的销售。
据悉,TikTok推出的“应用内购物功能”将会在品牌的个人资料旁显示一个购物袋图标,用户可点击进入浏览带有图片、视频、描述和价格的产品目录,用户还可以将来自不同商店的产品添加到同一个购物车中进行付款。
此外,TikTok还推出了新网红营销渠道。该平台正在测试一个针对美国内容创作者的联盟营销计划。借助该计划,创作者可以通过视频、直播和个人资料等方式推广产品,从中赚取推动销售的佣金。
综合消息 ?4月14日,推特CEO马斯克发推称,推特正在启动创作者订阅。他写道:“我们正在掀起创作者订阅大潮!适用于长篇文本,图片或视频。”当被问及该平台是否也在为创作者分享广告收入时,马斯克官回答说:“我们正在努力。Twitter拥有令人惊讶的复杂代码库,所以进展比我们希望的要慢。”
此外,马斯克还表示,推特用户可申请发布长文章和长视频的订阅内容,发布者只需在设置中选择“变现(Monetization)”,即可获得全额收益。推特在未来12个月都不会参与抽成,iOS和Android上的收益比例为70%(平台收取30%),而在web上的收益比例为92%。而在第一年之后,iOS和Android系统收取的费用将降至15%,但推特将在此基础上增加少量费用,具体取决于“打赏金额”量。
马斯克称,推特还将帮助推广创作者的内容。他们的目标是让创造者的热度最大化。并且在任何时候,创作者都可以选择离开推特平台,并带走他们创作的内容。
25. 支付宝上线“生活号动态”
据电商报 4月11日消息,为了帮助商家内容更快触达用户,支付宝上线“生活号动态”。用户搜索关键词时,在结果页里除了已有的小程序、生活号等内容外,还能看到相关的图文、直播、短视频内容。
具体来看,“生活号动态”会根据搜索词关联的生活号名称、标题文案、描述文案等进行展示。用户搜索品牌名,如:肯德基、青团社、喜茶时,商家如果配置了搜索直达,会优先展示搜索直达,以及商家重点运营的生活号内容。如果用户进行模糊搜索,如蓝眼泪、长沙旅游、搬家等词汇,也会结合搜索词和内容相关性、质量等多重因素进行综合推荐。目前功能已全量上线,所有生活号均有机会获得推荐。
26. 元宇宙房产崩盘:暴跌近90%,林俊杰等投资者亏钱
新榜讯?近期,ChatGPT成为新的科技热点,而元宇宙却陷入低谷,元宇宙房产的价格也跟着“崩”了。
元宇宙分析平台WeMeta的数据显示,2017年元宇宙每平方米土地成交价中位数为20美元,2021年这一数字升至6000美元。然而,目前全球最大的元宇宙地产销售平台Decentraland的成交价中位数已从2022年的45美元跌至5美元,下跌近90%。
? 关于新榜
作为数据驱动的内容科技公司,新榜依托覆盖全渠道各层级的新媒体资源和内容数据产品,提供内容营销、直播电商、版权分发和内容资产运营管理服务,助力中国企业数字化内容资产获取与管理。
我们的客户既包括中国平安、腾讯、字节跳动、京东、宝洁、雅诗兰黛、欧莱雅、联合利华、迪士尼等500强,也包括正在蓬勃成长的中小企业、新兴品牌和MCN机构,提供从公域流量募集分发到私域内容运营建设的全链路服务。
“新媒体,找新榜”是我们的使命。凭借全面稳定的新媒体内容数据产品和企业服务能力,新榜被评为国家级高新技术企业和上海市专精特新企业,曾荣获全国内容科技创新创业大赛一等奖?、上海文化企业十佳、上海数字广告领军企业、中国广告新媒体贡献年度大奖、沙利文中国新经济卓越增长奖等称号,拥有多个传播评估监测专利。