stackoverflow主页 stackoverflow开发者报告

互联资讯 2023-04-29 20:08:02 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

stackoverflow异常,stackoverflowerror原因,stackoverflow需要梯子吗,stackoverflow中文版下载

金磊发自凹非寺

量子位 | 公众号 QbitAI

ChatGPT，遭到了一波反向收费。

而管OpenAI要钱的，正是全球最大程序员问答网站StackOverflow。

理由是这样的：

你们拿我家的数据去训练AI了。

不得不说，这波围绕类ChatGPT展开的“商战”着实有点意思。

不过围观的网友们就不那么乐观了：

唯一没有获利的……好像就是用户了。

科技巨头们要为训练数据买单了

我们都知道，训练一个像诸如ChatGPT这样的AI，背后定然需要海量的数据。

无论是OpenAI、谷歌、微软、Meta或是其它公司都是如此。

但这些科技巨头们一般获取这些数据的方式都是从网上抓取，也因此不会给对应数据背后的公司掏钱。

他们所获取的数据来源，就包括了StackOverflow、Reddit在内的数千个在线“资源”。

然后科技巨头们就会将这些数据“喂”给大模型，让对话AI变得更聪明、更智能。

待产品们成熟可以“上岗”之后，科技巨头们就会开启付费模式，例如我们熟知的ChatGPT Plus、GitHub Copilot等等。

据了解，StackOverflow和Reddit目前都没有对数据收费做明确的公示，而且价格也没有定下来。

但另一方面，各种大语言模型背后的企业，也正在努力降低开发的成本。

将来若是训练数据都要收费了……那这部分成本又将会有谁来买单呢？

反正Reddit CEO的表态是：

爬取Reddit数据产生了价值，却不将任何价值返还给我们的用户，这是个问题。

会怎么收费？

虽然目前StackOverflow和Reddit都没有明确训练数据的价格，但有媒体猜测，他们可能会借鉴马斯克推特的“定价路线”。

例如在这个月，马斯克就提高了访问推特数据的价格――42000美元/5000万条推文。

更戏剧性的是，马斯克前一阵子还以“OpenAI非法使用推特数据训练”为由，准备起诉OpenAI。

而不仅是文字领域，在图片生成领域，因训练数据而产生的纠纷也是屡见不鲜。

例如Getty Image就在此前起诉了OpenAI的对手Stability AI。

理由是涉嫌使用超过1200万张照片且之前没有寻求过许可。

……

至于像StackOverflow和Reddit最终将如何定价，还需要等待他们官方的表态。

但值得明确的一点是，随着这一波AIGC热潮的到来，其背后的各种“规矩”，是值得深入探讨、商定了。

参考链接：[1][2][3]

― 完 ―

量子位 QbitAI ・头条号签约

关注我们，第一时间获知前沿科技动态

云知声入选中国智慧病案10强企业榜单，提出打造医疗行业版ChatGPT

云知声医疗,什么是智慧病案,智云医生智慧医疗,人工智能企业云知声首度公开“医疗+ai”战略

近日，国内知名专业咨询机构艾瑞咨询发布2022年中国智慧病案10强企业榜单，云知声成功入选榜单，医疗AI技术实力再获行业认可。作为AI独角兽企业，云知声一直不遗余力的以AI技术赋能医疗行业发展，在ChatGPT大放异彩时更是提出以打造医疗行业版ChatGPT。

云知声入选2022年中国智慧病案10强企业榜单

艾瑞咨询发布《2022年中国医疗科技行业研究报告》，聚焦数字技术在医疗健康服务产业链各环节的深度融合及应用，将医疗科技行业划分为政府统筹&医院管理、产品& 服务、服务&用户、产品&用户、智能支付五大类15个细分子行业，以图谱形式系统展现行业脉络分支。

云知声作为优秀企业代表入选智慧病案、CDSS、医院管理信息化、医保信息化4个细分子赛道，其医疗AI价值获得业界广泛关注。智慧病案领域玩家众多，云知声究竟有何特别之处，能够从众多同行中脱颖而出？答案就藏在云知声对AI的不懈探索，与持续应用落地当中。

云知声对AI的探索：从智能语音到医疗行业版ChatGPT

作为成立于2012年的AI公司，云知声一直密切关注AI前沿技术，并积极推动技术产业化应用，包括2012年的深度学习算法升级和产业化应用，到2016年Atlas超算平台、知识图谱和全栈AI技术应用，到现在基于ChatGPT框架的AGI认知技术升级。从某种程度上说，打造行业版的ChatGPT比现在通用的ChatGPT还要更难，但到真正ChatGPT行业落地时，这些问题又都必须得解决。

那么，云知声到底有什么底气啃下这块“硬骨头”呢？据悉，打造ChatGPT离不开高质量的数据，领先的算法和充分的算力。而对于垂直版ChatGPT还需要更深厚的工程化能力，而这些对于云知声来说都是可以解决的。

数据方面：近10年来云知声积累了全方位的行业数据，包括面向患者的导诊、预问诊、患者教育和随访系统，也有面向临床的语音病历，病历质控，单病种质控和医疗风险管理系统，已有近400家医院落地使用。据称数据规模已达到了5T，为医疗行业语言大模型提供数据基础。

算法方面：而ChatGPT所代表的认知智能，本身就是云知声核心技术优势。他们构建了国内最大的医疗知识图谱之一。从2019年至2022年，云知声的认知智能技术在国内外相关评测中荣获7冠5亚。其自主研发的医疗预训练语言模型CirBERTa一度登顶中文医疗信息处理挑战榜榜首。

算力方面：云知声超算平台浮点计算能力可达8亿亿次/秒,可为千亿级参数规模模型提供算力保障。

大模型工程化方面：云知声已经研发了CirBERTa模型，复现了GPT-2模型，并利用模型压缩和知识蒸馏机制，实现了线上推理效率的近百倍加速，为大模型的广泛应用奠定了基础。

内容质量方面：云知声利用应用在CirBERTa的持续学习和知识嵌入技术，基于已有知识图谱积累，优化ChatGPT模型的知识获取和更新机制。另外，利用云知声业内领先的病历质控技术，可以自动发现生成的病历中的问题，进而自动生成作为ChatGPT核心技术的基于人类反馈的强化学习所需的用户反馈数据，加速模型的优化。

行业常说“未来已来”，ChatGPT等AI技术的迭代更新，为各行各业都提供了变革的基础。而如何变革？从哪方面变革？面向这些问题，云知声将继续发挥在医疗AI领域的技术与产业化优势，持续推动创新技术成果与医疗行业的融合应用，为智慧医疗产业的长远发展贡献更多力量！

撰稿2返回搜狐，查看更多

责任编辑：

本文地址： https://www.528683.com//show-404583.html