庆云古诗词

庆云古诗词

MOSS、曹植、魔力写作三大模型开发者:如何投身ChatGPT引发的革命

互联资讯 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】


ChatGPT问世以来,上海学术界和产业界已开发出MOSS、“曹植”和“魔力写作”等多个大型自然语言模型。其中,MOSS由复旦大学科研团队开发,目前在校园网内测阶段,计划本月完成升级并开源;“曹植”由达观数据公司开发,也处于内测阶段,计划今年上半年正式发布;“魔力写作Magic Writer”由竹间智能公司开发,多家企业用户正在试用,其面向个人用户的版本“灵感闪写”和“文胆”微信小程序已上线一个月。

如何看待ChatGPT引发的科研范式变革和产业变革?政府、高校院所和企业可以有何作为?三个大语言模型开发负责人谈了他们的看法。

科研范式变革涉及众多学科

“科研范式变革可以分为两个层面,一个是在众多学科领域引入人工智能,开展AI for Science(人工智能驱动的科学研究);另一个是在人工智能领域内,从传统的自然语言处理转向以大语言模型为基座的通用人工智能(AGI)研究。”复旦大学计算机科学技术学院教授、MOSS开发团队负责人邱锡鹏说。

在诸多学科领域,AI for Science近年来正在兴起。越来越多的科研人员在用人工智能系统分析海量数据,从中得出一些人脑很难想到的科学结论。2020年,“阿尔法折叠2”系统精准预测了蛋白质三维结构,被《科学》杂志评为2020年十大科学突破之一。去年,ChatGPT的惊艳亮相指出了一条新的AI for Science路径――让大语言模型“阅读”大量科学文献后,利用其生成内容的不确定性来进行“头脑风暴”,设计新的科研规划或技术路线。

在人工智能领域,ChatGPT淘汰了句法分析等一些过去很重要的研究方向,相关论文越来越少,因为ChatGPT强大的自然语言理解和生成能力表明,对大语言模型来说,句法分析等中间环节不是必需的。因此,高校院所和企业的科研团队都在转向,或自主研发大语言模型,或将自研小模型与开源大模型融合,打造混合式模型。

“灵感闪写”微信小程序

“灵感闪写”和“魔力写作”就是混合式模型产品。竹间智能创始人兼首席执行官、微软(亚洲)互联网工程院前副院长简仁贤介绍,公司将自研NLP(自然语言处理)小模型与大语言模型融合后,悉心“调教”,取得了不错的用户体验。记者打开“灵感闪写”小程序,发现它可以根据输入的词句,一键生成商业计划书、公众号文章、带货笔记等各类文本和插图。“魔力写作”除了能生成文本,还有对话能力,可以在学习企业的知识库后,回答企业员工及其客户的提问。

国内科技界要重视AGI研究

在科研范式和产业变革时期,邱锡鹏认为,国内科技界要重视通用人工智能研究,而不能只盯着GPT模型本身和这类产品的落地应用。“通用人工智能就是人工智能像人一样,可以干很多事,不再局限于某些特定任务。”他解释,“微软最近发表的测评论文说,GPT-4能力的广度和深度显示,它可以被视为AGI系统的雏形。OpenAI、谷歌、华盛顿大学等头部机构都已转向,研究以大模型为基座的AGI。”

为了在这场科技革命中不被落下,我国也要加强通用人工智能研究,包括将视觉、语音等多模态感知能力接入大语言模型,增强大模型与现实世界的交互能力,并构建以通用人工智能为核心的产学研合作生态。

邱锡鹏教授(左一)带领团队研发MOSS。(来源:复旦大学)

遵循这一思路,复旦科研团队正在升级MOSS。作为国内第一个对话式大语言模型,MOSS今年2月启动内测后引发广泛关注。目前,邱锡鹏和博士生孙天祥等人一方面在提升它的中文水平,中文词语训练量已由内测启动时的300亿增至1000亿;另一方面,他们在为MOSS添加联网搜索、图片生成等功能,让它可以上网获取新的知识,向通用人工智能系统演进。

复旦团队计划本月完成升级并开源,公布MOSS模型参数和训练细节,与学术界和产业界分享大语言模型开发经验,还能让企业在开源模型基础上开发各种应用,促进产业生态繁荣。

建议发挥新型举国体制优势

谈及大语言模型产业前景,达观数据董事长兼首席执行官陈运文预测,产业上游是算力供应商,中游是百度等开发C端通用大模型的大企业和开发B端服务大模型的企业,下游是开发各种应用的中小企业。其中,B端服务大模型的参数量是C端通用大模型的1/5~1/3,适合较大规模的企业开发。

达观数据研发的“曹植”就是一个B端服务大模型,参数量超过500亿,公司希望它像曹植那样有“七步成诗”能力,成为满足金融、政务、制造等行业需求的智慧大脑。它拥有ChatGPT的所有功能,可以生成贷后管理报告、投行申报文档、法律文书等各类文本,也可以与用户对话。“我们想打造垂直、专用、自主可控的国产大模型。”陈运文说,“为了能生成长篇专业文本,比如上百页的报告,我们开发了一个能输入复杂指令的表单界面,有望为企业员工大幅减负。”

“曹植”大语言模型架构(来源:达观数据)

在研发过程中,达观数据也有些烦恼――公司只有100张GPU(图形处理器)卡,而要“跑”大模型,至少需要1000张GPU卡。为此,陈运文只能到处“化缘”借卡。在他看来,新型举国体制适用于大语言模型研发和产业化,国家和地方政府可建立人工智能公共算力池,租给企业和高校院所使用。“一张A800 GPU卡的价格是8万元,公共算力池可配备5000―10000张卡,所以建设成本在10亿元内。开发大模型产品的企业可分时租用池里部分GPU,大幅节省自购算力资源的成本。”

新型举国体制还可在大模型的中文预训练中发挥作用,推动图书馆、出版社、新闻机构等拥有高质量中文语料库的单位与人工智能企业合作,提高大模型的中文知识水平。

简仁贤也表达了人工智能企业的心声:在这轮产业变革中,希望政府和投资机构更多地关注、支持中小企业。大模型并非只有“BAT”等巨头才“玩得起”,事实上,OpenAI就属于创业期的中小企业。创业公司决策效率高、创新能力强的优势,在大模型技术创新中得到了充分体现。“就像OpenAI与微软的合作一样,创业公司与大企业、投资机构联手,有望开发出颠覆性产品。”


idea chatgpt插件能回复多少字


准备工作 下载nginx //官网 https://nginx.org/en/download.html //直接下载 https://nginx.org/download/nginx-1.23.3.zip解压 下载一个html项目,或者自己随便写一个 我是直接下载的,然后使用的是第一个01 https://gitee.com/StarPort/HTML_CSSTe…...

编程日记 2023/4/2 11:19:50

一、企业资质要求 1、具有依法在境内设立的企业法人资质。 2、以软件开发生产、系统集成、应用服务和其他相应技术服务为其主要经营业务和经营收入来源,并正常运营。 3、具有从事软件产品开发和相应技术服务等业务和经营场所。 二、研发能力要求 1、签订劳…...

编程日记 2023/4/1 21:08:16

目录 前言 与ChatGPT的对话 什么是自动化测试,我该如何做到自动化测试,或者说需要借助什么工具可以做到自动化测试? 自动化测试如何确保数据的准确性 自动化测试是怎么去验证数据的 如何通过断言验证数据 自动化测试有哪些验证工具可以验证数据 总结 前言…...

编程日记 2023/4/7 15:33:03

在日常开发过程中,换行显示是一种很常见的应用需求,但是偶然发现,有时候使用 " "并不会换行显示,只会被识别为空格,如下图。 通过上图可以看出," "它被识别成了一个空格显示&#…...

编程日记 2023/4/7 12:03:36

目录 第 1 题:卡片 题目描述 运行限制 第 2 题:路径_dpgcd 运行限制 第 3 题:字符统计 问题描述 输入格式 输出格式 样例输入 样例输出 评测用例规模与约定 运行限制 第 4 题:费用报销 第 1 题:卡片 题…...

编程日记 2023/4/6 19:38:08

返回专栏总目录 文章目录 一、创建消息队列二、发送和接收消息三、内核结构沉淀、分享、成长,让自己和他人都能有所收获! 消息队列在如下两个方面上比管道有所增强: 消息队列中的数据是有边界的,发送端和接收端能以消息为单位进行交流,而不再是无分隔的字节流…...

编程日记 2023/3/29 5:38:58

2022年全国职业院校技能大赛(中职组) 网络安全竞赛试题 (3) (总分100分) 赛题说明 一、竞赛项目简介 “网络安全”竞赛共分A.基础设施设置与安全加固;B.网络安全事件响应、数字取证调查和应用安全;C.CTF夺旗-攻击;D.CTF夺旗-防御等四个模块。根据比赛实际情况,竞赛赛…...

编程日记 2023/4/6 23:26:56

🎉欢迎来到FPGA专栏~小精灵V2开发板初使用 ☆* o(RQ)o *☆嗨~我是小夏与酒🍹 ?博客主页:小夏与酒的博客 🎈该系列文章专栏:FPGA学习之旅 文章作者技术和水平有限,如果文中出现错误,希望大家…...

编程日记 2023/4/1 23:21:41

Centos系统管理 启动设计到的概念 BIOS:C>这个原来很好理解的 Basic Input Output System固话在主板上的制度内存金香果主要提供底层的硬件设置和控制 MBR 硬盘的分区格式: MBR格式GPT格式 MBR格式: 英文名:引导记录扇区…...

编程日记 2023/4/2 11:35:11

文章目录1、背景2、命令浏览器2.1、命令浏览器介绍2.2、特点2.3 常用功能选项3、实操3.1、使用 wget 下载文件3.2、 断点续传3.3、镜像整个站点4、 总结1、背景 一位友人说他有台服务器,需要下载一个文件,但是没有视窗界面与下载工具,怎么办…...

编程日记 2023/3/28 2:03:57

【LetMeFly】1615.最大网络秩 力扣题目链接:https://【【淘密令】】.cn/problems/maximal-network-rank/ n 座城市和一些连接这些城市的道路 roads 共同组成一个基础设施网络。每个 roads[i] [ai, bi] 都表示在城市 ai 和 bi 之间有一条双向道路。 两座不同城市构成的…...

编程日记 2023/3/26 16:57:49

文章目录1.二叉树的遍历1.1前序、中序以及后序遍历1.2代码测试1.3层序遍历1.4二叉树遍历习题2.节点个数以及高度2.1二叉树节点个数2.2叶子节点个树2.3第k层节点个数2.4树的高度1.二叉树的遍历 1.1前序、中序以及后序遍历 学习二叉树结构,最简单的方式就是遍历。所…...

编程日记 2023/4/3 17:50:11

1.根据id批量查询 POST {my_index}/_search { "query": { "ids": { "【【微信】】":["【【QQ微信】】","【【QQ微信】】"] } } } 2.根据id批量删除 POST {my_index}/_delete_by_query { …...

编程日记 2023/4/2 19:34:47

文章目录一、环境搭建二、渗透流程三、思路总结一、环境搭建 靶场下载地址:https://download.【【微信】】.com/dc/DC-3-2.zip kali:192.168.144.148 DC-3.2:192.168.144.151 更改驱动器连接设置: 二、渗透流程 1、信息收集nmap -T5 -…...

编程日记 2023/4/6 20:46:01

瑞吉外卖-Day02课程内容完善登录功能新增员工员工信息分页查询启用/禁用员工账号编辑员工信息分析前端页面效果是如何实现的为什么点击左边 右边会根着变化首先 我们先来看一下菜单是如何展示出来的 在来看一下 为啥点击菜单时 右边会跟着变第一 :菜单是如何展示出来…...

编程日记 2023/4/6 19:15:26

1.Hive SQL 1.1 基本介绍概念Hive由【【微信】】开发,用于解决海量结构化日志的数据统计,于2008年贡献给 Apache 基金会。Hive是基于【【微信】】的数据仓库工具,可以将结构化数据映射为一张表,提供类似SQL语句查询功能本质:将Hi…...

编程日记 2023/4/6 7:59:13

目录 1. 表定义:创建工程项目表 2. 表定义:创建供应商表 3. 表定义:创建供应情况表 4. 表定义:创建零件表 5. 表定义:创建student表 6. 表定义:创建course表 7. 表定义:创建sc表 8.…...

编程日记 2023/4/1 15:15:57

一、缓冲区溢出攻击 缓冲区溢出是指当计算机向缓冲区内填充数据位数时超过了缓冲区本身的容量,溢出的数据覆盖在合法数据上。理想的情况是:程序会检查数据长度,而且并不允许输入超过缓冲区长度的字符。但是绝大多数程序都会假设数据长度总是…...

编程日记 2023/4/7 1:15:28

🐱作者:一只大喵咪1201 🐱专栏:《Linux学习》 🔥格言:你只管努力,剩下的交给时间! 从今天开始,Linux的代码就切换在VScode上写了,总算告别VIM了,…...

编程日记 2023/4/7 16:10:03

🌼深夜伤感网抑云 - 南辰Music/御小兮 - 单曲 - 网易云音乐 🌼多年后再见你 - 乔洋/周林枫 - 单曲 - 网易云音乐 50题才停更,课业繁忙,有时间就更,2023/3/14/15:06写下 目录 👊填空题 🌼一…...

编程日记 2023/4/6 21:02:22

你在学习和编写Ja【【微信】】时可能听说过事件冒泡(e【【微信】】)。它会发生在多个元素存在嵌套关系,并且这些元素都注册了同一事件(例如click)的*时。 但是事件冒泡只是事件机制的一部分。它经常与事件捕获(e【【微信】】)和事件传播…...

编程日记 2023/4/6 8:11:49

目录 1.1冒泡排序 1. 算法步骤 3.什么时候最快 4. 什么时候最慢 5.代码实现 1.2选择排序 1. 算法步骤 2. 动图演示 3.代码实现 1.3 插入排序 1. 算法步骤 2. 动图演示 3. 算法实现 1.4 希尔排序 1. 算法步骤 2. 动图演示 3.代码实现 1.5 归并排序 1. 算法步骤 2…...

编程日记 2023/3/26 8:54:40

ss是Socket Statistics的缩写。顾名思义,ss命令可以用来获取socket统计信息,它可以显示和netstat类似的内容。但ss的优势在于它能够显示更多更详细的有关TCP和连接状态的信息,而且比netstat更快速更高效。recv-Q 表示网络接收队列表示收到的数…...

编程日记 2023/3/30 16:23:58

数组三角形 题目描述 上图给出了一个数字三角形。从三角形的顶部到底部有很多条不同的路径。对于每条路径,把路径上面的数加起来可以得到一个和,你的任务就是找到最大的和。 路径上的每一步只能从一个数走到下一层和它最近的左边的那个数或者右 边的那个…...

编程日记 2023/4/3 13:35:26

RecyclerView流程学习模块划分绘制流程onMeasuremLayout为nullmLayout开启自动测量未开启自动测量onLayoutonDrawonLayoutChildren缓存预加载滚动和fling模块划分 RecyclerView中根据其功能可以分为以下几个模块: Recycler mRecycler // 缓存管理者,fi…...

编程日记 2023/3/30 13:57:00

【Flutter从入门到入坑】Flutter 知识体系 【Flutter从入门到入坑之一】Flutter 介绍及安装使用 【Flutter从入门到入坑之二】Dart语言基础概述 【Flutter从入门到入坑之三】Flutter 是如何工作的 WidgetWidget 是什么呢?Widget 渲染过程WidgetElementRenderObjectR…...

编程日记 2023/4/2 20:06:43

frp内网穿透教程1 前言2 下载链接2.1 分别在服务器端和客户端下载frp(ubuntu系统)2.2 压缩包说明3 配置3.1 服务器端配置3.1.1 打开frps.ini3.1.2 编辑内容3.1.3 启动frps程序3.2 客户端配置3.2.1 打开frpc.ini3.2.2 编辑内容3.2.3 启动frpc程序4 开机自…...

编程日记 2023/4/3 2:14:53

使用了6年的实时操作系统,是时候梳理一下它的知识点了 摘要: 本文简单介绍了博主学习操作系统的心路历程,同时还给大家总结了一下当下流行的几种实时操作系统,以及在工程中OSAL应该如何设计。希望对大家有所启发和帮助。 文章目录…...

编程日记 2023/4/7 15:56:14

一.2开头 200:响应成功; 204:响应成功,但是响应头没有数据; 206:部分响应成功,比如分片上传,断点续传; 二.3开头 301:永久重定向; 302&…...

编程日记 2023/4/6 22:43:03

博主介绍:?全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战? 🍅文末获取源码联系🍅 👇🏻 精彩专…...

编程日记 2023/4/2 21:47:44

文章目录前言应试者需知(一)Python 语言基础能力评估1、理解问题并完成代码:2、阅读理解代码,并在空白处补充完整代码:3、编写一个装饰器:exposer4、阅读代码并在空白处补充完整代码:5、自行用P…...

编程日记 2023/4/2 18:31:46

目录 写在前面: 题目:94. 递归实现排列型枚举 - AcWing题库 读题: 输入格式: 输出格式: 数据范围: 输入样例: 输出样例: 解题思路: 代码: AC &…...

编程日记 2023/4/7 6:07:52

1.安装安装路径:/usr/localcd /usr/local安装步骤: 下载redis wget http://download.redis.io/releases/redis-4.0.8.tar.gz 解压 tar -zx【【微信】】.0.8.tar.gz 安装 cd redis-4.0.8make (执行make,出现错误时,进行如下操作&…...

编程日记 2023/4/6 19:17:28

最近很多小伙伴根据东哥的教程成功注册了ins,还没等他们玩够呢,就出现了账号被封的情况。为了防止更多人的ins账号被封,东哥花时间整理了一份ins的使用注意事项。 是东哥我酝酿了比较久的一个总结,这其中凝结了在INS领域实操很久的…...

编程日记 2023/4/3 2:18:22

作者:秋雨陈 前言 随着 Serverless 架构不断发展,各云厂商和开源社区都已经布局 Serverless 领域,一方面表现在云厂商推出传统服务/业务的 Serverless 化版本,或者 Serverless 计算平台;另一方面表现在开源社区中 Se…...

编程日记 2023/4/5 23:20:27

前言 Java与C之间有一堵由内存动态分配和垃圾收集技术所围成的高墙,墙外面的人想进去,墙里 面的人却想出来。 在Java管理的内存中,Java的程序计数器、虚拟机栈、本地方法栈由于是随线程而生,也随着线程结束而回收的,…...

编程日记 2023/4/3 2:39:25

问题描述:因为cdh集群,【【微信】】启用了HA高可用,之前node1节点为active,现在变成了node2节点为standby。而且之前hive建库的时候,LOCATIONhdfs://node1:8020/user/warehouse/dir..... 导致库里面的表默认都是获取DB的loc…...

编程日记 2023/4/4 11:03:07

安装mysql 5.7 容器执行安装命令$ docker run -itd --name mys【【微信】】 -e MYSQL_ROOT_PASSWORDroot mysql查看执行结果使用navicat等数据库连接工具,连接mysql容器,默认用户名为root,密码即root创建数据库person,创建…...

编程日记 2023/4/6 19:17:31

更多开源项目请查看:一个专注推荐.Net开源项目的榜单 平常我们在做项目过程中,桌面软件具备操作高效、利用本地计算机做一些复杂运算、或者设定快捷操作等优势,但是桌面软件也有很多缺点,比如升级问题、系统兼容问题、系统bug排查…...

编程日记 2023/3/27 2:51:42

作者:小卢 专栏:《Leetcode》 喜欢的话:世间因为少年的挺身而出,而更加瑰丽。