ChatGPT算力芯片如何利用chatgpt 概括文章内容

互联资讯 2023-04-23 21:24:03 0

chatgpt,chatgpt怎么下载,chatgpt网址,chatgpt怎么读

近日，ChatGPT因大规模封号及关闭Plus付费会员的申请引发大家热议。

有网友说这是因为计算资源不够了，已经不单是靠钱能解决得了的问题，地球上已经没有足够的算力来满足ChatGPT的运行需求了。

AI的发展真的会被算力所限制吗？它和芯片又有怎样的关系？

芯片：算力决定智力

AI的“三驾马车”是数据、算法和算力。

我们将数据送入AI算法，由算法学习数据中的规律，这意味着要进行无数次运算。运算的背后是芯片提供的算力支持。

如果我们回顾AI算法的发展历史，可以发现，AI算法的发展史同样也是芯片公司的发展史。

从1999年的第一颗GPU，到2008年NVIDIA公司推出的第一颗可用于AI的GPU――Tegra，再到最近几年涌入AI领域的、百花齐放的各类芯片方案（例如，基于AVX-512指令集扩展的Intel至强CPU，NVIDIA全新的【【微信】】架构，赛灵思的【【微信】】推理平台），算力的提高极大地提高了AI的智力水平，让AI可以解决更加复杂、多样化的问题，也为我们进入AIGC时代铺平道路。

可以看到，在过去的20年中，数据的规模、算法的参数量、芯片的算力三者相辅相成，共同将AI推动到了当前阶段，衍生出了不同类型的AIGC。

因此，本文就以2023年的巨星级产品ChatGPT为例来说明芯片是如何为AIGC提供算力的。

ChatGPT的参数量达到了1750亿个量级。ChatGPT展现出的超强智力的背后是昂贵、巨量的算力资源。

让我们问ChatGPT两个问题，用它的回答来开始这一节的叙述（如图1和图2所示）。

图1

图2

下面从两个角度来解释AIGC和芯片的关系：①在AIGC领域中，现在用什么芯片？②随着AIGC的发展，对芯片会有什么新的需求？

在AIGC领域中，现在用什么芯片

1．何为“训练（Training）”和“推理（Inference）”

ChatGPT是通过“训练”得到答案的，那么什么是“训练”？

AIGC的实现过程分为两个环节：训练和推理。

训练是用大规模的数据来训练出复杂的神经网络模型。

通过对数据的标记，以及深度学习中的监督（Supervised），使最终得到的神经网络模型具有训练者需要的、特定的功能。

在具体的实现过程中，大数据作为输入源，经过神经网络算法解算，可以得到一个输出结果。

显然，这种单向的计算，对神经网络模型的构建起不到作用。我们需要构建一个反向的、从输出到输入的机制，才能形成负反馈，调整神经网络模型，达到“训练”的效果。

这个反向的机制可以是有监督学习（Super【【微信】】），即算法工程师给出参数，或者无监督学习（Unsuper【【微信】】），让算法通过自回归或自编码器来对输入信息进行学习。

推理是利用训练好的模型，通过输入新数据来获取结论。

因此，通俗地讲，“训练”的实质就是计算―反馈―调整―计算的往复过程，这一过程在不同的模型中有不同的实现方式；“推理”的实质是针对某个应用场景的输入―计算―输出的过程。

显而易见，训练所需要的计算量和算力资源是远大于推理的，而推理所需要考虑的，除了算力本身，还有功耗、成本，以及与应用场景的匹配。

AI芯片通常有以下3种类别：云端训练芯片、云端推理芯片、端侧推理芯片。其代表公司见表1。

表1

可以注意到，由于训练对算力的要求极高，芯片的功耗较大，因此训练往往放在云端，并没有“端侧训练芯片”。?

2．云端训练芯片：ChatGPT是怎样“练”成的

ChatGPT的“智能”感是通过使用大规模的云端训练集群实现的。

目前，云端训练芯片的主流选择是NVIDIA公司的【【微信】】。GPU（Graphics Processing Unit，图形处理器）的主要工作负载是图形处理。

GPU与CPU不同。从传统意义上来说，CPU作为一个通用处理器而存在，可以全面承担调度、计算和控制任务。

GPU的内核更小、更专用，例如在图像渲染中涉及大量的矩阵乘法和卷积运算，为了满足计算负载要求，GPU拥有CPU所不具备的大规模并行计算架构。根据NVIDIA公司官网的描述，CPU和GPU的区别见表2。

表2

（1）始于1985年，从VPU到GPU。

最早的图形处理器是1985年ATI公司（2006年被AMD公司收购）发布的一款芯片。当时，ATI公司并未将其命名为GPU，而是叫VPU（【【微信】】，视频处理器），直到AMD公司收购ATI公司，它们的产品名称才更改为GPU。

图3所示为ATI公司于1986年发布的CW16800-A图形处理器产品。

图3

“GPU”这个名字实际上来源于1999年NVIDIA公司将其发布的GeForce 256命名为GPU。随着NVIDIA公司的发展，GPU也与图形处理器概念等同，成了现代计算芯片的一大类型。

图4所示为NVIDIA公司的【【微信】】的照片。

图4

虽然GPU是为图像处理而生的，但深度学习的计算类型和图形渲染有很多的共通点。在图形渲染中，芯片需要不停地计算移动对象的轨迹，这需要大量的并行数学运算，而机器学习/深度学习涉及大量的矩阵/张量运算。因此，GPU的并行处理架构也能够很好地满足AI计算的要求。

（2）2006年，跨时代的计算平台CUDA。

仅有芯片层面的配置是不够的，软件接口的适配及生态的构建也非常重要。这就不得不提到统一计算设备架构（Compute Unified De【【微信】】，CUDA）。

2006年，NVIDIA公司首次推出CUDA。从这个词组本身的设计上可以看出，CUDA的最初开发人员是希望CUDA能成为不同平台之间的统一计算接口。

到目前为止，CUDA已经成为连接NVIDIA公司所有产品线的通用平台，上面沉淀了非常全面的API和算法框架库。

因此，CUDA生态成了NVIDIA公司面对其他GPU厂商时，最大的竞争优势之一。

那么，是不是所有的训练任务都只能够由NVIDIA公司的GPU来做？

虽然目前NVIDIA公司的GPU是训练芯片的主流选择，但答案是否定的，就像在本文开头ChatGPT的回答：“OpenAI并不固定使用某一种芯片，而是根据模型训练的具体需求，选择适当的计算平台”。

这里尝试使用表3来阐释训练芯片的选择。

表3

3．云端推理芯片：与云端的ChatGPT对话

按照AI芯片的分类，我们使用AIGC应用的过程本质上是一个推理过程。例如，在与ChatGPT对话时，我们输入一句话，这句话经过算法的运算，输出一个结果，这就是我们看到的回答。

因此，人们在使用ChatGPT这种AIGC应用（推理）时，理论上，对芯片的性能要求不需要像训练那么高。

以当前ChatGPT的应用场景为例，目前ChatGPT运行在云端，用户每一次与它对话都是一次推理过程。这个过程目前运行在OpenAI的计算集群――【【微信】】超算平台上，这是微软在2020年开发者大会上公布的拥有28.5万个CPU核心、1万个GPU，每个GPU拥有400Gb/s网络带宽的超级计算机。

虽然推理对算力的要求比训练稍低，但需要的算力资源仍然非常夸张。不过，由于两者计算的实质不同，训练本身类似于大力出奇迹，而推理是一个应用的过程，因此推理更容易被优化和加速。未来，AIGC应用所需的云端推理资源将会大幅降低。

4．端侧推理芯片：从云端芯片到终端芯片

目前，我们还不能在端侧运行ChatGPT这样的LLM，原因有以下几个方面：

第一，ChatGPT本身仍然在迭代，并且对话者输入的文字也是它迭代的原料。

第二，作为一个新模型，ChatGPT对于在终端部署的优化不足（这非常好理解，现阶段这也不是重点），导致对终端芯片的要求过高（主要是内存空间）。

随着LLM的进一步完善，未来我们有可能将它下载到终端，用终端的计算资源来运行，这样就可以实现离线运算。经过优化后的ChatGPT算法，对终端芯片的性能要求可能不会特别高。PC芯片，无论是Intel的还是Apple的M系列芯片，都可以承担这样的推理任务。

图5所示为Intel的酷睿处理器。

图5

随着AIGC应用逐渐成熟，成本进一步降低，它与IoT场景的结合将会进一步深入。

一方面，我们可以基于PC和手机，在云端使用各种各样的AIGC应用。在这个场景中，模型有可能离线运行在本地，也有可能采用本地+网络结合的方式运行。

另一方面，基于LLM衍生出来的针对特定场景的小模型可能会有意想不到的应用。笔者猜想，在扫地机、智能机器人、智能音箱等我们熟悉的智能终端中，都有可能应用到LLM的衍生模型，那我们有可能看到在未来会有越来越多的终端芯片需要提高对AI算法的支持性。与资金门槛和技术门槛极高的云端芯片相比，终端芯片普及的趋势将会给更多的芯片公司带来机会。

随着AIGC的发展，对芯片会有什么新的需求

1．摩尔定律和安迪-比尔定律：基础算力提高和负载算力节约

芯片界有两个很有意思的定律，即摩尔定律和安迪-比尔定律。

前者是指集成电路上可容纳的晶体管数目约每18个月便会增加一倍。

后者来源于20世纪90年代计算机会议上的一个小笑话，“安迪给的，比尔就会拿走”，安迪是Intel的前任CEO安迪・葛洛夫，比尔是微软的CEO比尔・盖茨。这句话的意思是新的软件总会耗尽硬件所提高的计算能力。

因此，云端芯片的计算能力将会继续提高，展现方式可能是现有硅基芯片的继续迭代，也有可能是存算一体、光计算、量子计算的突破。

由于芯片的成本过高，软件侧和硬件侧都会努力降低对算力的需求。我们已经看到类似的事情在不断发生：在硬件侧，例如谷歌针对神经网络计算开发了名为TPU的专用芯片，其在特定场景下的运行成本大幅低于同等性能的GPU；在软件侧，ChatGPT作为一个对话模型，是专门为聊天而设计的，而GPT-3是一个大型通用语言模型。

目前，OpenAI并未公布ChatGPT的参数规模，但我们可以从ChatGPT的兄弟模型――InstructGPT上观察到软件优化对计算资源的节省。

图6展示了InstructGPT和GPT-3参数规模的区别。

（a）（b）

图6

在对话场景中，InstructGPT 仅使用了精选的 13 亿个参数［如图6（a）所示］就达到了与GPT-3使用千亿个量级的参数［如图6（b）所示］）结果相当甚至更好的回复质量。这意味着精选数据质量，深挖Transformer模型，将会有巨大的降本潜力。

在我们可见的未来，基础算力的提高和负载资源的节约将会同时发生，而两者究竟会擦出什么样的火花，十分值得期待。

2．成本降低迫在眉睫

虽然ChatGPT一炮而红，但是其高昂的运营成本是其大规模产业化应用的最大障碍之一。

业界已经充分关注到了ChatGPT的成本问题，并提出各个方向的优化措施：①硬件侧：NVIDIA公司的A100的升级版H100显卡能提供更高性价比的算力；Intel在【【微信】】大会上公布的新款云端AI专用芯片Habana Gaudi 2和Greco，有可能针对OpenAI的场景做了特质化加速。②软件侧：以Colossal-AI（潞晨科技的AI大模型开发系统）为例，其宣称能使Stable Diffusion模型的显存消耗降低至之前的1/46。

芯片+ChatGPT龙头，沉睡3年主力180亿抢筹，有望成第一妖王

芯片龙头股一览,芯片各领域龙头,芯片龙头股排名前十名,芯片龙头爆发潜力股名单

第一、从药、人工智能、贵金属以来的上涨后，也该轮到半导体了，关于半导体方面的消息大家都不陌生，“老美卡脖子”“荷兰限制出口”都在慢慢催化半导体的大动静。

第二、低位、低估值，半导体处于拦腰斩的状态

第三、主力布局已久，主力常用的手法就是拉升，再出手打压，不断的震荡，洗盘，把筹码收入自己手里，就在昨日，北资还在持续买入半导体超48亿，这也是为什么说半导体能起来，主力有筹码，才能带的动。

第一家、汤姆猫

市盈率：52.88，年报预计净利润同比增长7.5%。

亮点发现：深耕家庭娱乐和亲子互动类移动应用的开发与运营

公司关注到ChatGPT相关技术的应用后，尝试应用GPT-3.5模型进行AI语音互动产品功能原型测试，并已经将汤姆猫IP形象植入产品功能原型当中，在ChatGPT本体模型推出后，公司也接入了API接口进行测试，ChatGPT本体模型教GPT-3.5模型有成本更低、回复内容更丰富、响应速度较快等变化。

第二家、吉宏股份

市盈率：41.49，年报预计净利润同比增长57.465%。

亮点发现：从事快速消费品包装领域及互联网广告业务，产品远销海外多地区!

鉴于ChatGPT技术有效赋能公司跨境电商业务，公司也将继续投入IT研发资源深耕ChatGPT技术，以此有效提升公司选品师、设计师、优化师、在线客服等业务人员的工作效率，进一步实现降本增效和跨境电商的规模化数字化运营，并在放大企业规模效应的同时继续在跨境电商业务领域建立更为强大的数据和技术护城河。

第三家、xxxx

市盈率：154.94，年报预计净利润同比增长67.47%。

公司互联网医疗业务已应用了人工智能技术，主要包括对用户分类，用户行为分析，帮助医院优化就诊路径，协同互联网诊疗的线上病症的人工智能辅助医生分类，推荐诊后管理等。第一、该股在上一轮牛市走出了十倍的大空间；

第二、目前超跌160%以上，底部震荡洗盘4年时间；

第三、筹码目前也是底部单峰密集的形态；

第四、近期成交量放倍量，股价在不断地尝试突破4年周期的底部平台，有望启动，现在就是最佳的布局时机。

第四家、科大讯飞

市盈率：245.36，年报预计净利润同比增长65%。

亮点发现：世界领先的智能语音技术企业龙头

目前覆盖全国大部分K12、3.5万所高校以及1000多家高中的AI教学系统，公司超4.4亿次AI辅助诊断，智慧医疗应用成果稳步扩大，拥有基于政务大数据结合人工智能开发的智慧城市社管云平台;作为唯一的智慧城市厂商主导了“数字杭州”,从基础设施、政务服务、民生服务、社会治理和产业经济五个方面进行整体规划并实施。

第五家、长电科技

市盈率：19.89，年报预计净利润同比增长125.46%。

亮点发现：世界第三、中国大陆第一的芯片封测龙头

国内芯片封测龙头，提供全方位的芯片成品制造一站式服务，包括集成电路的系统集成、设计仿真、技术开发、产品认证、晶圆中测、晶圆级中道封装测试、系统级封装测试、芯片成品测试并可向世界各地的半导体客户提供直运服务。

第六家、华正新材

市盈率：129.77，年报预计净利润同比增长84.68%

亮点发现：主营覆铜板、绝缘材料和热塑性蜂窝板等复合材料，可用于5G手机

主营覆铜板、绝缘材料和热塑性蜂窝板等复合材料，主要产品覆铜板,导热材料,功能性复合材料,交通物流用复合材料，产品广泛应用于计算机、通信、电工电气、仪器仪表、消费类电子、交通物流等终端市场，在国内外市场上享有良好的美誉度和较高的知名度

第七家、士兰微

市盈率：53.09，年报预计净利润同比增长60%。

亮点发现：半导体和集成电路产品设计与制造一体的高新技术企业

半导体和集成电路产品设计与制造一体的高新技术企业，目前为专业从事半导体功率器件和功率模块、MEMS传感器、光电子等封装与测试的企业。功率模块封装和MEMS传感器封装属于系统级封装，系统级封装是先进封装的一种类别。