庆云古诗词

庆云古诗词

【笔记】ChatGPT是怎样炼成的(李宏毅2023机器学习课程引入部分)

互联资讯 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

l 笔记,笔记十篇,笔记百度百科,笔记10篇

各位CSDN的uu们你们好呀,今天小雅兰的内容还是做几道题噢,好好复习一下之前的知识点,现在,就让我们开始复习吧 牛客网在线编程_编程学习|练习题_数据结构|系统设计题库 倒置字符串_牛客题霸_牛客网 BC40 竞选社长 BC41 你是天才…...

编程日记 2023/3/29 10:54:44

目录 命令与文件的搜寻 which 文件档名的搜寻: whereis (寻找特定文件) locate find 以下内容转载自鸟哥的Linux私房菜 命令与文件的搜寻 which 这个命令是根据『PATH』这个环境变量所规范的路径,去搜寻『运行档』的档名~ 所以&am…...

编程日记 2023/3/25 0:14:03

文章目录1. Map 接口源码2. HashMap 实现类源码1. 属性2. 接口 Entry<K,V>3. 构造方法1. HashMap(int initialCapacity, float loadFactor)2. HashMap(int initialCapacity)3. HashMap()4. HashMap(Map<? extends K, ? extends V> m)4. 添加元素 put(K key, V va…...

编程日记 2023/3/22 17:14:09

?1、G1收集器概述 HotSpot团队一直努力朝着高效收集、减少停顿(STW: Stop The World)的方向努力,也贡献了从串行Serial收集器、到并行收集器Parallerl收集器,再到CMS并发收集器,乃至如今的G1在内的一系列优秀的垃圾收集器。 G…...

编程日记 2023/3/23 18:14:57

STC32单片机 普通 I/O 口中断功能和使用?STC32单片机普通 I/O 口中断,不是传统外部中断. 🔖手册上描述:STC32G 系列支持所有的 I/O 中断,且支持 4 种中断模式:下降沿中断、上升沿中断、低电平中断、高电平中断。每组 …...

编程日记 2023/3/29 0:42:16

文章目录 摘要数据增强的作用常用的图像增强方法一些辅助函数ToTensorToPILImageNormalizeResize中心裁剪亮度、对比度和颜色的变化随机裁剪随机灰度与灰度水平/竖直翻转水平翻转垂直旋转随机角度旋转随机仿射变换随机透视变换随机高斯模糊自动增强AutoAugmentPolicyAutoAugmen…...

编程日记 2023/3/20 15:42:45

文章目录前言1.WorkQueue(工作队列)消息预取机制2.Publish&Subscribe(发布-订阅)1.Fanout(广播)2.DirectExchange(路由)3.TopicExchange(话题)MQ的优点前…...

编程日记 2023/3/27 14:27:45

交叉编译 iceoryx 概述 iceoryx 是用于各种操作系统的进程间通信(IPC)中间件(目前支持 Linux、macOS、QNX、【【微信】】 和 Windows 10)。它起源于汽车行业,当涉及到驾驶员辅助或自动驾驶系统时,需要在不同的过…...

编程日记 2023/3/28 17:07:08

目录 一.list准备 二. iterator迭代器 1._list_iterator 2.begin()、end() 3.const_begin()、const_end() 4.!&& 5. && -- 6.operator* 7.operator-> 三.Modify(修改) 1.insert() 2.erase() 3.push_back() && push_front() 4.pop_bac…...

编程日记 2023/3/18 15:38:23

文章目录1. Ubuntu安装SVN服务2. 修改配置文件2.1 修改s【【微信】】.conf文件2.2 修改passwd文件2.3 修改authz文件3. 启动svn服务4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射本地端口5. 测试公网访问6. 配置固定公网TCP端口地址6.1 保留一个固定的公网TCP端口地址6.2 配置…...

编程日记 2023/3/29 9:52:01

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 去重求和(2023.Q1) 文章目录 最近更新的博客使用说明不等式题目输入输出描述示例一输入输出示例二输入输出Code使用说明 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为 OD …...

编程日记 2023/3/19 22:49:51

让我们来深化前边学习的内容前言一、图像形态学是什么?二、侵蚀和扩张的原理2.1 图像的侵蚀2.1.1 概念2.1.2 原理解释2.2 图像的扩张2.2.1 概念2.2.2 原理解释相关链接:【C的【【微信】】】第六课-【【微信】】图像常用操作(三):Op…...

编程日记 2023/3/20 23:16:34

C 运算符运算符是一种告诉编译器执行特定的数学或逻辑操作的符号。C 语言内置了丰富的运算符,并提供了以下类型的运算符:算术运算符关系运算符逻辑运算符位运算符赋值运算符杂项运算符本章将逐一介绍算术运算符、关系运算符、逻辑运算符、位运算符、赋值…...

编程日记 2023/3/23 21:37:56

若该文为原创文章,转载请注明原文出处。 FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具, 支持云边端部署。提供超过 160+ Text,【【微信】】, Speech和跨模态模型开箱即用的部署体验,并实现端到端的推理性能优化。包括 物体检测、字符识别(OCR)、…...

编程日记 2023/3/29 12:24:12

MobileNet 文章目录MobileNet1. MobileNet概述2. 深度可分离卷积(depthwise separable con【【微信】】)2.1 深度可分离卷积通俗理解2.2 深度可分离卷积对于参数的优化3. MobileNet网络结构4. 代码实现4.1 卷积块4.2 深度可分离卷积块4.3 MobileNet定义4.4 完…...

编程日记 2023/3/24 15:08:32

不管是老域名还是新域名,不管是多久没有收录首页的站,此法周期7-30天,包首页收录!本人不喜欢空吹牛逼不实践的理论,公布具体操作:假如你想收录的域名是a.com,那么准备如下材料1.购买5-10个最便宜…...

编程日记 2023/3/22 21:49:07

203.移除链表元素相关题目链接:力扣 - 移除链表元素题目重现给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。思路链表的删除操作如上图所示,我们需要先找到要删除的…...

编程日记 2023/3/20 3:53:07

1. 首先安装好jdk1.8 2. 安装jenkins 命令:(可以在根目录,创建文件夹 mkdir home 然后在此文件夹下操作 cd /home) a 清华源,获取jenkins安装包 wget https://mirrors.tuna.tsinghua.edu.cn/jenkins/redhat/jenkins-2.346-1.1.noarch.rp…...

编程日记 2023/3/28 18:39:05

1.说明 public final class Optional<T> extends Object 可能包含或不包含非空值的容器对象。 如果一个值存在, isPresent()将返回true和get()将返回值。 提供依赖于存在或不存在包含值的其他方法,例如orElse() (如果值不存在则返回…...

编程日记 2023/3/22 10:40:21

一,散列表理解散列表的英文叫“Hash Table”,我们平时也叫它“哈希表”或者“Hash 表”,散列表用的是数组支持按照下标随机访问数据的特性,所以散列表其实就是数组的一种扩展,基于数组演化而来。散列表是通过散列函数将…...

编程日记 2023/3/19 15:40:25

Redis 是一个数据结构服务器。 Redis 的核心是提供一系列本机数据类型,可帮助您解决从缓存到队列再到事件处理的各种问题Redis主要数据类型:String(字符串),Lists(列表),Sets&#x…...

编程日记 2023/3/23 6:37:29

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏留言Ὅ…...

编程日记 2023/3/27 9:32:56

Burp Suite 常用模块分为 目标站点(target)模块 代理(proxy)模块 攻击(Intruder)模块 重放(Repeater) 模块 Target模块是对站点资源的收集,与站点各资源包发出和相应包的记录 Proxy模块是核心模块,可以拦截数据包发送往浏览器,进行修改后再…...

编程日记 2023/3/27 14:40:01

文章目录基本介绍抽象类抽象方法使用总结基本介绍 在面向对象的概念中,所有的对象都是通过类来描绘的,但是反过来,并不是所有的类都是用来描绘对象的,如果一个类中没有包含足够的信息来描绘一个具体的对象,这样的类就…...

编程日记 2023/3/21 16:36:47

吐槽社区的一个小伙伴在用土著刷题微信小程序进行碎片化学习,同时进行多科目题库练习的时候,不好追踪学习进度,希望有个能制定每日目标的功能。因此土著刷题微信小程序v1.11迭代开发了 学习计划 模块功能,学习计划是一个可以设置题…...

编程日记 2023/3/28 19:23:26

文章目录1.翻转链表2.链表内指定区间翻转3. 链表中的节点每k个一组翻转4. 合并两个排序的链表5. 合并k个排序的链表6. 判断链表是否有环7. 链表中倒数第k个节点8. 删除链表中的倒数第k和节点9. 两个链表的第一个公共节点10.链表的入环节点11. 链表相加(二࿰…...

编程日记 2023/3/25 2:23:33

Pandas怎么添加数据列 1、直接赋值 # 1、直接赋值df.loc[:, "最高气温"] df["最高气温"].st【【微信】】("℃", "").【【微信】】("int32")df.loc[:, "最低气温"] df["最低气温"].st【【微信】】("℃"…...

编程日记 2023/3/22 17:16:22

目录 一. 类的六个默认成员函数 二. 构造函数 2.1 什么是构造函数 2.2 编译器自动生成的默认构造函数 2.3 构造函数的特性总结 三. 析构函数 3.1 什么是析构函数 3.2 编译器自动生成的析构函数 3.3 析构函数的特性总结 一. 类的六个默认成员函数 对于任意一个C类&…...

编程日记 2023/3/21 12:11:46

这里的需求前提是,在项目中进行某些操作前,需要在命令后对shell配置文件的进行修改(如ip、port),这个对于用户是不友好的,需要改为用户页面输入ip、port,后台自动去操作修改配置;那么…...

编程日记 2023/3/22 19:25:41

一、Pod 进阶 1、资源限制 当定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。 最常见的可设定资源是 CPU 和内存大小,以及其他类型的资源。 当为 Pod 中的容器指定了 request 资源时,调度器就使用该信息来决定将 Pod 调度到哪个节点上。当还…...

编程日记 2023/3/20 21:59:36

<!-- * Author: xxx.xx * Date: 2021-07-20 14:33:41 * LastEditors: xxx.xx * LastEditTime: 2021-07-20 18:22:37 * PageTitle: 上拉加载组件 * 【【微信】】: 描述... * FilePath: /wxapp-view/【【微信】】/loadmore.vue --> &l【【微信】】><【【微信】】"c-mor…...

编程日记 2023/3/25 5:12:51

观察者模式常常用于以下场景:事件驱动系统:当事件发生时,通知所有对该事件感兴趣的观察者。发布/订阅模型:一个主题(发布者)可以有多个订阅者(观察者),当主题发生改变时&…...

编程日记 2023/3/22 22:09:32

目录 一、前言 二、面向对象程序设计介绍 1.oop三大特性 : 2.面向对象和面向过程的区别 : 3.面向对象思想特点 : 4.面向对象的程序开发 : 三、Java――类与对象 1.java中如何描述一个事物? 2.什么是类? 3.类的五大成员: 4.封装的前提――抽象 : 5.什么是对…...

编程日记 2023/3/27 20:59:48

目录 1.1. 预备阶段 1.2. 单片机介绍 2. 初识STM32 2.1. STM32 1.1. 预备阶段 1.2. 单片机介绍 1.2.1. 单片机是什么 单片微型计算机(Single Chip Microcomputer)简称为单片机(Microcontrollers),也称为微控制单元(Microcontroller Uni…...

编程日记 2023/3/28 1:12:29

本文代码使用 HAL库。 文章目录前言一、按键原理图二、CubeMX 创建工程三、代码讲解:1. GPIO的输入HAL库函数:2. 消抖:3. 详细代码四,实验现象:总结前言 我们继续讲解 stm32 f103,这篇文章将详细 为大家讲…...

编程日记 2023/3/25 1:13:27

LeetCode 104. 二叉树的最大深度 难度:easy\color{Green}{easy}easy 题目描述 给定一个二叉树,找出其最大深度。 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。 说明: 叶子节点是指没有子节点的节点。 示例: 给定二叉树 [3…...

编程日记 2023/3/19 3:30:11

前言 随着行业的发展,编程能力逐渐成为软件测试从业人员的一项基本能力。因此在笔试和面试中常常会有一定量的编码题,主要考察以下几点。 基本编码能力及思维逻辑基本数据结构(顺序表、链表、队列、栈、二叉树)基本算法…...

编程日记 2023/3/28 14:40:08

2 又是考查“一个电子和一个光子具有相同的波长,则二者动量相等。”4 斯特恩盖拉赫实验,原子的自旋磁矩取向量子化。7 通常我们感受不到电子的波动性。因为其波长短,其实也就是粒子运动速率高。10 考查无限长直导线周围B分布。常见的模型要记…...

编程日记 2023/3/29 3:40:33

Ja【【微信】】 双问号(空值合并运算符) 一、简述 在网上浏览 Ja【【微信】】 代码时或者学习其他代码时,可能会发现有的表达式用了两个问号()如下所示: let username; console.log(username "Guest"…...

编程日记 2023/3/25 21:59:31

【投资观点】颠覆全球的 AI 拐点,GTC2023 英伟达王炸

科技板块投资观点,投资观念怎么讲,投资的观念,投资观念心得体会

文/Jensen Huang

如果我们的分析对您有启发,请您点赞支持。若有价值,请您转发给更多的朋友。期待您的评论或私信我吧,我们希望与您深度探讨。感谢您的关注与支持!?

"We are at the iPhone moment of AI"

NVDA CEO 黄仁勋在 GTC 大会上三次提及,AI 的 iPhone 时刻已经到来。

一觉醒来 AI 产业大变天,最近接连几起轰动全球的科技事件,认知反复被刷新。微软深夜抛出的 GPT-4 Office 全家桶,一波王炸未平,紧接着谷歌推出新款聊天机器人 Google Bard,文本生成视频 Runway Gen2 开启内测,Adobe 的 AI 生成图像工具 Adobe Firefly,惊魂未定,正苦苦思考我的剩余价值还剩什么,英伟达出其不意发布核弹新显卡,颠覆全球的 AI 决定性时刻,GTC2023 来了。

?

今年英伟达顺风而起,股价暴涨 90%,市值飙升超越特斯拉,它背后的男人黄仁勋,在昨晚的 GTC 主题演讲上究竟说了些什么,为什么这是 AI 的 iPhone 时刻,我们一起来一探究竟。

全文字数:1.6 万

建议阅读时间:30min

?

阅读框架

精彩亮点

  • N【【微信】】 正成为前沿科技与颠覆性产品发布盛会
  • 人工智能正扮演哪些角色
  • 根植加速计算领域,十年实现百万倍加速
  • 发展与深度学习的发展有着微妙的默契
  • 英伟达加速计算业务进入正循环
  • A100 工业化应用,同等条件成本可降低 9 倍
  • 英伟达 GPU 与量子计算
  • RAFT 助力 Spark-RAPIDS 大规模提升数据处理速度
  • cuOpt 以 300 亿/s 速度破世界纪录
  • Triton 让 AI 模型的部署和管理更加简单
  • CV-CUDA 和 VPF 为视频处理领域降本增效
  • Parabricks 助基因组研究实现里程碑式成就
  • Holoscan 用 AI 为医疗仪器赋能
  • Grace Superchip 为云端服务供货商提供 2 倍成长机会
  • BlueField 与数据中心加速
  • DGX――大语言模型背后的功臣
  • 人工智能的【iphone 时刻】已到来
  • AI Foundation 助力更多颠覆性 AI 产品
  • 英伟达全新推理平台兼具弹性与适应性
  • Omniverse Cloud――拓宽虚拟世界与数字孪生的边界

?

全球 NVIDIA 生态已涵盖 400 万名开发人员、40000 家公司、14000 家初创公司,据统计有超过 250000 人来参加这次大会。亚马逊云、微软、阿里云等这些各行业巨头都已作为钻石级赞助商加入 NVIDIA 的合作伙伴计划,获得 NVIDIA 最高级别的技术支持和资源,共同打造具有开创性、甚至是颠覆性的科技与产品生态。

GTC 2023 邀请了来自学术界、行业大拿的优秀主讲者,大会主题不仅涵盖计算机视觉、对话式 AI、高性能计算等当下最热门的话题,还包括一些更具想象力的、更远大课题的探讨,如 Earth-2 项目、微芯片的运算光刻技术议题等。N【【微信】】 聚集了各行各业的重要公司,包括人工智能、汽车与运输、医疗保健、制造业、金融服务、零售等,让全世界都看到了加速计算和 AI 为各行各业的赋能。

?

1. 人机交互的翻译官

人机交互的翻译官:人类也许不再需要编程来向机器发送指令,AI 可以将更符合人类语言习惯的文本或语音转化为机器行动。

2. 人类的生命健康守护者

预见与检测可能对人类生命健康产生威胁的因素,提前建立防范机制来抵御侵害

3.?更精细化的搜索工具

接受更精细的文字描述,在海量信息中,挑选最符合的结果。

4. 现实与虚拟的破壁者

从快照建立 3D 模型,实现更高水平的虚拟现实。

?

4. 工作的灵感助手

为设计、编程、3D 建模等创造性工作注入效率和更多的可能性。

?

英伟达于 2006 年率先提出加速运算,致力于解决普通计算机无法解决的问题。英伟达所采用的加速方案,并不仅仅局限在硬件上,而是从芯片、系统、网络、加速函式库到应用程序,自底层到顶层的各个环节上思考优化方案。每次优化的成果,都会加速一个应用的发展,涵盖绘图成像、粒子或流体力学、量子物理学、数据处理和机器学习等领域。英伟达在过去十年中为许多应用程序,实现了百万倍的加速,解决了以往不可能解决的问题。

?

英伟达的发展与深度学习有着微妙默契

2012 年,Alex Kerchevsky、【【微信】】 和 Geoff Hinton 需要一台超快的计算机来训练 AlexNet 计算机视觉模型。研究人员在 GeForce GTX 580 上对 AlexNet 进行了训练,训练后的模型也以巨大优势赢得了 IRLSVRC 挑战赛的冠军,为人工智能发展掀起巨大浪潮。经过十年之后,Transformer 模型也已问世。目前任职于 OpenAI 的 Ilya 也训练出 GPT-3 大型语言模型,结果创造出 ChatGPT,这个全世界都听说过的人工智能模型。值得关注的是,训练 GPT-3 的浮点运算次数比训练 AlexNet 还多一百万倍

?

?

加速运算和人工智能的时代已经成为了现实。加速函式库是加速运算的核心,这些函式库会与链接全球产业的应用程序相连,形成了一个网络的网络。经过 30 年来的发展,现在已有数千个应用程序采用了 NVIDIA 加速技术,几乎在科学和产业的每个领域都有函式库的踪影。

所有 N【【微信】】 都与 CUDA 兼容,为开发人员提供了庞大的安装基础,并显著扩大可及范围。各式各样的加速应用程序吸引了终端用户,也为云端服务供货商和计算机制造商开创了广阔的市场。一个大型市场则可提供数十亿的研发资金,进一步将此技术发展至成熟阶段。NVIDIA 可说是建立了加速运算的良性循环。

在涵盖光线追踪和神经渲染、物理地球和生命科学、量子物理和化学、计算机视觉、数据处理、机器学习和人工智能的 300 个加速函式库和 400 个人工智能模型中,我们今年更新了其中 100 个提高了效能,并增加整个安装基础的功能。

?

?

汽车和航天产业会使用计算流体力学 (CFD) 进行乱流和空气动力学模拟,电子产业则使用 CFD 进行散热管理设计。在这张 Cadence 的投影片中介绍了由 CUDA 加速的新 CFD 求解器。在同等系统成本下,N【【微信】】 的运算吐吞量是 CPU 服务器的 9 倍。或者说,在同等模拟运算吐吞量下,NVIDIA 的成本可降低 9 倍,消耗的能源则可降低 17 倍

Ansys、Siemens、Cadence 和其他领先业界的 CFD 求解器现在也都采用 CUDA 来加速。在全球各地,工业用 CAE 每年使用近 1,000 亿个 CPU 核心小时。加速技术可说是节省电力和实现永续发展和净零排放的最佳方式。

?

?

?

NVIDIA 也正与全球量子运算研究社区合作。N【【微信】】 平台由数据库和系统组成,可供研究人员发展量子程序设计模型。系统架构和算法 cuQuantum 是可在 NVIDIA 平台上进行加速量子电路仿真的加速函式库。【【微信】】、Google Cirq、百度量易伏 (【【微信】】)、【【微信】】、QuEra、Xanadu Pennylane、Agnostiq 和 【【微信】】 都已将 cuQuantum 整合到他们的模拟框架中。

Open 【【微信】】 则是我们的混合 GPU-Quantum 编程模型。IonQ、【【微信】】、Atom、QuEra、【【微信】】s、IQM、【【微信】】、Quantum Brilliance、【【微信】】、Rigetti Xanadu 和 Anyon 也已整合 Open 【【微信】】。

要从量化噪声和量子去相干中复原数据,需要对大量量子位进行错误修正。今天,我们宣布推出与 【【微信】】 合作开发的量子控制连结。可将 N【【微信】】 链接到量子计算机,以极高的速度进行错误修正。尽管商用量子计算机还需要一、二十年的时间发展,但我们很高兴能以 N【【微信】】 支持这个庞大而充满活力的研究社群。

?

世界各地有许多企业使用 【【微信】】 来处理数据池和仓储、SQL 查询、图表分析和推荐系统等工作。Spark-RAPIDS 则是 NVIDIA 的加速 【【微信】】 数据处理引擎。在全球耗费 5,000 亿美元的云端运算支出中,最大一项即是数据处理费用。Spark-RAPIDS 现在可用于加速主要的云端数据处理平台,包含 GCP Dataproc、Amazon EMR、Databricks 和 Cloudera,推荐系统会使用向量数据库来储存、编列索引、搜索和撷取非结构化数据的大量数据集。向量数据库的一个新的重要用例就是大型语言模型,可在文字生成期间,针对检索特定领域或专有事实进行查询。?

我们正在引入一个新的函式库 RAFT,以加速编列索引、加载数据以及为单一查询撷取一批邻接项目。我们正在将 RAFT 加速引入 Meta 的开放原始码工具 FAISS (Facebook AI Similarity Search)。超过 1,000 个组织使用的 Milvus 开放原始码向量数据库以及具有超过 40 亿次 Docker 提取的 Redis。对于要建立专有大型语言模型的组织来说,向量数据库可说是无比重要。

?

?

二十二年前,作业研究领域的科学家 Li 和 Lim 提出了一系列高难度的收送货问题 (pickup and deli【【微信】】)。在制造、运输、零售和物流领域 甚至是救灾工作,都涉及 PDP。PDP 是旅行推销员问题的更抽象版本,是 NP-hard 问题,表示没有可找出精确解答的有效算法。随着问题规模扩大,求解的时间也会呈阶乘增长。N【【微信】】 使用进化算法和加速运算,分析每秒 300 亿次的运作。不仅打破世界纪录,也为 Li 和 Lim 提出的难题找到了最佳解答。

AT&T 定期派出 30,000 名技术人员,为 700 个地理区域的 1,300 万客户提供服务。今天,AT& T 以 CPU 执行工作,要一整晚的时间才能完成调度优化,AT&T 希望能实时找到调度解决方案,持续将紧急客户需求和整体客户满意度优化,同时针对延误和不断出现的新事件进行调整。采用 cuOpt 后,AT&T 就可用 100 倍的速度,更快找到解决方案,并实时更新调度解决方案。

AT&T 采用了全套 NVIDIA 人工智能函式库,除了 Spark-RAPIDS 和 cuOPT,他们还使用 Riva 支持对话式人工智能,以及透过 Omniverse 创造数字分身。AT&T 正在利用 NVIDIA 加速运算和人工智能来实现永续发展 节省成本和新服务等目标。

cuOpt 还可将物流服务优化。每一年,全世界都会有 4,000 亿个包裹,投递到 3,770 亿个站点。Deloitte、Capgemini、Softserve、【【微信】】 和 Quantiphi 已开始使用 N【【微信】】 帮助客户推动营运优化。

?

?

NVIDIA 的推理平台是由三个软件 SDK 组成 N【【微信】】 是我们针对目标 GPU 进行优化的推理运行时间。N【【微信】】 则是一款支持 GPU 和 CPU 的多框架数据中心推理服务软件。目前已有 40,000 名客户使用 TensorRT 和 Triton,其中包括 Microsoft Office 和 Teams、亚马逊 (Amazon)、美国运通 (American Express) 和美国邮政服务 (U.S. Postal Service) 都是其中一员。

?Uber 则使用 Triton 进行每秒数十万次的 ETA 预测。拥有超过 6,000 万名日常使用者的 Roblox,也使用 Triton 为游戏推荐建立虚拟角色,以及管理内容和市场广告等工作提供可用模型。我们也将推出一些厉害的新功能,支持模型整合的模型分析工具多模型并行服务,以及 GPT-3 LLM 的多 GPU、多节点推理。N【【微信】】 Management Service 是我们的新软件,可在整个数据中心自动缩放和协调。Triton 推理实例 Triton Management Service 可帮助您提高部署模型的吞吐量和成本效率。

?

?

?

目前有 50-80% 的云端影片流程都在 CPU 上处理,消耗大量电力和成本,并增加延迟。用于计算机视觉的 CV-CUDA 和用于影片处理的 VPF,则是新的云端规模加速函式库。CV-CUDA 包含 30 个用于侦测、分割和分类的计算机视觉运算。VPF 则是一个 【【微信】】 影片编码和译码加速函式库。腾讯 (Tencent) 便采用了 CV-CUDA 和 VPF 每天可处理 300,000 支影片。Microsoft 也使用 CV-CUDA 和 VPF 来处理视觉搜寻。

还有 Runway 这家超级酷的公司,他们同样使用 CV-CUDA 和 VPF 为他们的云端生成人工智能影片编辑服务处理影片。目前,网络流量中有超过 80% 都是在传递影片,由使用者生成的影片内容正大幅带动成长,同时也消耗大量电力。因此,我们应该加速所有影片处理工作,并降低电力消耗。目前,CV-CUDA 和 VPF 已进入抢先体验阶段。

?

?

NVIDIA 加速运算已帮助基因组研究达到里程碑:现在,在同一次就诊中,医师可以对患者抽血,并当场对患者的 DNA 定序。在另一个里程碑案例中,采用 NVIDIA 技术的仪器,将全基因体定序的成本降低到仅需要 100 美元。基因体研究是合成生物学的重要工具。其应用范围从药物研发和农业技术到能源生产,用途广泛 N【【微信】】 是一套人工智能加速函式库,用于在云端内或仪器内进行端对端基因体分析。N【【微信】】 适用于所有公有云和基因体研究平台,例如 Terra、DNAnexus 和 FormBio。?

今天,我们要宣布推出 Parabricks 4.1 的消息,并将在来自 PacBio、Oxford Nanopore、Ultima、Singular、BioNano 和 Nanostring 的第 4 代 NVIDIA 加速基因体研究仪器上执行。全世界市值 2500 亿美元的 医疗仪器市场正面临转型,医疗仪器将转向软件定义,并由人工智能驱动。

?

?

?

?

N【【微信】】 是一个软件函式库,可用于实时传感器处理系统。现在,有超过 75 家公司 正在开发采用 Holoscan 的医疗仪器。今天,我们要宣布全球医疗仪器产业界的领导者美敦力 (Medtronic),已开始和 NVIDIA 合作,要为软件定义的医疗设备打造人工智能平台。

这个伙伴关系将为美敦力的系统建立一个共同平台,合作范围从手术导航扩及机器人辅助手术等工作。今天,美敦力发表了其下一代 GI Genius 系统,正是以 N【【微信】】 打造,并采用人工智能进行结肠癌早期检测,将于今年年底左右上市。

?

?

?

芯片产业已成为几乎所有产业的基础。芯片制造需要极高的精准度,制作特征比细菌小 1,000 倍,并与单一黄金原子或与人类一条 DNA 链的顺序相当。光刻是在晶圆上建立图案的流程,也是芯片制造流程的开始。

包含两个阶段:光掩膜制作和图案投影。基本上,这是触及物理学极限的成像问题。光掩膜就像芯片的模板光线会被阻挡,或穿过光掩膜到达晶圆而形成图案,光线则由 ASML EUV 极紫外线光刻系统产生。

在此,每个系统造价都超过 2.5 亿美元,ASML EUV 会使用激烈的方式来制造光线。激光脉冲每秒向液态锡滴发射 50,000 次,将其蒸发,并放出 13.5 奈米 EUV 的电浆,接近 X 光波长。多层膜反射镜则会将光线引导至光罩,光罩多层反射膜利用 13.5 奈米光线的干涉图案,来建立最低 3 奈米的更精细图形。简直是在施魔法。

晶圆定位在四分之一奈米范围内,每秒对齐 20,000 次,以针对任何振动进行调整。进行计算光刻的这一步,也同样神奇。计算光刻应用了逆向物理算法来预测将在晶圆上产生最终图案的光罩上的图案。

事实上,光罩上的图案根本不像最终的图形,表达式微影模拟了马克士威 (Maxwell) 方程式中光线通过光学组件,并与光阻剂互相作用的行为。表达式微影是芯片设计和制造中 产生最大运算工作量的一环,每年可消耗数百亿个 CPU 小时。大型数据中心往往全年无休运作以建立光刻系统中使用的光掩膜。在芯片制造商每年投入近 2,000 亿美元的资本支出中,这些数据中心的运作成本也占了一部份。随着算法复杂度增加,计算光刻技术也正快速发展。使该产业能够达到 2 纳米精确度,甚至超越此水平。

NVIDIA 宣布推出 cuLitho 这是一个计算光刻函式库。cuLitho 是一项耗时近四年的巨作,透过与台积电 (TSMC) ASML 和 Synopsys 的密切合作,将计算光刻加快了超过 40 倍。【【微信】】 有 89 个光掩膜板,目前,在 CPU 上执行的单一光掩膜板,需要两周的时间来处理。在 GPU 上执行的 cuLitho 则可在一次 8 小时内处理一个光掩膜板,仅需要 500 台。

DGX H100 的系统上以 cuLitho 进行加速,台积电可以减少用于计算光刻的 40,000 台 CPU 服务器数量,从而将功率从 35 万亿瓦降低到仅 5 万亿瓦。

借助 cuLitho,台积电便能缩短原型周期时间、提高产量、减少制造过程中的碳足迹,并为 2 奈米及更高阶技术做好准备。今年 6 月起,台积电将开始采用 cuLitho 来生产。每个产业都需要加速每项工作负载,这样我们才能节省电力并达到事半功倍。

?

?

在过去十年中,云端运算以每年 20% 的速度,增长成为一个价值 1 万亿美元的庞大产业。大约有 3,000 万台 CPU 服务器执行了大部分处理工作。而艰巨挑战即将来临,随着摩尔定律的终结,CPU 效能的提高也伴随了功率的增加。减少碳排放的义务,基本上则与增加数据中心的需求两相抵触,能源供应也限制了云端运算的成长 其中,最重要的一点,便是数据中心必须加速每项工作负载。如果能够加速,就能节省电力,节省下来的能源可用于推动新的成长。?

任何未加速的内容则会在 CPU 上处理,加速云端数据中心的 CPU 设计点 ,已与过去有根本上的不同。

在人工智能和