PG电子,PG电子官网,PG电子注册,PG电子送彩金,PG电子爆分平台,pg电子app,pg电子下载,pg娱乐NVIDIA展示了其最新的AI模型Nemotron,具有强大的上下文处理能力,可应用于企业应用中。
2.该公司还宣布与Perplexity合作,将整合区域语言模型,为用户提供更丰富的内容。
3.除此之外,NVIDIA还推出了DGX Cloud Lepton,提供跨云的全球GPU网络,支持快速分布式推理。
4.工业人工智能领域正迎来革命,NVIDIA与多家公司合作,推动自动驾驶汽车、人形机器人等产业发展。
5.未来,人工智能将更好地融入物理世界,为人类带来更高效、智能的解决方案。
6月11日,英伟达创始人兼 CEO 黄仁勋出现在法国巴黎的 VivaTech 大会,带来他标志性的 GTC 主题演讲。演讲全程近两个小时,老黄用他特有的节奏,将 GPU、AI 工厂、代理智能、人形机器人等看似分散的议题,抽丝剥茧般串成一条线索:一个由AI工厂驱动的全新工业革命已经到来。
英伟达从 GPU 图形处理起家,但黄仁勋现在更关心的是“如何构建一种能进行推理的计算平台”。这个目标如今已经具象化为 Grace Blackwell 架构下的 GB200 超级芯片:“它不是一块芯片,而是一个集群式的“思考机器” (Thinking Machine)。
这台被誉为“大号 GeForce”的设备,拥有超 120 万个零件、每秒 130 TB 的通信带宽,重达两吨,价格高达 300 万美元——几乎像是一台现代的“人工智能蒸汽机”。
黄仁勋甚至不再把它称作计算机,而是称之为推理引擎,设计之初就是为了解决当下 AI 模型中“自我思考”的计算瓶颈。与过去追求速度不同,如今的大模型追求的是推理的深度、链式思维的广度——模型要不断反思、规划、重试、对线 的设计目标。
黄仁勋认为,生成式 AI 之后,AI 正在进入下一个阶段:Agent 智能体时代。如果说 ChatGPT 是智能的“百科全书”,那么 Agent 更像是可以动手干活的“数字员工”。它不仅能回答问题,还能理解语境、制定计划、调用工具甚至与其他智能体协作,完成复杂任务。
NVIDIA 提供了 Agent 构建的全套栈工具:从大型语言模型(NeMo、Nemotron)、多模态检索(Retriever)、到部署管理平台 Lepton。整个流程就像 DevOps、MLOps 一样,被打包进可部署的 NIM 容器,能够在本地、云端、私有环境一键运行。
一个简单的演示中,黄仁勋向观众展示如何通过一条提示词,指挥 Perplexity 智能体代理,完成一套巴黎开设餐车的计划书,从市场调研到财务规划、到网站搭建,全程自动完成。
但更令人惊喜的是,英伟达也将 AI 从屏幕世界带入了现实世界。黄仁勋推出了一款人形机器人 Grek,并展示了其在虚拟环境中模拟学习的全过程:在 Omniverse 世界中模拟风、重力、摩擦、阻力,Grek 学会了行走、跳跃、推门等一系列技能,并将这些技能迁移到现实中。
在黄仁勋眼中,人形机器人将是下一个“十亿级设备平台”,远超智能手机:它们将进入工厂、仓库、手术室、甚至家庭;编程门槛将从代码降低到“示范教学”;每一个机器人背后,都将是一台基于 NVIDIA Thor 芯片的 AI 超级计算机。
4、Omniverse 不只是渲染引擎,而是机器人、数字孪生训练的核心平台。
Omniverse 正是这一切的核心训练平台。它不只是一个 3D 渲染引擎,而是一个真实世界的模拟器——构建真实感、建立物理规则,帮助机器人像人一样学习与世界互动。
机器人是现实中最具象的“具身智能”,而另一端,工业制造正全面进入 AI 化的进程。演讲中展示了多个企业在 Omniverse 中构建的数字孪生场景:宝马在仿真工厂中规划产线,奔驰用来优化装配流程,西门子实现工厂设计、运营、调度的自动化协同。
英伟达宣布与施耐德、西门子等合作,将工厂数字孪生、自动驾驶、工业控制全面 AI 化。还宣布在欧洲落地第一个“工业 AI 云”,将风洞实验、工厂模拟、机器人训练一体化,提供实时高精度仿真支持。
总之,黄仁勋描绘一个由AI工厂驱动的新工业革命的蓝图,其中Grace Blackwell是核心计算引擎,Agentic AI和具身机器人是下一波AI浪潮,而数字孪生(Omniverse)连接物理世界与虚拟世界的桥梁,所有这些都由NVIDIA强大的加速计算平台和广泛的生态系统所支持。而欧洲,作为工业革命的起源地,正重新成为 AI 时代的实验场。在这条新的产业链上,计算就是生产力,智能就是能源。
NVIDIA 在巴黎举办的首次 GTC 大会。这真是令人难以置信。感谢所有与我们同行的合作伙伴。多年来,我们合作过许多人。事实上,我们在欧洲已经有很长时间的业务了。尽管如此,这是我第一次参加巴黎 GTC。我有很多话要告诉你。
英伟达,曾经,想要创造一个新的计算平台,去做普通计算机无法完成的事情。我们加速了 CPU,创造了一种称为加速计算的新型计算方式。我们的第一个应用之一是分子动力学。从那时起我们已经走了很长的路。有这么多不同的库。事实上,使加速计算特别的原因是:它不仅仅是一个你编译软件的新处理器。你必须重新构建你的计算方式。你必须重新设计你的算法。
事实证明,人们很难将软件和算法重新设计得高度并行化。因此,我们创建了库来帮助各个市场。每个应用领域都得到了加速。每一个库都为开发者开辟了新的机遇。这也为我们和我们的生态系统合作伙伴带来了新的增长机会。
计算光刻,可能是当今半导体设计中最重要的应用之一,在台积电的工厂中运行三星,大型半导体制造厂。芯片制造之前,它会通过逆物理算法运行计算光刻。直接稀疏求解器,代数多重网格求解器。我们刚刚开源了。令人难以置信的激动人心的应用库。该库加速决策过程,以优化拥有数百万变量和数百万约束的问题,例如旅行推销员问题。
Warp,一个用于表达几何和物理求解器的 Python 框架。非常重要。cuDF、cuML、结构化数据库、数据框、经典机器学习算法。cuDF 加速 Spark,无需修改代码。cuML 加速 scikit-learn,无需修改代码。Dynamo 和 cuDNN。cuDNN 可能是英伟达迄今为止创建的最重要的库。它加速了深度神经网络的基本操作。而 Dynamo 是我们全新的库,使得调度成为可能:协调、分配极其复杂的推理工作负载,覆盖整个 AI 工厂。
cuEquivariance 和 cuTensor,张量收缩算法。Equivariance 适用于遵循几何法则的神经网络。例如蛋白质、分子。Ariel 和 Shona,是实现 AI 运行6G的非常重要的框架。Earth-2,是我们用于天气和气候基础模型的仿真环境。平方公里级,分辨率极高。MONAI,我们的医学影像框架,极受欢迎。Parabricks,我们的基因组分析解决方案,取得了巨大成功。cuQuantum,CUDA-Q,我稍后会谈到,用于量子计算。还有 cuPineumeric,加速 NumPy 和 SciPy。
正如你所见,这些只是库的几个例子。还有另外 400 个。它们中的每一个都加速了一个应用领域。每一个都开辟了新的机遇。其中最令人兴奋的之一是 CUDA-Q。CUDA-X 是一套库,专为在 CUDA 基础上加速应用和算法而设计的库套件。我们现在有了 CUDA-Q。CUDA-Q 是为量子计算设计的,适用于经典和量子基于 GPU 的量子经典计算。
我们已经在 CUDA-Q 上工作了好几年了。今天,我可以告诉你,量子计算正处于一个转折点。正如你所知,近 30 年前首次展示了物理量子比特。1995 年发明了纠错算法。2023 年,近 30 年后,谷歌展示了世界上第一个逻辑量子比特。从那以后,几年过去了。逻辑量子比特的数量——由大量带有纠错的物理量子比特组成——也有所增加。逻辑量子比特的数量开始增长。
就像摩尔定律一样,我完全可以预期每五年逻辑量子比特数量增加十倍。每十年逻辑量子比特数量增加一百倍。这些逻辑量子比特将具备更好的错误纠正能力:更加稳健,性能更高,更具弹性,当然将继续具备可扩展性。量子计算正达到一个拐点。
我们一直以多种方式与全球的量子计算公司合作,但在欧洲,这里有一个庞大的社区。我昨晚见到了帕斯卡尔,昨晚还见到了巴塞罗那超级计算中心。现在很明显,我们已经接近能够应用量子计算的阶段了:量子经典计算将在未来几年内解决一些有趣的问题。这是一个非常激动人心的时刻。
因此,我们一直在与所有超级计算中心合作。现在非常清楚,在未来几年内,或者至少在下一代超级计算机中,每一个都会分配一个量子处理单元(QPU),并且 QPU 会连接到 GPU。量子处理单元当然会执行量子计算,而 GPU 则用于预处理:用于控制和纠错,这将极其计算密集;后期处理等。
在这两种架构之间,就像我们加速了 CPU 一样,现在有了 QPU 与 GPU 协同工作,推动下一代计算的发展。今天我们宣布,我们的整个量子算法堆栈现已在 Grace Blackwell 200 上实现加速。加速效果令人难以置信。
我们以多种方式与计算、通信和量子计算行业合作。其中一种方式是使用 cuQuantum 来模拟量子比特,或模拟运行在这些量子计算机上的算法。基本上是使用经典计算机来模拟或仿真量子计算机。在另一个极端,极其重要的是 CUDA-Q:基本上是发明了一种新的 CUDA,将 CUDA 扩展到量子经典领域。这样,在量子计算机到来之前,基于 CUDA-Q 开发的应用可以以模拟方式运行,或者在量子计算机到来后以协作方式运行:一种量子经典加速计算方法。
今天我们宣布 CUDA-Q 已可用于 Grace Blackwell。这里的生态系统极为丰富,当然欧洲在科学领域深厚,在超级计算专业知识方面深厚,在这一领域有着深厚的传承。在这里看到量子计算的进展并不令人惊讶。在未来几年,我们将看到一个真正精彩的转折点。
无论如何,对于所有在量子计算机行业工作了三十年的同仁们,我祝贺你们取得了如此令人难以置信的成就和今天的里程碑。谢谢。
让我们来谈谈人工智能。你可能会惊讶我会和你们谈论人工智能。正是同一款 GPU 驱动并支持了我刚才提到的所有这些应用。同样的支持 GPU 的人工智能技术将走向世界。
我们第一次接触是在 2012 年,就在那之前。与开发者合作,研究一种称为深度学习的新型算法。它促成了 AI 的 AlexNet 大爆炸:2012 年。在过去大约 15 年里,人工智能取得了令人难以置信的快速进展。
第一波人工智能是感知,让计算机识别信息、理解信息。第二波,是我们大多数人都在讨论的过去五年左右,是生成式人工智能。它是多模态的,意味着人工智能能够同时学习图像和语言。因此,你可以用语言提示它,它就能生成图像。人工智能具备多模态能力以及翻译和生成内容的能力,推动了生成式人工智能的革命。生成式人工智能,即生成内容的能力,对我们的生产力至关重要。
那么,我们有了一个新的……我们正在开启新一波的人工智能浪潮。在过去的几年里,我们见证了人工智能能力的巨大进步。从根本上说,智能就是理解、感知、推理和规划任务:如何解决问题,然后执行任务。感知、推理、规划,智能的基本循环。它使我们能够应用一些先前学到的规则来解决我们从未见过的问题。
这就是为什么聪明人被认为聪明,因为他们能够将一个复杂的问题一步步拆解……推理如何解决问题,或许还会进行研究:也许去学习一些新知识,寻求帮助;使用工具,逐步解决问题。我刚才描述的这些话,基本上今天通过所谓的代理型人工智能是可能实现的。我马上会给你展示更多内容。
在其物理实现中,即该代理智能和运动的体现……现在,生成能力正在生成运动。不是生成视频,也不是生成图像或生成文本;这项人工智能生成了运动能力,即行走能力或者伸手抓取某物,使用工具。让人工智能具备实体形态的能力,基本上就是机器人技术。这些能力,是实现智能体的基础技术。它们基本上是信息机器人和具身人工智能:物理机器人,这两项基本能力现在已经到来。
人工智能的时代真是令人非常兴奋。但这一切,都是从 GeForce 开始的。而 GeForce 带来了计算机图形技术。这是我们曾经开发的第一个加速计算应用。计算机图形技术的发展令人难以置信。GeForce 将 CUDA 推向世界,使火星机器学习研究人员和人工智能研究人员能够推动深度学习的发展。随后,深度学习彻底改变了计算机图形技术,使我们能够将计算机图形提升到一个全新的高度。
我今天要展示的所有内容,我今天要展示的所有内容,我将为你预览:我将展示的内容,但我今天展示的所有内容都是计算机模拟,不是动画。是光子模拟、物理模拟、粒子模拟。一切本质上都是模拟,不是动画,也不是艺术。它看起来非常美丽,因为事实证明世界本身就是美丽的,而且数学也是美丽的。那么,让我们来看看。
数字在行动,数字在行动。这基本上就是模拟的本质,看起来非常美妙。但正因为我们现在能够以如此规模和速度模拟几乎所有事物,我们可以将一切转化为数字孪生。而且因为一切都可以成为数字孪生,它可以在投入物理世界之前,完全通过数字方式进行设计、规划、优化和操作。我们将一切都用软件构建的理念如今已成为现实。
所有实体物品都将以数字方式构建。所有宏伟的建筑都将以数字方式构建。所有在巨大规模上运行的事物,都会首先以数字形式构建,并且会有数字孪生来操作它们。所以今天我们将重点讨论数字孪生。这最初是作为一款 GeForce 显卡开始的……这里有人知道 GeForce 是什么吗?知道。
好了。好的。最初的 GeForce 现在看起来是这样的。这是全新的 GeForce。重达两吨,甚至两吨半。由 120 万个零件组成。大约 300 万美元。120 千瓦。在 150 家工厂制造。200 家技术合作伙伴与我们共同努力实现这一目标。可能是大约 400 亿美元的研发预算,用于创造——什么是 GB200,现在正在向 GB300 迈进。它已经完全投入生产。
这台机器被设计成一台思考机器。所谓思考机器,是指它能够进行推理。它有计划。它花很多时间自言自语,就像你一样。我们大部分时间都在为自己的思维生成文字,在我们表达之前,为自己的思维生成图像。因此,思考机器实际上就是 Grace Blackwell 设计的架构目标。它被设计成一个巨大的 GPU。我之所以这样比喻,是有充分理由的。GeForce 是一块 GPU,GB200 也是。它是一个巨大的虚拟 GPU。
现在,我们必须将其拆分成许多组件。创建了一系列新的网络技术和 SerDes 技术。极低功耗、高能效的互连技术,将所有这些芯片和系统连接成一个虚拟 GPU。这是 Hopper 版本。这是世界著名的 Hopper 系统。这是八个通过 NVLINK 连接在一起的 GPU。这里没有显示的是一个 CPU 托盘:一个带有双 CPU 和系统内存的 CPU 托盘,位于上方。这共同构成了一个人工智能超级计算机的节点,大约五十万美元。
这是霍普系统。这就是——真正让我们在人工智能领域崭露头角的系统。它长期以来一直处于资源不足的状态。因为市场发展得太快了。但这是著名的霍普系统。整个系统,包括 CPU,都被这个 Grace Blackwell 节点所取代。这就是一个计算托盘,就在这里,将取代整个系统。它采用全液冷设计,CPU 直接集成与 GPU 相连,所以你可以看到或听到两个 CPU、四个 GPU。它的性能超过了整个系统。
但令人惊讶的是,我们想要将一大批这样的系统连接在一起。如何将所有这些系统连接起来,对我们来说真的很难想象。所以我们将其拆分了。我们所做的是将整块主板拆分成了这个和这个。这是革命性的 NVLINK 系统。扩展计算并不难。只需用以太网连接更多 CPU。横向扩展并不难。纵向扩展极其困难。
你只能建造出你能够建造的最大规模的计算机。将大量技术和电子设备集成到一个内存模型中是非常困难的。因此,我们决定创建一种新的互连技术,称为 NVLINK。NVLINK 是一种内存语义互连。它是一个计算结构,不是网络。它直接连接到所有这些不同 NVLINK 系统计算节点的 CPU。
这是交换机。这九个,这九个,站在最上面。九个部分位于底部。中间是 NVLINK 交换机,连接它们的是这个奇迹。这就是 NVLINK 主干。这是 100%纯铜,同轴铜线。它将所有 NVLINK 芯片直接连接到所有 GPU。在整个主干线上直接连接,使每一个 144 个 Blackwell 芯片核都相连。或者在 72 个不同的封装中,同时相互通信,且不会阻塞贯穿整个 NVLINK 骨干网络。其带宽约为每秒 130 太字节。132... 我-我知道。不,等等——等等看。等着瞧。130 太字节每秒。如果是以比特计,130 太字节每秒。它的数据传输速率超过了全球整个互联网峰值流量的总和,就在这个背板上。而且——是的。这就是——这就是你如何将互联网缩小到 60 磅的重量。NVLINK。
所以,我们做了所有这些,我们做了所有这些,因为计算机的工作方式被认为是你对计算机的看法将来会有根本性的不同。我会花更多时间讲这个。但它的设计目的是让 Blackwell 在性能上远超 Hopper。请记住,摩尔定律,半导体物理每三到五年只能带来大约两倍的性能提升。我们如何能在一代产品中实现 30 到 40 倍的性能提升?而我们需要的是 30 到 40 倍的性能提升。因为推理模型在自言自语。
它不再是一次性完成的 ChatGPT,而是一个推理模型。当你自我思考时,它会生成更多的标记。你正在一步步地分解问题。你在推理,尝试各种不同的路径。也许是思维链,也许是思维树。最好的结局。它正在反思自己的答案。你可能看到……看到,这些研究模型,反思答案时会说“这是个好答案吗?你能做得更好吗?”然后他们“哦,是的,我能做得更好。”然后回去再多想想。因此,那些思考模型、推理模型达到了惊人的性能,但这需要更多的计算能力。
而 NVLINK-72 Blackwell 架构的最终成果则带来了性能的巨大飞跃。阅读方式是,X 轴表示思考的速度。Y 轴表示工厂在同一时间支持大量用户的产出能力。因此,你希望工厂的吞吐量尽可能高,以支持尽可能多的人,从而使工厂的收入达到最大化。你希望这个轴尽可能大,因为人工智能很聪明:这里比这里更聪明。越多,它思考得越快,回答你的问题之前能思考得越多,这与 ASP 有关。Token的平均售价,这必须与工厂的吞吐量有关。这两者结合在那个角落就是工厂的收入。基于 Blackwell 的这家工厂由于其架构,可以产生更多的收入。
我们所建造的东西真是令人难以置信。我们为你制作了一部电影,旨在让你感受到打造 Grace Blackwell 所投入的巨大工程量。请看。
(轻柔的音乐响起)布莱克韦尔是一项工程奇迹。它始于一块空白的硅片。(机械运转声)数百道芯片加工和紫外光刻工序,在一块 12 英寸的硅片上,一层层构建起 2000 亿个晶体管。晶圆被划分成单个 Blackwell 芯片经过测试和分类,将良品芯片分离出来以便后续使用。芯片-晶圆-基板工艺将 32 个 Blackwell 芯片和 128 个 HBM 堆叠安装在定制的硅中介层晶圆上。(机械运转声)金属互连线路直接蚀刻其中,将 Blackwell GPU 和 HBM 堆栈连接到每个系统和封装单元中,确保所有部件牢固固定。
然后进行组装,经过烘烤、成型和固化,打造出 Blackwell B200 超级芯片。每个 Blackwell 芯片都在 125 摄氏度的烤箱中进行压力测试,并在极限条件下运行数小时。机器人全天候工作,将超过 10,000 个元件拾取并放置到 Grace Blackwell 的 PCB 上。与此同时,定制的液冷铜块正在准备中,以保持芯片在最佳温度。在另一处工厂,ConnectX-7 SUPERNIC 被制造出来,以实现扩展通信,BlueField-3 DPU 则用于卸载和加速网络处理、存储和安全任务。
所有这些部分最终被精心集成到 GB200 计算托盘中。NVLINK 是 NVIDIA 发明的突破性高速连接技术,用于连接多个 GPU,实现大规模虚拟 GPU 的扩展。NVLINK 交换机托盘由 NVLINK 交换芯片构成,提供每秒 14.4 太字节的全互联带宽。NVLINK 主干形成定制的盲插背板,使用 5000 根铜缆将全部 72 个 Blackwell 或 144 个 GPU 芯片连接成一个巨型 GPU,提供每秒 130 太字节的全互联带宽——超过全球互联网的峰值流量。
来自世界各地的零部件被熟练的技术人员组装成机架规模的人工智能超级计算机。总共 120 万个组件,两英里的铜线 万亿个晶体管,重近两吨。Blackwell 不仅仅是一个技术奇迹。它是全球合作与创新力量的见证,推动着将塑造我们未来的发现和解决方案遍布各地。我们致力于帮助当代天才完成他们的毕生事业,迫不及待想看到你们带来的突破。
Grace Blackwell 系统全部投入生产。这真是一个奇迹。从技术角度来看,这简直是个奇迹,但能够组装这些 GB200 系统的供应链也功不可没。每台重达两吨,我们现在每周生产一千台系统。以前从未有人在如此规模上批量生产超级计算机。每一个机架本质上就是一整的超级计算机。仅在 2018 年,最大的 Volta 系统……2018 年的 CRS 超级计算机性能还不如其中一个机架。而那个系统的功耗是 10 兆瓦。这是 100 千瓦。所以从 2018 年到现在,代际之间的差异:我们确实将超级计算、人工智能超级计算提升到了一个全新的水平,我们现在正在大规模生产这些机械。
这仅仅是个开始。事实上,你们看到的只是一个系统:格蕾丝·布莱克韦尔。全世界都在谈论这一个系统,纷纷呼吁尽快部署它于此地:进入全球数据中心,用于训练、推理和生成式人工智能。然而,并非所有人,也并非所有数据中心都能应对这些液冷系统。一些数据中心需要企业级堆栈,能够运行 Linux Red Hat 或 Nutanix,或 VMware,以及来自 Dell EMC 的存储系统。日立、NetApp、VAST、Weka,如此多种不同的存储系统、如此多不同的 IT 系统,而这些系统的管理必须与传统 IT 系统保持一致。
我们有这么多新计算机需要投入生产管理。我很高兴地告诉大家,这些产品现在全部进入量产阶段。你们还没见过它们,它们正从货架上迅速被抢购一空。它们正从生产线快速下线,开始投产。DGX Spark 让您几乎可以在桌面上拥有 Grace Blackwell 系统。对于 Spark 来说,是桌面;对于 DGX Station 来说,是桌边。这样你在开发软件时就不必坐在超级计算机旁了,在开发你的人工智能时。但你希望架构完全相同。从架构角度来看,这些系统是完全相同的。从软件开发者的角度来看,界面完全一样。唯一的区别是规模和速度。
然后这边是所有的 x86 系统。全球的 IT 组织仍然偏爱 x86,并且在能够利用最先进的 AI 原生系统时,都会选择 x86。他们确实如此。在他们无法做到且希望整合进企业 IT 系统的地方,我们现在为他们提供了实现这一目标的能力。其中一个最重要的系统,也是我们花费最长时间构建的系统,因为软件和架构非常复杂:如何将原生 AI 架构引入并融合到传统企业 IT 系统中。
这是我们全新的 RTX 专业服务器。这是一台令人难以置信的系统。主板经过全面重新设计。女士们,先生们,Janine Paul。这块主板看起来非常简单,但在这块主板上有八个 SUPER-NIX 交换机,通过一颗每秒 200 吉比特的最先进网络芯片连接八个 GPU,这些 GPU 是 Blackwell RTX Pro 6000。全新产品,刚刚进入生产阶段。八个这样的装入一台服务器。那么,它有什么特别之处?这台服务器是世界上唯一一台能够运行世界上所有已写内容以及 NVIDIA 所有开发成果的服务器。它运行人工智能、Omniverse 和用于视频游戏的 RTX;它运行 Windows,运行 Linux,运行 Kubernetes;它在 VMware 中运行 Kubernetes,基本上运行所有东西。
如果你想将 Windows 桌面从一台电脑流式传输到你的远程设备,没问题。如果你想流式传输 Omniverse,也没问题。如果你想运行你的机器人系统,没问题。只是这台机器的质量保证简直疯狂。它运行的应用基本上是通用的:世界上开发的所有东西都应该能在这里运行,包括,如果你是视频游戏玩家,包括《孤岛危机》。所以...如果你能运行《孤岛危机》,你就能运行任何东西。好了,这是 RTX 专业服务器:全新的企业系统。
所以某些事情正在发生变化。我们知道人工智能是一项极其重要的技术。我们现在确凿无疑地知道,人工智能是一种可能带来革命性变革的软件:改变每一个行业。它能做到这些惊人的事情。这是我们所知道的。我们也知道,处理人工智能的方式与我们过去处理手写软件的方式根本不同。机器学习软件的开发方式不同,运行方式也不同。系统的架构,软件的架构:完全不同。网络的工作方式,完全不同。访问存储的方式,完全不同。
所以我们知道这项技术可以做不同的事情:令人难以置信的事情。它是智能的。我们也知道它的开发方式根本不同:它需要新的计算机。真正有趣的是,这对各国意味着什么?对企业、对社会又意味着什么?这是我们近十年前就注意到的一个现象,而现在每个人都开始意识到这一点了:事实上,这些人工智能数据中心根本就不是数据中心。它们不是传统意义上的数据中心,用来存储你可以检索的文件。这些数据中心并不存储我们的文件。它只有一个任务,且仅此一个任务:那就是生成智能标记,即人工智能的生成。
这些人工智能工厂,看起来像数据中心,因为里面有大量计算机。但这就是一切崩溃的地方。它的设计方式、制造规模或规模化:设计和建造方式,以及它的使用、协调和配置方式;如何运营它,你如何看待它。例如,没有人真正把他们的数据中心当作一个创收设施来考虑。我说了一句话,大家都说,“是的,我觉得你说得对。”没人会把数据中心当作一个创收设施来考虑。但他们把自己的工厂,汽车工厂,看作是创收设施:他们迫不及待地想建另一座工厂,因为每当你建一座工厂,收入很快就会增长。你可以为更多人创造更多东西。
这些想法正是这些人工智能工厂中的想法。它们是创收设施,旨在制造Token。这些Token可以被重新构造成多种行业的生产性智能,因此人工智能工厂现在已成为一个国家基础设施的一部分。这就是为什么你看到我奔走于世界各地,与各国元首会谈的原因:因为他们都希望拥有人工智能工厂。他们都希望人工智能成为他们基础设施的一部分。他们希望人工智能成为他们的一个增长型制造业。这确实意义深远,我认为我们正在讨论的是:因此,催生了一场新的工业革命:因为每一个行业都受到了影响,同时也诞生了一个新兴产业。
正如电力最初被描述和展示为一项技术时,后来发展成为一个新兴产业一样:它被理解为一项技术,但后来我们意识到它也是一个庞大的产业。然后是信息产业,我们现在称之为互联网。这两者都影响了许多行业,成为基础设施的一部分。我们现在有了一个新的产业——人工智能产业:它现在成为了被称为智能基础设施的新基础设施的一部分。每个国家、每个社会、每家公司都将依赖它。
你可以看到它的规模。这是一个被广泛讨论的话题。这是星际之门。这看起来不像数据中心。更像是一座工厂。这是一个千兆瓦。它将容纳大约 50 万个 GPU 芯片,产生巨大的智能,供所有人使用。欧洲现在已经意识到这些人工智能工厂的重要性。人工智能基础设施的重要性,我非常高兴看到这里有如此多的活动。
这是欧洲电信公司与 NVIDIA 合作建设人工智能基础设施。这是欧洲云服务提供商与 NVIDIA 合作建设人工智能基础设施。这就是欧洲超级计算中心正在与 NVIDIA 合作建设下一代人工智能超级计算机和基础设施。这仅仅是个开始。这还不包括即将在公共云中推出的内容。这还不包括公共云。所以这是由欧洲公司为欧洲市场本土打造的人工智能基础设施。此外,还有 20 个正在规划中的人工智能工厂,其中几个是千兆瓦级的超级工厂。总共仅用两年时间,我们将在欧洲将人工智能计算能力提升 10 倍。因此,研究人员、初创企业,你们的人工智能短缺、你们的 GPU 短缺很快就会得到解决。它正向你走来。
现在,我们正在与每个国家合作,发展他们的生态系统。因此,我们正在七个不同的国家建立人工智能技术中心。这些人工智能技术中心的目标是:第一,进行合作研究,与初创企业合作;同时构建生态系统。让我向你展示一个生态系统的样子。我昨天刚刚在英国。这些生态系统都是建立在 NVIDIA 技术栈之上的。例如,正如你所知,每一台 NVIDIA 设备:NVIDIA 是唯一在所有云平台上可用的 AI 架构。除了 x86 之外,它是唯一无处不在的计算架构。
我们与所有云服务提供商合作。我们加速全球最重要软件开发商的应用:包括欧洲的西门子、Cadence、红帽、ServiceNow。我们重新定义了计算堆栈。正如你所知,计算不仅仅是计算机:而是计算、网络和存储的结合。每一层,每一个堆栈都被重新定义了。与思科的合作非常出色,他们昨天在会议上宣布了基于 NVIDIA 的全新型号。戴尔,出色的合作伙伴,NetApp,Nutanix,还有一大批优秀的合作伙伴。
正如我之前提到的,软件开发的方式已经发生了根本性的变化。现在不再只是编写 C 程序,编译 C 程序、交付 C 程序……现在是 DevOps、MLOps、AIOps。整个生态系统正在被重新构建,我们在各地都有生态合作伙伴。当然,还有解决方案集成商和提供商,他们可以帮助每家公司整合这些能力。
在英国,我们有一些特别的合作公司:从研究人员到开发者,再到合作伙伴,这些真正了不起的公司帮助我们提升本地经济和本地人才的技能;使用这些技术的企业,当然还有云服务提供商。我们在英国有很棒的合作伙伴。我们在德国有很棒的合作伙伴,德国的合作关系非常非常出色。我们在意大利也有很好的合作关系,当然我们在法国这里也有令人惊叹的合作伙伴。
没错,加油法国。马克龙总统稍后会到场。我们将讨论一些新的——一些新的公告,所以我们必须对人工智能表现出一些热情,好吗?是的。就是这样。给他一些热情。所以这里,在法国,有非常棒的合作伙伴关系。我想特别强调一个合作伙伴:我们与施耐德的合作。构建...甚至建造这些人工智能工厂,我们现在都是数字化建造的。我们通过数字化设计它们,我们通过数字化制造它们;我们通过数字化操作或优化它们,最终我们甚至会在数字孪生中完全数字化地优化和操作它们。
这些人工智能工厂非常昂贵,有时高达 500 亿美元,未来将达到 1000 亿美元。如果该工厂的利用率未达到最大化,工厂所有者将面临巨大的成本压力。因此,我们需要在任何可能的地方实现数字化并使用人工智能:将一切都放入元宇宙,以便我们能够获得直接且持续的遥测数据。我们今天宣布了一项伟大的合作伙伴关系:一家年轻的公司,一位我非常喜欢的首席执行官,他正试图打造一家欧洲的人工智能公司。这家公司的名字叫 Mistral。
今天我们宣布,我们将在这里共同打造一个 AI 云平台,用于部署他们的模型,以及为 AI 生态系统中的其他初创企业提供 AI 应用,使他们能够使用 Mistral 模型或任何他们喜欢的模型。所以 Mistral 和我们将合作在这里建设一个非常庞大的人工智能云平台。我们会讲……今天稍后我们会和马克龙总统详细谈论这件事。
人工智能技术正以光速发展。我这里展示的是左侧的专有模型,正以光速前进。然而,开源模型也在以光速发展。仅落后几个月。无论是 Mistral、LLaMA,还是即将推出的DeepSeek R1、R2:第一季度,这些模型都非常出色。每一个都非常出色。因此,过去几年里,我们致力于汇聚世界顶尖的人工智能研究人员,进一步提升这些人工智能模型的性能。我们称之为 Nemotron。
基本上,我们所做的是采用开源模型(当然,这些模型无一例外都是基于 NVIDIA 构建的),然后我们进行后期训练。我们可能会进行神经网络架构搜索……我们可能会进行神经网络架构搜索,提供更优质的数据。使用强化学习技术,增强这些模型,赋予其推理能力:扩展上下文,使其在与你互动之前能够学习和阅读更多内容。大多数这些模型的上下文相对较短:我们希望它具备强大的上下文处理能力,因为我们想在企业应用中使用它,而我们希望进行的对话内容并不在互联网上。这些内容存在于我们公司内部,因此我们必须为它加载大量的上下文信息。
所有这些能力随后被打包成一个可下载的 NIM。你可以访问 NVIDIA 的网站,直接下载一个 API:一个最先进的 AI 模型,放置在你喜欢的任何地方,然后我们会大幅提升它的性能。这是 Nemotron 相较于 LLaMA 的改进示例。这是通过我们的后训练能力改进的 LLaMA 8B、70B、405B 模型。推理能力的扩展,我们提供的所有数据极大地增强了它。我们将一代又一代地持续进行下去。
所以,对于所有使用 Nemotron 的人来说,你们将会知道未来还有一大批其他模型。而且它们本来就是开源的,所以如果你想从开源模型开始,那太棒了。如果你想从 Nemotron 模型开始,那太棒了。Nemotron 模型的性能非常出色。在一次又一次的基准测试中,Nemotron 的表现始终位居榜首。所以现在你知道,你可以使用一个依然开放的增强型开放模型。那是领导者榜单的顶端,你知道 NVIDIA 致力于此:所以我会一直做到生命的尽头,好吗?
这个策略太棒了,这个策略太棒了,以至于区域模型制造商——欧洲各地的模型构建者们现在都认识到这个策略的美妙之处:我们正在合作,共同调整和提升每一个区域语言的模型。您的数据属于您。您的数据属于您。它是您民族的历史,是您民族的知识。你们民族的文化。它属于你们,对于许多公司来说:以 NVIDIA 为例,我们的大部分数据都存储在内部。33 年的数据。我今天早上在查资料,西门子:180 年的数据,其中一些记录在纸草上。Roland Busch 来了。我,我想捉弄一下 Roland Busch,我亲爱的朋友。所以,你得先把它数字化,AI 才能学习。所以,是的,数据属于你。你应该使用这些数据,使用像 Limotron 这样的开源模型和我们提供的所有工具套件,这样你就可以为自己的用途进行增强。
我们还宣布,我们与 Perplexity 建立了良好的合作关系。Perplexity 是一款推理搜索引擎。是的。我使用的三个模型是 ChatGPT、Gemini Pro 和 Perplexity。这三个模型我交替使用,Perplexity 非常出色。我们今天宣布,Perplexity 将整合这些区域模型,直接接入 Perplexity,让你能够用你的语言提问并获得答案:以你所在国家的文化和感知方式,明白了吗?所以是 Perplexity 区域模型。
Agent智能体是一个非常重要的事情。正如你所知,起初,使用预训练模型时,人们说,“但它会产生幻觉。它会编造内容。”你说得完全正确。“它无法获取最新的新闻和数据信息。”完全正确。“它在没有推理分析问题的情况下就放弃了。”“就好像每一个答案都必须从过去记忆中获得。”你说得完全正确。所有这些事情,你知道的,为什么它要试图弄清楚如何加法或者计算计数数字并相加?为什么它不直接用计算器?你说得完全正确。
因此,所有与智能相关的能力——每个人都能提出批评,但这完全正确,因为大家大致了解智能是如何运作的。但这些技术正在全球范围内被开发建设:它们全部汇聚在一起,从增强检索生成到网络搜索,再到多模态理解,这样你就可以阅读 PDF 文件、访问网站,查看图片和文字、听视频,观看视频,然后将所有这些理解融入你的语境中。你现在当然也可以理解几乎任何事物的提示。你甚至可以说,“我要问你一个问题,但从这张图片开始。”我可以说:“从这个开始,先从这段文字开始再回答”,回答问题或执行我要求你做的事。”然后它会自行推理、计划和自我评估。
所有这些能力现在都已整合,你可以看到它们在市场上随处可见。具备代理性的人工智能是真实存在的。自主智能是一次从一次性人工智能迈出的巨大飞跃。一次性人工智能是必要的基础,它让我们能够教会智能体如何成为智能体。你需要具备一定的知识基础和推理能力,才能具备可教性。预训练关乎人工智能的可教性。后训练、强化学习、监督学习、人类示范、上下文提供、生成式人工智能,所有这些正在融合,形成如今的智能代理人工智能。
让我们来看一个例子。让我给你展示点东西。它基于 Perplexity 构建,非常酷。
(伴奏音乐播放)人工智能代理是数字助理。基于提示,它们进行推理并将问题分解为多步骤计划。它们使用合适的工具,与其他代理协作,并利用记忆中的上下文在 NVIDIA 加速系统上正确执行任务。一切从一个简单的提示开始。让我们请 Perplexity 帮忙在巴黎开一家餐车。
首先,Perplexity 代理通过提示进行推理并制定计划,然后调用其他代理使用多种工具帮助解决每个步骤。市场研究员阅读评论和报告,以发现趋势并分析竞争市场。基于这项研究,概念设计师探索当地食材并提出包含准备时间估算的菜单,并研究调色板,生成品牌识别。然后,财务规划师使用蒙特卡洛模拟来预测盈利能力和增长轨迹。一名运营策划人员制定了包含每个细节的发射时间表:从购买设备到获取正确的许可。市场专员制定了包含社交媒体活动的发射计划,甚至编写了一个包含地图的互动网站、菜单和在线订购。
每个代理的工作汇集成最终的方案提案。一切都始于一个简单的提示。一个提示,就像那样的一个提示,在原始聊天机器人中,可能只会生成几百个标记。但现在只需一个提示,交给代理去解决问题,它生成的标记数量必定多出一万倍。这就是为什么需要 Grace-Blackwell 的原因:这就是为什么我们需要性能以及系统在代际之间有更大提升的原因。这就是 Perplexity 构建他们的智能代理的方式。每家公司都必须构建自己的智能代理。
这太棒了,你将会从 OpenAI、Gemini、微软 Copilot、Perplexity、Mistral 等平台招聘代理。也会有为你量身打造的代理。他们可能会帮助你规划一次假期,或者你知道,去做一些研究,诸如此类。然而,如果你想创办一家公司,你将需要专用的代理和专用的工具,以及使用专用的工具和专用的技能。那么问题是,你如何构建这些代理?
因此,我们为你创建了一个平台。我们创建了一个框架和一套工具供您使用,还有一大批合作伙伴帮助您实现目标。这一切从最底层开始,最底层:我之前提到的推理模型能力。NVIDIA 的 NeMo、NeMotron 推理大型语言模型是世界一流的。我们有 NeMo Retriever,这是一款多模态搜索引擎。语义搜索引擎。令人难以置信。我们构建了一个蓝图,一个可运行的演示,基本上是一个通用智能体。我们称之为 IQ,AI,AIQ。
最上层,我们有一套工具,允许你引入一个代理:一个通用代理,整理数据来教它;评估它,设定安全边界,监督训练它,使用强化学习直到部署;保持安全,确保保障。这套工具包已经集成,这些库也已集成到 AIOps 生态系统中。你也可以直接从我们的网站下载。但它主要集成在 AIOps 生态系统中。基于此,你可以创建自己的专属代理。
许多公司都在这样做。这是思科,他们昨天宣布,“我们正在共同构建用于安全的人工智能平台。”现在,看看这个。人工智能代理,而不是一个模型完成所有这些惊人的任务:它是一个模型集合,一个系统。它是一个由大型人工智能语言模型组成的系统。其中一些经过专门优化,适用于某些特定类型的任务。检索,正如我提到的,使用计算机执行技能。你不想把所有这些东西捆绑成一个庞大的,你知道的,人工智能整体,而是将其拆分成小部分,然后可以随着时间推移部署持续集成/持续交付。这是思科的一个例子。
现在的问题是,如何部署这个?因为正如我之前提到的,NVIDIA 的计算资源存在于公共云中。有区域云,我们称之为 NCP。这里,比如说 Mistral。你可能因为安全需求和数据原因拥有私有云。数据隐私要求。你甚至可能会决定桌子上放些什么东西。那么问题是,你如何运行所有这些?有时它们位于不同的地方,因为这些都是微服务:这些是能够相互交流的人工智能,它们显然可以通过网络相互通信。
那么,如何部署所有这些微服务呢?现在,我们有了一个很棒的系统。我很高兴能为大家宣布这一消息。这就是我们的 DGX Lepton。DGX Lepton,你现在看到的是各种不同的云。这里是 Lambda 云,AWS 云,你知道的。这是你自己的开发者机器,你自己的系统:可以是一台 DGX 工作站。NeBS、Yotta、Nscale。可能是 AWS,也可能是 GCP。NVIDIA 的架构无处不在。
因此,您可以决定在哪里运行您的模型。你通过一个超级云来部署它,所以它是一个云中之云。一旦你让它运行起来,一旦你将这些 NIMs 部署到 Lepton 中,它就会在你选择的各种云上托管和运行。一种模型架构,一次部署,随处运行。你甚至可以在这台小小的机器上运行它。你知道,这个 DGX Spark,它是, 它是……这是,现在是咖啡时间吗?看看这个。
这台电梯有 2000 马力。这是我最喜欢的小机器。DGX Spark。第一个……人工智能超级计算机,我们在 2016 年建造了一台人工智能超级计算机。它被称为 DGX-1。它是我刚才提到的所有技术的第一个版本。八个 Volta GPU 通过 NVLink 互联。我们花费了数十亿美元来建造它,而在我们宣布它的那一天:DGX-1,没有客户。没有兴趣,没有掌声。百分之百的困惑。为什么有人会造那样的电脑?它能运行 Windows 吗?不能。
所以我们还是造了它。谢天谢地,是一家年轻的公司,一家初创企业:旧金山的一家非营利初创公司看到这台电脑时非常高兴,他们说:“我们能要一台吗?”我当时想:“天哪,我们卖出一台了。”但后来我发现那是一家非营利组织。但是它……我把一台电脑,呃——一台 DGX-1 放进了我的车里,然后我开车把它带到了旧金山。那家公司的名字叫 OpenAI。
所以我不知道这其中的生活教训是什么。有很多非营利组织,你知道的。所以下次,下次……但是……也许教训是:如果有开发者联系你:“需要,需要一个 GPU,”答案是肯定的。所以,所以……没错。
想象一下你拥有 Lepton。它就在你的浏览器中,你拥有,你拥有,这个,这个 Helm Chart。你开发了一个人工智能代理,想在这里运行它:其中一部分你想在 AWS 上运行,还有一部分你想在其他地方运行,知道吗?在某个区域云中。你使用 Lepton,部署你的 Helm Chart,它就神奇地出现在这里。好吗?如果你想在这里运行它,直到完成并准备好部署到云端:太好了。但美妙之处在于,这一架构基于 Grace Blackwell。GB10 对比 GB200 对比 GB300,以及所有这些不同版本的... 但这一架构正是 Grace Blackwell。这真是令人惊叹。
所以我们正在为 Lepton 做这件事,但接下来:Hugging Face 和 NVIDIA 已经将 Lepton 连接在一起。因此,每当你在 Hugging Face 上训练模型时,如果你想将其部署到 Lepton:并直接部署到 Spark,也没问题。只需轻轻一击。无论你是在训练还是推理,我们现在都已接入 Hugging Face,Lepton 将帮助你决定部署位置。让我们来看看。开发者需要轻松且可靠地访问计算资源,以跟上他们的工作节奏:无论他们身处何地,无论他们在构建什么。
DGX Cloud Lepton 提供按需访问跨云的全球 GPU 网络:地区和合作伙伴,如 YOTA 和 Nebious。多云 GPU 集群通过单一统一界面进行管理。资源配置速度快。开发者可以快速扩展节点数量,无需复杂设置,使用预集成工具和训练就绪的基础设施立即开始训练。进度实时监控。GPU 性能、收敛性和吞吐量尽在掌握。您可以直接在控制台内测试您的微调模型。
DGX Cloud Lepton 可以在多个云或区域部署 NIM 端点或您的模型,实现快速分布式推理。就像网约车应用连接乘客和司机一样,DGX Cloud Lepton 连接开发者与 GPU 计算能力:驱动虚拟全球 AI 工厂。DGX Cloud Lepton。
好了,这就是思科。这是 SAP 的做法,他们正在 NVIDIA 上构建一个人工智能平台。Sana 正在 NVIDIA 上构建一个人工智能业务应用自动化系统。DeepL 正在基于 NVIDIA AI 构建他们的语言框架和平台。Photoroom,一款视频编辑和人工智能编辑平台:他们的平台基于 NVIDIA 构建。这是 KODO,我记得以前是,应该是 Codium,基于 NVIDIA 构建的令人难以置信的编码代理。这是 Iola,一个基于 NVIDIA 构建的语音平台。这个是一个,临床试验平台:全球最大的基于 NVIDIA 的临床试验自动化平台。
所以所有这些,基本上都是建立在同一个理念之上:NIMS,将其封装并打包在一个虚拟容器中,您可以在任何地方部署。Nemotron 大型语言模型,或其他大型语言模型:比如 Mistral 或其他。我们随后整合了涵盖 AI 整个生命周期的库:一个人工智能代理。你对待人工智能代理的方式有点像对待数字员工。所以你的 IT 部门需要对他们进行入职培训:微调它们,训练它们,评估它们,保持它们的安全防护;你知道,保持它们的安全,并不断改进它们。整个框架平台就叫做 Nemo,所有这些现在都被整合到全球一个又一个的应用框架中。这只是其中几个的例子。
现在我们让您能够在任何地方部署它们。如果你想在云端部署它:你在云端有 GB2 00s。如果你想在本地部署,因为你有VMware 或 Red Hat Linux 或者Nutanix,如果你想在本地的虚拟机上部署它:你可以这么做。如果你想把它部署成私有云:你可以做到这一点。你可以将它全部部署在你的 DGX Spark 或 DGX Station 上。没问题。所以 Lepton 会帮助你完成所有这些。
让我们来谈谈工业人工智能。这是我最喜欢的时刻之一。这是罗兰·布施。他刚刚,这真是一个非常有趣的时刻。他想提醒我,神经计算机:神经网络计算机是在欧洲发明的。这就是整张幻灯片的内容。Le- 我只是,真的是一个非常棒的时刻。这是 Synapse I。这真是太不可思议了,大家。Synapse I。这是 1992 年的 Synapse I,它运行神经网络的速度比当时的 CPU 快 8000 倍。这难道不可思议吗?这就是世界上最强的人工智能计算机。
而且,Roland 只是想,想说:“永远不要忘记这一点,Jensen。”永远,永远不要忘记这一点。”我说,“好的,我会记住的。”好吧。我会告诉的,甚至会告诉所有人。西门子 1992 年。西门子 1992 年。我们与西门子有着良好的合作关系——西门子,还有,罗兰·布什,首席执行官:就是,给公司注入超级动力,使他们能够实现飞跃:完全跨越上一轮信息技术产业革命,融合欧洲的工业能力:将西门子的工业能力和实力与人工智能结合起来,并创造所谓的工业人工智能革命。
我们在许多不同领域与西门子合作:从设计、仿真、工厂数字孪生到工厂中人工智能的运营,涵盖方方面面。从头到尾的一切。这让我想起,也让我自己想起:欧洲的工业能力是多么令人难以置信;这对你来说是一个非凡的机会。多么非凡的机会,因为人工智能不同于传统软件。人工智能实际上是非常非常智能的软件。这款智能软件终于能够做一些可能彻底改变您所服务行业的事情。
视频:一切始于此地。第一次工业革命。瓦特的蒸汽机和机械织机引入了自动化和工厂的出现:工业由此诞生。
电气时代。安培揭示了电磁学的奥秘。法拉第制造了第一台电动发电机,麦克斯韦奠定了现代电气工程的基础。西门子和惠斯通的发电机,电力的引擎:让机器、火车、工厂和城市焕发生机,为地球通电,点燃现代制造业。
而今天,源自计算与信息时代:第四次工业革命,人工智能时代:重新构想工业的每一个环节。
在整个大陆,工业人工智能正在迅速普及。从设计到工程,您正在开辟通往理解与创新的新路径。您将物理世界引入虚拟空间,以规划和优化全球现代工厂。
您正在构建下一个前沿,那里所有移动的事物都是机器人。每辆汽车都是一个智能的自主代理,同时也是一支新的协作劳动力,助力弥合全球劳动力短缺的缺口。
整个大陆的开发者们正在打造各种类型的机器人:在数字孪生世界和机器人管道中教它们学习新技能;让他们准备好与我们一起在工厂工作:仓库、手术室以及家中。
黄仁勋:你怎么看?我喜欢那个视频。是你做的。太棒了。你成功了。我们正在与一家又一家公司合作,致力于工业人工智能的开发。这是宝马在元宇宙中建设他们的下一代工厂。这个,我不知道该怎么说。有人能教我吗?Buges?听起来不错。嗯……完全正确。完全正确。干得好。干得好。完全正确。他们,他们当然是在建他们的工厂。Omniverse 中的数字孪生。这是他们的一个关键,呃:他们用于仓库物流的数字孪生。
这是梅赛德斯-奔驰及其在 Omniverse 中构建的工厂数字孪生。这是舍弗勒及其在 Omniverse 中构建的仓库数字孪生。这是你们在法国的火车站:在 Omniverse 中构建他们火车站的数字孪生。这是丰田在 Omniverse 中构建他们仓库的数字孪生。当你在 Omniverse 中构建这些仓库和工厂时,那么你可以,你可以设计...你可以设计...你可以设计它,你可以规划它,你可以改变它。在绿地环境中它很棒,在棕地环境中也很棒。你可以在实际搬动和调整之前模拟其效果,避免发现它并非最优。
因此,在数字孪生中实现一切数字化的能力是令人难以置信的。但问题是,为什么数字孪生必须看起来像照片一样真实?为什么它必须遵守物理定律?原因是我们最终希望成为一个数字孪生体,让机器人能够学习如何作为机器人操作。而机器人依赖光子来实现其感知系统。这些光子是通过 Omniverse 生成的。机器人需要与物理世界互动,这样它才能知道自己是否在做正确的事情,并且能够……学会如何正确地去做,因此这些数字孪生必须看起来真实,行为也要逼真。明白了吗?这就是构建 Omniverse 的原因。
这,太棒了。这是一个聚变反应堆的数字孪生。这是一件极其复杂的仪器,正如你所知:没有人工智能,下一代聚变反应堆是不可能实现的。我们正在……我们今天宣布,我们将在欧洲这里建设世界上第一个工业人工智能云。我要宣布——是的。
这些工业人工智能云,确实是大量的计算资源……云端有大量的计算机。然而,它在性能和安全性方面的要求根本不同。所以我将在周五向大家详细介绍。今天我只是先卖个关子。但这个工业云将用于设计和仿真。虚拟风洞,你只需走进去:虚拟风洞,你只需把车开进去,就能看到它的表现。开门、开窗、改变设计,所有操作完全实时进行。实时设计,数字风洞中模拟:风洞的数字孪生,实时呈现:在数字工厂中建造它。实时数字孪生。
所有这些,以及机器人如何学习成为优秀的机器人并打造我们未来的机器人。自动驾驶汽车等。我们这里已经拥有了庞大的生态系统。正如你所知,我们已经在这里待了很长时间。NVIDIA 已有 33 年历史。我们第一次来到欧洲,是在工作站和产品数字化兴起的时候。CAD,CAD 革命开始的时候。我们经历了 CAE 革命,现在正处于数字孪生革命时期。这里在欧洲有大约两万亿美元的生态系统,我们与之合作……并且有幸为其提供支持。
由此产生的是一场正在发生的新革命。正如你所知,所有会动的东西都将是机器人。所有会动的东西都将由人工智能驱动。而汽车是最明显的下一个领域。英伟达打造用于训练模型的人工智能超级计算机:用于 Omniverse 数字孪生的人工智能超级计算机。我们还为机器人本身打造人工智能超级计算机。无论是在云端:用于 Omniverse,还是在汽车中,我们都提供完整的技术栈:包括计算机本身,以及运行在这台计算机上的操作系统:每一种情况都不同。
这台计算机高速且传感器丰富,必须具备功能安全性。在任何情况下都绝不能完全失效。因此,安全要求极高。现在我们有了一个令人难以置信的模型,运行在其之上。这个运行在其之上的模型是一个变换器模型。它是一个推理模型,能够接收传感器输入:你告诉它你想做什么,它就会带你去那里。接收像素输入并生成路径规划输出。所以它是一个基于变换器的生成式人工智能模型。令人难以置信的技术。英伟达的人工智能团队,AV 团队,令人难以置信。这是我所知道的唯一一支连续两年在 CVPR 端到端自动驾驶汽车挑战赛中获胜的团队:所以他们今年再次获胜。让我们来看一下视频。是的,谢谢。
(器乐音乐)像任何司机一样,自动驾驶车辆在一个充满不可预测且可能危及安全的场景中运行。NVIDIA DRIVE,基于 HALO 安全系统构建:让开发者使用多样的软件堆栈、传感器和冗余计算机构建安全的自动驾驶车辆。
一切始于训练。安全的自动驾驶车辆需要大量多样化的数据,以应对各种边缘情况。但现实世界的数据有限。开发者使用 NVIDIA Omniverse 和 Cosmos 重建现实世界,生成逼真的合成训练数据,为自动驾驶模型带来多样性。该模型能够感知并推理其环境。预测未来结果,并生成运动计划....以及用于决策多样性。一个独立的经典堆栈并行运行。安全护栏监控安全性能,在出现异常时会调用仲裁器进行紧急停止。传感器和计算架构中还内置了更多的多样性和冗余。每个传感器都连接到冗余计算机,因此即使传感器或计算机发生故障,车辆仍然保持安全并正常运行。在发生关键故障的情况下,系统可以执行最低风险的操作,比如靠边停车。安全是自动驾驶的基础。NVIDIA DRIVE 让全球开发者能够将 HALOS 集成到他们自己的产品中,打造下一代安全的自动驾驶汽车。
十亿辆汽车上路,平均每年行驶一万英里,一万亿英里。自动驾驶的未来显然是巨大的,它将由人工智能驱动和支持。这是下一个巨大的机遇,我们正在与全球众多大型且卓越的公司合作,使这一切成为可能。在我们所有与自动驾驶相关的工作中,安全始终是核心。我们对我们的 HALOS 系统感到非常自豪。它始于芯片的架构,然后是芯片设计和系统设计,操作系统、人工智能模型以及软件开发的方法论,我们测试的方式,从训练模型的方法到为模型提供的数据,再到评估模型的方式。NVIDIA 的 HALOS 系统以及我们的自动驾驶安全团队和能力在全球享有盛誉。这台计算机是第一台软件定义的计算机。全球首个完全 100%软件定义的、由人工智能驱动的软件,面向自动驾驶汽车的增强现实人工智能驱动堆栈。我们已经从事这项工作将近十年了,这一能力享誉全球,我对此感到非常自豪。
汽车行业正在发生的变化,同样也正在一个新兴产业中上演。正如我之前提到的,如果你能根据提示生成视频,如果人工智能能够感知,它就能推理,还能生成视频、文字和图像,刚才提到的汽车、路径、方向盘路径,为什么它不能同时产生局部运动能力和关节活动能力?因此,人工智能彻底改变机器人领域最难问题之一的基本能力即将到来。类人机器人将成为现实。我们现在知道如何构建这些东西,训练这些东西,以及操作这些东西。人形机器人可能将成为有史以来最大的产业之一,这需要那些懂得制造东西的公司,制造具有非凡能力的东西。这指的是欧洲国家。世界上许多产业都基于这里。我认为这将是一个巨大的机遇。好吧,假设全球有十亿台机器人。拥有十亿机器人是一个非常合理的想法。那么,为什么这还没有发生呢?原因很简单。如今的机器人编程太复杂。只有最大的公司才能负担得起安装机器人。让机器人学习,编程使其执行完全正确的操作。保持足够的包围以确保安全。这就是为什么世界上最大的汽车公司都配备了机器人。它们体积足够大,工作足够重复。确实,行业已经达到足够的规模,可以在这些工厂部署机器人。几乎所有中小型企业都是如此,无论是夫妻店、餐馆、商店还是仓库。直到现在,实现那种编程能力是不可能的。我们将为你提供本质上可以教导的机器人。它们会向你学习。
正当我们在讨论自主智能时,我们现在拥有能够通过教学学习的人形智能,使用的工具包与 Nemo 工具包非常——非常一致,我——我刚才提到了。NVIDIA HERE 同样是建立在三层堆栈之上。我们打造了这台计算机,名为 Thor,Thor 计算机。开发套件看起来大致是这样的。这是一全自给自足的机器人电脑。开发套件放在你的桌面上。这些都是传感器,内部是一颗小型超级计算机 Thor 芯片。真是非常,非常令人难以置信。这些——……是的。我可以,我可以想象把这个去,就像那样。好的。谢谢你,珍妮。(清嗓子)这就是 Thor 处理器。上面是为机器人设计的操作系统。此外,变换器模型接收传感器数据和指令并进行转换,生成飞行路径或轨迹,以及手臂关节的运动控制,手指关节的运动控制,当然还有你的腿部关节运动控制。
现在,人形机器人面临的最大挑战是训练所需的数据量非常、非常难以获取。那么问题是你如何做到这一点?解决这个问题的方法是回到 Omniverse,一个遵循物理定律的数字孪生世界。这是我们正在做的一项令人难以置信的工作。别做。别……(诡异音乐响起)哦,天哪,是我的错。好的,这些是机器人。我们有……我们开发了计算机来模拟,来训练它们。计算机来模拟它们,以及装在它们内部的计算机。全球正在建立大量的人形机器人公司。他们都看到了彻底变革这一新领域的巨大机遇。可以说是一种新设备,进展非常迅速。它们学习的方式是在一个虚拟世界中学习,而这个虚拟世界必须遵守物理定律。最近,我们宣布了与迪士尼研究院和 DeepMind 的一项重大合作,我们将共同努力,打造世界上最复杂的物理模拟。
此刻,我只是在努力弄清楚如何切换到那张幻灯片。教我。谁和我一起?(诡异的音乐响起)这就是只排练一次的后果。好吧,这个,这个令人难以置信的系统,就是一个人工智能学习如何成为人工智能的地方。让我给你展示一下。
(欢快的音乐播放)(鸟鸣)(哔哔声)(口哨声)(水花声)(雷声)(吱吱声)(口哨声)我们有一位特别嘉宾。你的名字是格雷克。你是,你是……你是小男孩还是小女孩?好的。他是……格瑞克是一个小女孩。现在,看这个。Grek 学会了在 Omniverse 中行走,遵守物理定律。而在 Omniverse 中,我们创建了成千上万个场景。最后,当 Grek 学会了如何在那些环境中操作、行走和操控时,在沙地上,在砾石上,在滑溜的地板上,在混凝土上,在地毯上,那么当涉及到当 Grek 进入物理世界时,物理世界只是世界的第 100,001 个版本。所以你学会了在虚拟世界中行走,看看你现在的样子。你能……你能跳吗?哇。你会跳舞吗?(哔哔声)(电子萨克斯演奏)我觉得……我觉得,嗯……我只是想让你知道,我是主旨演讲者。所以我需要你……我需要你表现得规规矩矩。我需要你乖一会儿。我需要你乖一会儿,S-...你能坐下吗?坐下。(电子音乐播放)嘿,你知道我们应该做什么吗?我们来给大家拍张照片。(相机快门声)是的。砰,砰。你愿意跟我回家吗?你想跟我回家吗?我有点—(哔)是的,我知道。是的,我有宠物。他们想把你当作宠物。不想吗?(esqmas 音乐播放)哦,哦。不。你真聪明。你真聪明。太不可思议了,对吧?你是世界上最棒的机器人,总有一天我们都会拥有一个像你这样的。他们会跟着我们到处走。但如果我需要……如果我需要一杯威士忌,你得去告诉别人帮我拿杯威士忌,因为你没有手臂。(电子音乐播放)哦,哦。是的。你真可爱。好了,小姑娘,你在这里等一会儿。我们收尾吧。
(清嗓子)好了。这非常清楚。非常清楚,一场工业革命已经开始。下一波人工智能浪潮已经开始。Grek 是机器人技术现阶段可能实现的完美范例。教机器人操作所需的技术,进行模拟,当然,一个令人难以置信的机器人现在就展现在我们面前。我们有实体机器人,也有信息机器人。我们称它们为代理。下一波人工智能已经开始。这将需要……推理工作负载的爆炸式增长。它基本上将呈指数增长。使用推理的人数已经从八百万增加到八亿。仅仅几年时间就增长了一百倍。令牌生成的提示数量和数量,正如我之前提到的,从几百个标记到几千个标记,当然,我们现在比以往任何时候都更多地使用人工智能。比以往任何时候都更多。所以我们需要一台专门为思考设计的计算机,专为推理设计,这就是 Blackwell,一台思考机器。
这些 Blackwells 将被用于新型数据中心,本质上是人工智能工厂,专为一件事而设计,这些人工智能工厂将生成Token,这些Token将成为你的食物,小格雷克。是的,我知道。我知道。
真正令人难以置信的是,我很高兴看到欧洲正在全力投入人工智能。这里建设的人工智能基础设施将在未来几年内增加一个数量级。我要感谢大家的合作伙伴关系。祝你们在 VivaTech 活动中度过愉快时光。(鼓掌)谢谢。说再见。说再见。拍一堆照片。拍一堆照片。拍一堆照片。是吗?