北京时间3月19日4时-6时,英伟达创始人黄仁勋在美国加州圣何塞SAP中心登台,发表GTC 2024的主题演讲《见证AI的变革时刻》。鉴于过去一年多时间里AI带来的生产力变革,以及英伟达等一众概念股的表现,黄仁勋的演讲已经变成全球资本市场翘首以待的热门事件。

在这场两个小时的演讲中,黄仁勋公布了搭载B200芯片的GB200 Grace Blackwell超级芯片系统,以及英伟达在AI软件(NIM微服务)、Omiverse云、具身智能方面的最新进展。


黄仁勋介绍了本届GTC的一些参与者,并强调这些公司不只是来参会,而是有自己的东西要来展示。黄仁勋展示英伟达发展史,又提了将首台DGX One送给OpenAI的故事。


1. 加速计算的重要性:

算力方面,NVIDIA GTC将会发布 B100 GPU产品,全球AI高景气度背景下,我们依然坚定算力为基的观点,B100 的运行速度我们认为相较于此前的GPU芯片会更进一步,产业链更新迭代速度有望加快;根据英伟达的数据,现在智能驾驶模型所基于的Transformer架构没有出现之前,算力需求大致是每两年提升8倍。但自从Transformer架构开始大范围应用后,算力需求变成了每两年提升275倍。

加速计算已到达临界点,通用计算逐渐失去动力。加速计算在性价比上远超通用计算,几乎遍布所涉足的每个行业。它的影响不局限于单一行业。各行业正在利用数字孪生技术,实现全流程数字化、高保真模拟。这意味着要大幅提升计算规模。合作伙伴正携手NVIDIA,共同推动整个生态系统进入加速计算时代。

加速计算的另一大优势在于,当整个基础设施与GPU耦合时,便可轻松实现AI生成能力。NVIDIA已与一些重要合作伙伴建立了深度关系。ANSYS、新思科技、Cadence这些顶级公司,正在利用NVIDIA GPU加速系统的巨大安装基础,为最终用户、系统制造商、CSP创造巨大机遇与客户需求。


2.全新的Blackwell架构:

黄仁勋展示了Blackwell,一款为生成性人工智能而设计的新一代GPU平台,它拥有2080亿个晶体管,可以处理数万亿个参数的模型。

他还展示了Blackwell的两种系统配置,以及一些新的特性,如自适应的张量核心、高速的NVLink开关和安全的AI加密。Blackwell集成了安全AI能力,包括在静止和传输时的加密,以及高速压缩引擎。

该GPU旨在降低AI计算的成本和能耗,实现更大模型的训练和计算能力的扩展。它拥有强劲的算了性能,与Hopper的比较,由两片 B200 组成的 GB200 在基于 1750 亿组参数 GPT-3 模型的基准测试中,其性能是 H100 的 7 倍、训练速度则提高了 4 倍。GPT-MOE-1.8T参数模型,可以在2000台Blackwell GPUs上90天完成训练,相比使用H100仅需要四分之一的能源。


3.生成性人工智能的应用:

黄仁勋还展示了一些令人惊叹的生成性人工智能的应用,如AI + 机器人、AI + 汽车、AI + 生物医疗,值得注意的是,本次大会出现了两家国内的Biotech:途深智合与碳硅智慧,前者是一家AI蛋白质设计公司,开发了集多种先进自研AI模型的蛋白质设计平台—ProteinEngine;后者则是一家AI制药公司,拥有一站式AI驱动新药发现平台DrugFlow。

4.总结

首先是新工业革命。每个数据中心都应该加速价值万亿美元的已安装数据中心。由于计算能力带来了一种新的软件制作方式,生成式人工智能(Generative AI)已经出现,因此在未来几年内将变得现代化。这将创造新的基础设施,这些基础设施致力于做一件事且仅做一件事,它们不适用于多用户数据中心,而是人工智能生成器。这些人工智能生成器将创造出极其有价值的软件。

第二,这次革命的计算机。这一代的计算机,万亿参数的生成式AI。Blackwell,疯狂数量的计算能力。

第三, Nims。新计算机创建新类型的软件。新型软件应该以新的方式分发,以便它可以一方面成为云中的端点,易于使用,但仍然允许您随身携带,因为它是你的智慧。你的智慧应该以一种允许你随身携带的方式打包,我们称之为NIMS。

第四,Nemo and Nvidia AI Foundary。这些NIMS将帮助你为未来创建一种新型的应用程序,而不是你完全从头开始编写的应用程序,但您将像Teams一样集成它们。这些应用程序在NIMS、人工智能技术、工具Nemo和基础设施DGX云之间拥有出色的能力。在我们的AI工厂里,帮助您创建专有应用程序、专有聊天机器人。

最后,Omniverse and ISAAC 机器人。未来移动的一切都将是机器人,您不会是唯一的一个和这些机器人系统。无论它们是人形机器人、自动驾驶汽车、叉车还是操纵手臂,他们都需要一件事:巨型体育场仓库、那里的工厂可以是工厂、机器人编排工厂、机器人生产线、制造机器人汽车。这些系统都需要一个东西,一个平台,一个数字平台,一个数字孪生平台,我们称之为全宇宙,机器人世界的操作系统。