黄仁勋研发超强AI芯片，挑战英伟达

文章主要介绍的是黄仁勋研发超强AI芯片，挑战英伟达相关内容！

每年8月，英伟达都会在全球最重要的计算机图形会议SIGGRAPH上秀一秀「肌肉」。

五年前，英伟达CEO黄仁勋在2018SIGGRAPH发布了首款支持光线追踪的显卡QuadroRTX，这是英伟达自G80以来最重要的产品，把英伟达GPU从GTX时代推向了RTX时代。

彼时，英伟达还是一个非常纯粹的图形计算芯片厂商，满脑子想的都是怎样把3D渲染推向极致，其市值约为814亿美元，还没进入千亿俱乐部。

很长一段时间里，游戏业务一直是英伟达主营业务，直到2023年第一财季，在PC市场消费低迷和AI计算升温的双重影响下，英伟达的数据中心业务终于迎头赶上，成为了英伟达第一收入来源，这也标志着英伟达正式从传统的GPU供应商转型成了全球最大的算力供应商之一。

在这之后，英伟达的数据中心开始一路狂飙，其H100、A100等计算显卡成了AI行业的硬通货，一度出现严重短缺。有分析师推测，全世界可能需要43.2万张H100才能满足市场需求。

英伟达最新一季的财报显示，得益于企业们的强烈需求，英伟达的数据中心业务在Q1的营收有为42亿，同比增长了14%，环比增长了18%，超出华尔街的预期。

但如果你觉得英伟达只是碰巧被AI热钱砸中的幸运儿，那也太小看老黄了。

对英伟达来说，造「核弹GPU」、投入AI，这些不过是实现他们最终愿景的所要做的「准备工作」，英伟达真正想要做的，是建设一个真正的元宇宙。

最先进的「锄头」

工欲善其事，必先利其器，英伟达深谙此理。

今年3月，英伟达发布了H100NVLGPU、L4TensorCoreGPU、L40GPU以和NVIDIAGraceHopper四款AI推理芯片，以满足企业们日益增长的算力需求。

5月的台北电脑展上，老黄发布了用256个NVIDIAGH200GraceHopper超级芯片组成的超级计算机DGXGH200。

而就在昨天，老黄又发布了搭载HBM3e内存新版GH200，甚至连上一代的GH200还没正式出货，更新速度快得吓人。

新旧GH200之间的差异主要集中在内存上。

GH200GraceHopper是世界上首个搭载HBM3e内存的GPU芯片，内存容量从每个GPU96GB扩展到144GB，增加了50%。

HBM3e内存是一种新型的高带宽内存技术，在运算速度上HBM3e能比HBM3运算速度快50%，提供最高5TB/秒的传输速率。这让新版本的GH200运行AI模型的速度比当前模型快3.5倍。

其中，双配置的GH200之内存能达到282GB的HBM3e内存，相比上一代的容量增加了3.5倍，带宽增加了3倍。相比抢手的H100，内存则增加了1.7倍，带宽增加1.5倍。

和上一代一样，新GH200也有着近乎夸张的拓展性。

得益于英伟达的NVLink互联技术，GH200根据企业的需求组合成不同规模的形态，单卡、双卡、多卡服务器、机柜、甚至的超级计算机都没问题。

最终，GH200可以组合成256张卡的DGXGH200SuperPod超级计算机，拥有了144TB的快速内存，每秒可以执行10的18次方次浮点运算。

如果这还不能满足你的需求，还可以用NvidiaQuantum-2InfiniBandSwitch交换机让多个NvidiaDGXGH200SuperPod相连。

老黄打趣说到「这下应该能带得动《孤岛危机》了。」

强大的拓展性为GH200的未来提供无限可能。

换而言之，想要提升运算速度，那么只需要添置更多的服务器机柜就能达成。这非常有利于在未来黄仁勋认为，未来GH200的典型应用场景就是大语言模型，并且「加速运算」、「AI运算」将逐渐取代传统x86GPU的「通用计算」。

举个例子，过去1亿美元预算，只能够建设一个小的数据中心，购买800个x86GPU，并用5兆瓦的电力来运作。

但同样的预算下，选择加速计算的GraceHopper只需要消耗3兆瓦的电力，而且数据吞吐量还能提高一个数量级。而如果以同样的工作量来计算，GraceHopper计算方案只要800万美元。

说到了这里，老黄又抛出了他的名言：「你买的越多，省的也就越多。」

官方预计，新款GH200需要等到2024年的第二季度上市。搭载HBM3内存的GH200将按原计划在今年下半年陆续出货。

当然，对于个人开发者和小团队来说，要搭建动辄上亿的数据中心并不现实，为此英伟达「贴心」地推出了集成先进RTX技术的新一代工作站显卡：NVIDIARTX5000、NVIDIARTX4500以及NVIDIARTX4000。

其中，作为旗舰级别GPU，NVIDIARTX5000采用了第4代TensorCore和第3代RTCore，相比上一代GPU，单精度浮点运算性能提升了2倍，达到了90TFLOPS的峰值，配备高达32GB的GDDR6视频内存，支持ECC错误校验，适用于高端工作站、数据中心和云游戏。

而作为中高端级别GPU，NVIDIARTX4500配备24GBGDDR6视频内存，也支持ECC校验。

相比前一代产品，NVIDIARTX4500光线追踪性能提升1倍，AI处理性能提升2倍，其性价比非常突出，适合创意专业用户、小型工作站等使用场景。

NVIDIARTX4000则采用了与RTX4500相同的GPU核心，配备20GBGDDR6视频内存，其光线追踪和AI计算性能都有大幅提升。

目前全新的NVIDIARTX5000GPU已经发售，而NVIDIARTX4500和RTX4000GPU将在今年下半年陆续出货。

最肥沃的「土地」

套用农夫山泉的广告词，我们可以这样介绍英伟达最新的AI策略：

我们不生产AI，我们只是AI的搬运工。

众所周知，本地配置AI模型是件繁琐、复杂的差事，为了帮助开发人员解决这个难题，老黄宣布，英伟达将推出「AIWorkbench」。

简单来说，AIWorkbench可以一站式地为开发者提供配置AI模型所需的框架、工具开发包等环境，直接就可以开始创建项目。

老黄在现场举了一个非常形象的例子。

比如说，公司需要配置一个StableDiffusion模型来作画，但是你既没有硬件设备，又不懂得怎么配置模型。

不用着急，这时候你只要打开AIWorkbench，选择一个4个RTX6000AdaGPU的云工作站，然后就能一键配置StableDiffusion模型。

要是你对生成出来的图片不满意，你还可以自己上传图片，重新训练模型后再生成。

不用一分钟，一张像模像样的图片就生成出来了，全程你不用操心其他问题，因为AIWorkbench已经把别的都准备就绪了。

英伟达宣布，将会与AI开源平台HuggingFace建立战略合作关系，将这一技术也被应用到了企业端。

只需在HuggingFace平台中简单点击几下，开发者即可轻松地将生成式AI项目从笔记本电脑到工作站，再转移到数据中心或云端，最终借助NVIDIADGX云AI超级计算资源来训练AI模型。

老黄强调，通过与HuggingFace的合作，英伟达最先进的AI技术可以为各行各业提供支持。企业也可以利用开源社区的力量，按照企业的规划需求推进AI的训练。

最宏大的「梦想」

介绍完了软硬件平台的更新，老黄长吁一口气说道：「让我们聊聊今晚最重要的话题——OpenUSD。」

OpenUSD对大多数人来说应该是一个陌生的名词。OpenUSD是皮克斯（是的，拍动画的那个皮克斯）在2015开源的一个框架，在此之前皮克斯已经使用这个框架超过10年，我们看过的很多动画都是基于OpenUSD框架制作的。

OpenUSD可以理解为是一个创建3D世界用于描述、组合、模拟和合作的通用标准，老黄将之比作为「HTML之于2D网页的意义」「真正地把整个世界凝聚了在一起」。

就在上周，皮克斯、Adobe、苹果、Autodesk、英伟达，以及JDF宣布成立OpenUSD联盟(AOUSD)，以促进OpenUSD标准化、开发、演变和发展。

为什么这个名不见经传的名字能让这么多不同领域的巨头公司聚集在一起？这要从3D工作的工作流程说起。

3D工作流程非常精细且复杂，例如设计师、艺术家和工程师都在3D工作流程的某个部分上有所专长，如建模、纹理、材料、物理模拟、动画、布景设计和合成等。

由于他们使用的工具（PS、AutoCAD、Blender等）是由不同的公司开发的，很多文件格式并不能互相兼容，导致用户要频繁地导出、转换格式、导入，繁琐不说还容易损坏内容。

OpenUSD正是为了解决这些问题而生的技术，通过OpenUSD，AdobeStager、Houdini、Maya、Blender、Renderman、Pixar的Minuteman和Epic的UnrealEngine等工具都能互通数据，发挥出更强大的作用。

随后，老黄郑重宣布英伟达的Omniverse将成为第一个完全为OpenUSD打造的平台，从底层的数据库到引擎系统，每一行代码都是以OpenUSD为中心设计的。

不仅如此，英伟达还一同推出了RunUSD、ChatUSD和DeepSearch等API，将进一步降低开发者构建基于OpenUSD应用的门槛，让3D工作流程可以与AI等技术结合起来。

举个例子，全球最大的广告公司WPP为比亚迪的腾势N7制作的广告，就是在「元宇宙」拍的。

WPP把腾势N7的高精CAD数据上传到了Omniverse上，制作了一个数字孪生汽车，然后WPP的艺术家可以在Omniverse的环境里进行创作。

例如可以调用ChatUSDAPI，只需要输入一句话描述，就能让AI生成不同的背景环境，从而创作出用于全球营销活动的数千条个性化的内容片段。

元宇宙和生成式AI就像是天生一对的搭档，当两者相遇后，其价值将会被指数级放大，而OpenUSD技术让这一切变为了可能。

老黄认为，未来还会有越来越多的产业需要经历数字化转型，Omniverse和人工智能即将会成为这些企业们完成数字化转型时最重要的工作流。

而要搭建Omniverse和人工智能，自然离不开强大的算力支持，这便是英伟达真正的形态：

以GPU为骨、AI为肤，组成推动工业数字化转型最有力的手。

文章来源：爱范儿

本站文章来自网络收集整理和网友投稿，如需申请删除，请与站长联系（挑错）。

AI芯片

优惠网

黄仁勋研发超强AI芯片，挑战英伟达