2025-01-08 黄仁勋首次回应5090显卡售价昂贵
现场报道 | CES炸场之后,黄仁勋眼中AI和英伟达的未来。
作者 |
陈骏达
编辑 |
心缘
芯东西拉斯维加斯1月7日报道,今天,在备受关注的CES开幕演讲后,英伟达创始人兼CEO黄仁勋在当地接受了智东西等全球媒体近1个小时的深度采访,采访中,他 点名表扬中国车企,回应RTX 5090的超高定价,承认AI PC人才不足、需求尚未爆发,提出三大Scaling Law将共存的观点
老黄今天还换下了昨天那件“开了光追”的皮衣,他称那件皮衣对今天的场合来说可能有点太过了。
▲黄仁勋在采访现场展示最小超算Digits(图源:智东西)
黄仁勋称, 理想、小鹏、小米、蔚来、比亚迪等企业对智能驾驶趋势的影响可能比特斯拉的还大。
谈到贸易战,他相信政府将做出明确的决定,无论结果如何,英伟达都将尽力帮助客户和市场。
英伟达本次发布的RTX 5090旗舰产品与次旗舰在价格、性能上有显著差异,黄仁勋称这一选择是是为了 满足极致发烧友的需求
近期,Scaling Law终结和变化的讨论依旧持续,黄仁勋认为未来一段时间里, 三大Scaling Law将会共存,即算力的提升、测试时计算和推理过程中的数据反哺 没有看到AI发展的物理瓶颈。
尽管英伟达市值已站稳3万亿美元大关,但黄仁勋展现出极为克制、精简、专注的发展策略。英伟达不会涉足电力等算力基建,近期没有新的收购计划,不过多涉足计算层和库层,也不打算直接服务企业, 将集中精力去做那些只有英伟达才能做成的产品
AI PC领域发布不断,但销量还未完全起飞。黄仁勋认为设计师、开发者等群体的 AI PC需求真实存在
物理AI是老黄眼中的重要趋势之一,它将帮助AI理解世界,//www.czybx.com但我们至今仍然缺少一个物理世界的基础模型,英伟达希望通过Cosmos催生 GPT-3级别的物理模型
Agent是AWS、微软等企业押注的重点,英伟达也推出了面向企业的agent蓝图,但老黄称英伟达不会与这些企业直接竞争,主要是为企业agent开发提供基础和帮助。
以下是对黄仁勋本次采访的完整编译(为提高可读性,芯东西gOdajDsoxv在不违背原意的前提下进行了一定的增删修改):
01 .
黄仁勋:英伟达目前仍是小公司
暂无新收购计划
1、记者:首先恭喜你们。这是很棒的一年。你们仍然领先业界至少两年。去年你们为计算机定义了新的一年,也就是数据中心。我完全同意。你必须从建设工作开始,再往后发展。现在你们已经完成了整个系统的工作,包括GB200 NVL72。是不是该让英伟达开始考虑基础设施、电力和系统中的其他部分了?
黄仁勋:
我们虽然有32000人,还仍然是相对较小的公司, 我们仍然是一家小公司
2、记者:去年在GTC大会上,你分享了你们在以色列增加投资和活动的情况。加强了你们作为该国最大雇主之一的地位。你们在2024年继续扩张,收购了两家以色列公司。你们打算如何进一步增加在以色列的投资?具体来说,我们很快会听到一个正在进行中的新交易吗?
黄仁勋:
即使在当前局势紧张的情况下,我们的以色列团队依然展现出卓越的表现。他们始终保持专注,交出了令人惊叹的成绩单。仅在过去七周内,团队就成功开发出了Spectrum X和Bluefield 3等重要产品。我为他们的专业能力和敬业精神深感自豪。
关于新的收购计划,今天暂时没有要宣布的消息。
02 .
AI PC需求确实存在
将实现云端级AI能力
3、记者:你们昨晚发布了很多关于AI PC的消息。这些产品的销量今年还没有真正起飞。你认为英伟达能帮助改变这种状况,推动这些产品的采用吗?是什么阻碍了它们的发展?
黄仁勋:
我们认为,仍然有设计师、软件工程师、创意人员和爱好者喜欢使用PC来开发这些东西。当然,其中一个挑战是,由于AI在云端,而且云端投入了大量精力和工程开发,开发AI PC的人很少。
不过,我们也注意到有大量的设计师、软件工程师、创意人员和技术爱好者,他们更倾向于在PC上进行AI开发工作。其中一个挑战在于,由于AI生态系统主要集中在云端,加上云服务提供商投入了大量资源进行开发,导致端侧AI开发的人才相对较少。
但令人欣喜的是,Windows PC完全有能力支持AI开发。特别是通过WSL2(Windows Subsystem for Linux 2)这个强大的虚拟化平台,我们可以将原本为云端打造的AI技术引入到PC中。我们正在努力确保PC硬件和WSL2平台能够完美支持这些技术。
我坚信这是未来的正确方向。我个人对此充满热情,所有PC制造商也都表现出极大的兴趣。我们正在与合作伙伴一起,让所有PC都具备运行AI的能力,包括优化Windows系统,这样我们就能把云端的AI生态系统完整地带到个人电脑上。
03 .
需要打造物理世界基础模型
Cosmos将帮助AI理解世界
4、记者:昨晚CES开幕演讲的某些部分感觉就像是在SIGGRAPH大会上,非常技术性。现在你们的受众更广了,我想请你解释一下这些内容的意义。
黄仁勋:
我们昨天宣布的一个最重要的突破是开发出了一个能够理解物理世界的基础模型。就像GPT是理解语言的基础模型,stable diffusion是理解图像的基础模型, 我们现在创造了一个能够理解物理世界的基础模型
它能够理解摩擦、惯性、重力、物体的存在和持续性,以及几何和空间关系等概念。这些其实都是儿童与生俱来就能理解的东西,儿童对物理世界的理解方式是目前的语言模型所无法企及的。
我们坚信一个能理解物理世界的基础模型是必不可少的。现在有了这个模型,所有你能用GPT和stable diffusion完成的任务,都可以用Cosmos来实现。比如说,你可以与它进行对话。
你可以跟这个世界模型交谈,询问它当前环境中的情况。基于它通过摄像头获取的信息,它能理解并描述"有很多人围坐在桌前,他们在一个房间里"这样的场景。
Cosmos本质上是一个理解现实世界的模型。那么为什么我们需要这样的模型呢?因为如果你希望AI能在现实世界中自然地运作和互动,它就必须具备这种理解能力。
应用场景在哪里?自动驾驶汽车需要理解物理世界,机器人需要理解物理世界。这个基础模型就是实现这些应用的关键起点。Cosmos会让机器人成为现实。
04 .
三大Scaling Law将共存
测试时计算将构成良性循环
5、记者:昨晚你提到,我们在见证一些新的Scaling Law的出现,特别是测试时计算(Test-time Compute)。我认为OpenAI的o3模型表明,从计算机的角度来看,扩展推理的成本非常高。英伟达在提供更具成本效益的AI推理芯片方面做了什么?从更广的角度来看,你们如何从测试时计算的扩展中获益?
黄仁勋:
所以改进的最佳方式,也是摩尔定律在计算历史上如此重要的原因,就是它降低了计算成本。我之所以提到我们的GPU性能在过去10年增长了1000到10000倍,是因为这反过来说明成本降低了1000到10000倍。在过去20年里,我们将计算的边际成本降低了100万倍。这使得机器学习变得如此合理。只需让计算机从这里到那里。
所以最好的改进方式就是降低计算成本,这也是为什么摩尔定律在计算发展史上如此重要。我提到过去10年我们的GPU性能提升了千倍到万倍,这同时也意味着成本以相同的幅度下降了。
在过去20年中,我们把计算的边际成本降低了百万倍。正是这种成本的大幅下降,让机器学习变得切实可行。未来我们会继续推动计算能力的提升,也将继续带来计算成本的降低。
从另一个角度来看这个问题。现在通过测试时计算的扩展来获得答案需要多次尝试。这些答案会被用作下一轮训练的数据。这些数据又会成为预训练数据。所有我们收集的数据都会被用于预训练和后训练的数据池中。通过不断改进超级计算机的性能并降低训练成本,我们最终可以让每个人使用AI推理的成本都变得更低。
这个过程需要一定时间。 这三个扩展定律会在未来持续发挥作用,并且相互影响。
05 .
DLSS 4是在“预测未来”
但渲染仍是重要基础
6、记者:关于DLSS4,你昨晚做了一些演示。我想请你详细讲解一下,比如多帧生成技术。它是否仍然是渲染两帧,然后在中间生成并进行插值?还有关于文本重压缩的内容,在你们的材料中,在视频里提到的。这是游戏开发商需要专门采用的技术吗?还是是驱动程序层面的功能,可以让所有游戏或至少大部分PC游戏受益?
黄仁勋:
如果着色器不能运行AI,就无法利用神经网络在算法上带来的进步,比如压缩技术。现在的纹理压缩效果比过去30年使用的算法要好得多。压缩比有了很大提升,对于很多纹理可以额外压缩5倍。考虑到现在游戏体积都很大,这是一个重要的进步。
第二点是关于材质。材质决定了光线在表面的传播方式,它的各向异性特性会让光线以特定方式反射,从而展现出金漆或纯金等不同效果。这种特性本质上是在原子层面发生的。用数学方法很难描述这个过程,但我们可以用AI来学习它。这种神经材质技术将是一个重大突破,能让计算机图形变得更加生动逼真。
关于DLSS,帧生成不是插值关系,而是字面意义上的预测。
7、记者:AI现在是不是在PC游戏中扮演了更决定性的作用,传统需要渲染的几何特征是不是都转向生成了?
黄仁勋:
游戏也是同样的道理。你需要提供上下文,不仅要考虑剧情,还要考虑空间关系。通过提供初始的几何形状或纹理作为条件,系统才能生成新内容或提升分辨率。这种方式和ChatGPT使用上下文是一样的。在企业应用中,我们称之为梯度检索增强生成。未来的3D图形将建立在这种3D条件生成的基础上。
以DLSS 4为例。4帧画面总共有3300万像素,但我们只渲染了其中的200万。神奇的是,我们用这200万像素生成了另外3100万像素。 关键在于这200万像素必须精确定位。
这种变革将影响游戏的方方面面,从像素到几何形状和动画。这个过程花了六年时间。当初宣布DLSS时很多人都不相信,部分原因是我没有解释清楚。但现在大家都认识到生成式AI就是未来。关键是要有条件设置,要有艺术家的创意指导。
Omniverse和Cosmos的关系也是如此。Omniverse作为Cosmos的3D引擎,本质上是一个生成引擎。我们可以精确控制渲染的程度,减少直接渲染来生成更多内容。当减少控制和模拟时,我们就能模拟更大的世界。因为在背后,我们有一个强大的生成引擎在创造真实世界。
06 .
5090面向极致发烧友
5070 12GB显存与算力达成平衡
8、记者:我有一个关于游戏玩家和消费者的问题。我们注意到RTX 5090和5080之间存在巨大差距。5090的CUDA核心数量是5080的两倍多,价格也翻了一番。为什么你们要在旗舰产品和次旗舰产品之间做出如此大的差异?
黄仁勋:
当然,2000美元确实不是小数目,这确实是一个相当高的价值。但要记住,这项技术将用于你的家庭影院级别的PC环境。而那台PC,你已经在显示器和音响上投资了约1万美元,你肯定会想要最好的GPU。所以我们很多客户,他们就是追求绝对最好的。
9、记者:我是来自韩国的记者。作为一名游戏玩家,我感到非常兴奋。因为当您谈到内存时,特别提到了HBM,为什么没有选择三星的?
黄仁勋:
这没什么特别的原因。如您所知,SK和三星是两家最大的制造商。我不太确切知道具体情况,可能也不是什么重要的事情需要记录。他们正在努力。是的,他们正在努力,一定会成功的。我对三星能够成功开发HBM充满信心。
我对三星的成功充满信心。要知道,三星最早创造了HBM。英伟达使用的第一批HBM内存就来自三星。他们会重新崛起的,他们是一家伟大的公司。韩国人非常有雄心壮志,这是好事。虽然他们需要重新设计,但我相信他们一定能做到。他们正在快速推进,对此非常投入。SK和三星都是优秀的公司,尤其在内存领域。所以我相信他们会继续取得成功。你们昨天也看到了我们产品中使用了多少HBM内存,HBM内存对我们来说非常重要。
10、记者:我的问题是,为什么5070仍然只使用12GB显存?现在很多游戏都需要更大的显存,特别是在目标分辨率下。
黄仁勋:
11、记者:看到昨晚的5070的性能和4090差不多,价格还降了那么多,很让人兴奋。你对60系列有什么期待吗?
黄仁勋:
12、记者:英伟达的Blackwell架构在统一性方面有什么优势?这种统一架构对开发者和最终用户带来了哪些好处?
黄仁勋:
选择统一架构的核心原因是为了给软件开发者提供一个无缝的开发平台。开发者只需要开发一次,就能确保他们的程序可以在任何搭载英伟达芯片的平台上运行。就像我昨天提到的,我们可以在云端开发AI模型,然后轻松地将其部署到个人电脑上运行。这种能力是独一无二的。
具体来说,云端的AI容器可以直接下载到PC上运行。比如SD-XL、Flux、Llama等模型,只需要从云端下载并部署到PC就能立即使用,这种便利性将在未来得到更广泛的应用。
07 .
英伟白熊资讯网达不直接服务企业
不过多涉足计算层和库层
13、记者:虽然超大规模客户对你们产品的需求已经很明显,但我想了解你们在扩大收入来源方面的紧迫感。特别是在开拓新的企业客户和政府数据中心市场,以及在超大规模计算领域,尤其是在亚马逊等公司开发自己的AI芯片的情况下。你们感受到多大压力?能否详细介绍一下你们在企业和政府客户方面的进展?
黄仁勋:
关于企业市场,现在主要有两大服务行业。我们的策略是与这两个领域合作,帮助他们打造解决方案。NeMo、NIMs和Blueprints都是开发Agentic AI的工具包。比如我们与ServiceNow的合作就很成功,他们即将推出一系列基于这些技术的agent服务。这就是我们的基本策略。我们也会与埃森哲等解决方案提供商合作。埃森哲在帮助客户采用这些系统方面做得很好。所以第一步就是提供帮助。
14、记者:许多公司都在开发Agentic AI,你们要如何与AWS、微软和ServiceNow这样的企业竞争或是合作呢?
黄仁勋:英伟达并不是一家直接服务企业的公司,而是一家技术平台公司。
虽然我们在专业领域有很强的优势,但我们不想过多涉足AI的计算层和库层。我们的任务是为这些公司开发工具。这个工作很有挑战性,因为我们实际在做的事情就是得把ChatGPT整合到容器中。优化这些端点和微服务非常复杂。不过一旦完成,客户就可以在任何云平台上使用我们的产品。
这就是为什么我们开发了NIMs和NeMo。我们的目的不是与客户竞争,而是帮助他们。如果云服务提供商想使用这些技术,我们也会全力支持。事实上,已经有很多云服务提供商在用NeMo训练他们的逻辑模型,他们的应用商店里也有NIMS。
这些技术都是我们后来开发的。NIMs和NeMo的作用,就像CUDA和CUDAx库一样重要。CUDAx库对推广NVIDIA平台起到了关键作用。我们为行业开发这些库,就是为了让企业不必从零开始开发。
08 .
Digits主要面向数据科学家
小模型有望登上AI眼镜
15、记者:你们昨天发布了Digits,你认为当前非游戏PC市场最大的未满足需求是什么?
黄仁勋:
我们最近推出了一款小型设备。它体积小巧,可以放在桌面上,支持无线连接。使用起来就像在操作云服务一样方便,相当于一个私人AI云。为什么要开发这样的设备?因为开发者需要频繁使用计算资源。
如果完全依赖云服务,成本会很高。现在有了这个设备,相当于拥有了一个私人开发云。这对那些需要持续进行开发的数据科学家、学生和工程师来说非常有价值。
Digits的发展前景非常广阔。虽然AI起源于云端,未来可能仍然以云为主,但目前的计算设备已经跟不上AI发展的步伐。这就是为什么我们要开发新的解决方案。
说到超级智能,这其实并不是什么新鲜事。在我们公司,每个领域都有非常优秀的专家。我身边都是这样的人才,我很庆幸能和他们一起工作。我自己只是普通人,但我的管理团队、领导者和科学家们都是各自领域的佼佼者。
这就是我们即将迎来的未来。你会有各种A白熊资讯网I助手帮你完成工作,比如写作、分析问题、规划供应链、编程、设计芯片等。它们还能帮你做营销活动和制作播客。这些AI助手随时待命,为你提供帮助。当然,这项技术的应用非常广泛。但要记住,是人在使用工具,机器终究是工具。
16、记者:我想问问昨天发布的新模型产品,特别是小型的模型。这些模型能在智能眼镜上运行吗?在开发时你们有考虑过智能眼镜吗?因为按照你们的发展方向,智能眼镜似乎会成为人们体验AI助手的重要平台。
黄仁勋:
这是可行的,因为小型AI模型虽然通用性较差,但在特定领域非常专注。这就是为什么可以进行定向的知识迁移。我们总是先建立基础模型,然后逐步提炼出更小的模型。
09 .
中国车企对智驾趋势影响更大
5年前还没有明确把握
17、记者:我想问一个关于自动驾驶汽车的问题。2017年英伟达在CES上展示了一辆演示车,并在5月GTC与丰田合作。从2017年到2025年,这项技术有了哪些变化?当时存在什么问题,现在又有什么技术突破?
黄仁勋:
5年前,我们对这项技术的稳定性(Robustness)还没有把握,但现在已经非常确定了。传感器、计算机和软件技术都已经相当成熟。有充分证据表明,新一代汽车,尤其是电动汽车,几乎都会配备自动驾驶功能。
我认为有两家公司推动了这个变革,让传统车企改变了想法。一个是特斯拉,影响很大,但更大的影响可能来自中国令人惊叹的技术进步。 中国新兴电动车企的技术非常出色,比亚迪、理想、小鹏、小米、蔚来等等。
技术的成熟和我们对它的认知都需要时间,但现在形势非常好。Waymo是我们重要的合作伙伴,他们在旧金山的表现非常出色。
10 .
物理AI成缺失关键因素
需打造GPT-3级别物理模型
18、记者:你们昨天发布产品是个好的开始,但神经渲染面临的一大挑战是DirectX中的各种窗口。你们需要做什么来减少引擎运行的阻力?你们是怎么和微软合作的?
黄仁勋:
特别是从DLSS 2/3/4开始,一旦完成集成,即使游戏是为3开发的,也能享受到4带来的部分改进。所以我们必须为基于场景语义的AI处理搭建管道。这确实是必须要做的事。
19、记者:重大的技术变革从来不是一家公司能完成的。比如互联网、个人电脑,还有最近的绿色技术。但这些技术最终都会在某个时刻汇聚,带来巨大的转变。说到AI,你觉得现在还有什么缺失的部分会阻碍我们的发展,还是说一切都已经准备就绪了?我知道AI比较复杂,应用方式也很多,但我想知道你认为还有什么不足的地方。
黄仁勋:
这几年,业界不仅在改进基础AI,也在探索AI的应用。但我们还缺少一个关键要素,那就是物理AI。物理AI需要像认知AI那样有基础模型。就像GPT-3是第一个达到实用水平的语言基础模型,让我们能在上面开发各种功能。
所以我们必须让物理AI也达到这样的水平。这就是我们在开发Cosmos的原因。一旦达到这个水平,把模型推向市场,就能激活大量应用场景。有了基础模型,下游任务就能顺利开展。这个基础模型也可以作为教师模型,就像我们之前说的。这对Cosmos来说很重要。
第二个缺失的部分是我们正在用Omniverse解决的问题——把Omniverse和Cosmos结合成一个物理系统。以物理学基础,这样我们就能用这个基础来控制生成过程,让Cosmos生成的内容更可靠,而不只是看起来逼真。Cosmos加上Omniverse很可能成为一个重要的突破点。
11 .
AI发展没有物理限制
贸易战背景下将尽力满足需求
20、记者:关于贸易战,现在仍然还比较活跃。你担心这会影响大家的盈利前景吗?
黄仁勋: 无论结果如何,都尽力帮助客户和市场。
21、记者:英伟达是如何考虑市场策略的?AI发展的下一步需要什么?是否存在物理限制?
黄仁勋:
我们不会为了抢占份额而进入一个已有的市场,这不是我们的风格。我们更愿意开拓全新的市场。比如说,市场上没有Digits这样的产品。如果我们不开发它,可能永远都不会有人开发,因为软件系统太复杂了。同样,如果我们不开发高级神经图形学,也不会有其他人去做。这些都是我们必须承担的使命。
说到需求,我们当然需要更好的传感器和摄像头来解决问题。未来几年,随着更先进摄像头的普及,特别是智能摄像头和智能眼镜的出现,我们将收集到海量的视频数据,这让我非常期待。
22、记者:我来自以色列。在过去几年里,AI特别是生成式AI在经济上有了很大发展。我想请教您,那些参与这个浪潮的公司,它们现在的发展速度是否可持续?短期内能否维持这样的发展势头?
黄仁勋:
第二点,由于我们能够优化整个系统,实际性能提升远超单纯的晶体管性能提升。虽然摩尔定律已经放缓,晶体管性能的代际提升不大,但我们的系统整体性能仍在逐年大幅提升。所以我认为目前没有明显的物理瓶颈。
随着计算能力的提升,几个重要的扩展定律将继续发挥作用:首先,研究人员可以用更大的模型训练更多数据;其次,强化学习和合成数据生成能力会不断提升。
第三,随着成本持续下降,应用范围会进一步扩大。只要没有物理上的根本限制,AI就会持续快速发展。
12 .
与联发科合作很满意
未来可能会扩大台湾公司规模
23、记者:我来自中国台湾。主题演讲提到Digits AI超算CPU正在与联发科合作。您能谈谈与联发科和台积电等台湾企业的合作吗?英伟达还会在台湾建设总部吗?
黄仁勋:
关于联发科,我们在多个领域都有合作。比如在自动驾驶汽车领域,我们一起为行业提供完全软件定义的智能汽车解决方案。
我们在汽车领域的合作非常顺利。此外,新的Grace GB10 CPU也是与联发科合作开发的。我们共同设计架构,实现了芯片间的互联以及CPU和GPU的内存一致性。
联发科在设计和制造方面都做得很出色。第一次就做出了完美的芯片,性能优异。大家都知道联发科在低功耗方面的优势,确实名不虚传。我们很高兴能与这样优秀的公司合作。
13 .
计算机图形进入指数增长期
未来所有行业都将经历如此变革
24、记者:我来自印尼,想请教您对学生学习方向的建议。
黄仁勋:
未来在生物学、林业、农业、化学、量子物理等各个领域,都需要思考如何借助AI开展工作。在计算机科学领域,则是研究如何用AI推进AI本身的发展。供应链管理、运筹学等领域也是如此。
如果想当记者,就要思考如何用AI提升报道质量;想当作家,就要思考如何用AI提升写作水平。未来每个学生都必须学会使用AI,就像现在的学生都必须会用电脑一样。
这就是根本区别,也体现了AI革命的深远影响。这不仅仅关乎大语言模型,AI将融入未来的方方面面。这是最具变革性的技术,发展速度惊人。
感谢大家的关注。对于游戏行业和玩家们,很高兴看到行业从最初用GPU推进AI,发展到现在用AI推进图形技术。
我们在RTX Blackwell、DLSS 4、神经渲染、神经着色等方面的工作,都得益于AI的进步,现在又反过来推动图形技术发展。值得注意的是,计算机图形学原本增长放缓,但AI的加入带来了超级加速。现在可以实现每秒200-400帧的完全光追画面。
我们进入了计算机图形的指数增长期,几乎每个领域都是如此。这就是为什么我认为不仅是我们行业,很快所有行业都会经历快速变革。
感谢大家,新年快乐!
内容版权声明:除非注明原创否则皆为转载,再次转载请注明出处。