黄仁勋GTC 2026重磅发声:SaaS不消失,AI智能体重构企业服务新范式
北京时间2026年3月17日,英伟达CEO黄仁勋携全新AI技术体系亮相GTC 2026,这场持续两个多小时的演讲,没有局限于单一芯片发布,而是为数万亿美元AI基建时代勾勒出完整技术蓝图。其中被外界热议的“所有SaaS公司都将消失”,并非绝对化的消亡论断,而是黄仁勋对AI时代企业服务模式的核心判断:传统SaaS模式将全面向AaaS(Agentic as a Service)智能体服务模式转型,智能体将成为企业软件的全新核心。
这场演讲中,英伟达不仅揭晓了Feynman架构、Vera Rubin平台量产进展,更推出了面向企业级自主代理的开源平台NemoClaw,从硬件、软件、生态全维度,为智能体时代的到来搭建基础设施。黄仁勋用一系列技术突破和行业判断证明,英伟达早已从GPU硬件厂商,进化为AI全栈技术的“总包工头”,而这场技术变革,正深刻重构整个企业服务赛道。
CUDA 20年飞轮:AI时代的技术基石
演讲开篇,黄仁勋回溯了CUDA架构20年的演进,将其定义为英伟达一切业务的核心。这套以单指令多线程(SIMT)为核心的软件生态,历经20年积累,已在全球建立起数亿块运行CUDA的GPU和计算系统,形成了包含数千种工具、数十万个开源项目的庞大生态。
CUDA的飞轮效应成为英伟达持续领跑的关键:安装基数吸引全球开发者,开发者创造的新算法催生技术突破,全新市场又进一步扩大安装基数。而飞轮加速的直接结果,是算力成本的持续下降——六年前出货的Ampere架构在云上定价逆势上涨,正是因为英伟达持续的软件优化,让GPU拥有极长的有效生命周期,“一旦安装,终身受益”成为英伟达算力基础设施的核心优势。
数据处理革命:结构化与非结构化数据全面加速
AI时代的核心命题之一,是数据的高效利用。黄仁勋指出,企业计算长期建立在结构化数据之上,SQL、Spark等技术体系,Snowflake、Databricks等数据平台,均以数据框为核心,成为企业决策的“事实来源”。但在AI时代,不仅人类需要处理这些数据,AI智能体将直接访问结构化数据库,其处理速度要求数据基础设施实现数量级的性能提升。
与此同时,占全球年产生数据90%的非结构化数据,正借助AI多模态理解能力成为可计算资源。英伟达为此打造了两大核心软件库:cuDF加速结构化数据的数框计算,cuVS处理非结构化数据的向量存储与语义分析,如同当年RTX技术赋能3D图形计算,这两项技术正成为未来数据基础设施的核心,IBM等行业巨头已开始基于cuDF加速自身数据平台,标志着数据处理基础设施的AI化重塑。
推理拐点到来:AI原生企业催生万亿市场
黄仁勋判断,AI已经从“感知”“生成”进化到“推理”阶段,“推理拐点”的到来,让AI真正具备执行实际工作的能力,也催生了海量AI原生企业的爆发。2025年全球风投向AI初创公司投入达1500亿美元,创历史之最,核心原因在于所有AI原生企业都离不开海量算力和Token,而算力的核心需求,正从训练转向推理。
过去两年,AI计算需求增长约100万倍,推理成为AI系统最关键的商业环节——它直接决定AI服务的收入来源。英伟达凭借系统级的软硬件协同设计,实现了推理性能的跨越式提升:从Hopper H200到Grace Blackwell NVLink 72架构,每瓦特性能提升约35倍(实测接近50倍),仅通过软件栈更新,就能让部分AI推理平台的生成速度从700 token/秒提升至5000 token/秒,成为全球Token成本最低的AI基础设施。
基于此,黄仁勋给出了英伟达的万亿美金信心:2027年营收将至少达到1万亿美元。这一目标的背后,是英伟达覆盖全球的算力布局——全球三分之一的AI开源模型跑在英伟达芯片上,60%业务来自顶级云服务商,40%遍布区域云、主权云、企业服务器及工业自动化,成为唯一能运行AI所有领域的平台。
Vera Rubin量产:为智能体AI打造全栈超级平台
本次演讲的一大高潮,是英伟达Vera Rubin超级AI平台的全面投产。这一由七款芯片组成的平台,涵盖计算、网络、存储三大功能,拥有40个机架、60 exaflops运算能力、10 PB/s总扩展带宽,是目前最先进的POD规模AI平台,已获得Anthropic、OpenAI、Meta及所有主流云厂商的支持。
Vera Rubin是英伟达全栈垂直整合的集大成者:硬件层面推出首款采用LPDDR5内存的Vera CPU,单独销售有望成为数十亿美元级业务;系统设计采用100%液冷架构,45°C热水散热大幅降低制冷成本,安装时间从两天缩短至两小时;网络层面部署第六代NVLink互连、全球首个CPO光电共封装交换机,实现GPU高速扩展与网络带宽、能效的双重提升。
专为Agentic AI(智能体AI)设计的Vera Rubin,解决了大模型大尺度、长上下文带来的算力、内存、带宽需求,让数据中心从传统服务器集群,真正向AI超级计算机演进,成为智能体时代的核心计算基础设施。
从SaaS到AaaS:智能体重构企业软件核心
被外界误读的“SaaS消失”,核心是黄仁勋对企业软件未来的判断:随着OpenClaw等智能体操作系统的爆发,传统工具型SaaS将全面转向以智能体为核心的AaaS模式。
黄仁勋高度评价开源项目OpenClaw,其增长速度超越Linux,成为智能体计算机的操作系统——它能连接大语言模型、管理计算资源、调度复杂任务,将单一问题拆解为多步骤并调用子智能体协同完成,还支持文本、语音、手势等多模态交互,如同Linux赋能PC、Kubernetes赋能云计算,OpenClaw为智能体时代搭建了关键软件栈。
传统SaaS的核心是为人类员工提供工具和工作流,而AaaS的核心是智能体自主完成企业业务流程:从深圳出现的OpenClaw酿酒设备全流程自动化,到英伟达内部工程师用AI代理辅助编程,智能体已经能直接访问企业数据、执行代码、完成端到端的自动化任务。这意味着,未来所有企业都需要制定“OpenClaw战略”,企业软件的价值不再是工具提供,而是智能体的能力交付。
为解决智能体的企业级安全问题,英伟达联合OpenClaw作者推出NemoClaw参考架构,加入OpenShell安全组件,提供策略执行、网络防护、隐私路由能力,让企业能在合规、安全的前提下,部署智能体系统。
全生态布局:开放模型与物理AI开启产业新篇
在智能体软件体系之外,英伟达正全面推进开放模型生态,目前全球已有接近300万个开放AI模型,覆盖语言、视觉、生物、自动驾驶等领域。英伟达发布的Nemotron(语言)、Cosmos(世界模型)、Project GR00T(机器人)等开放模型产品线,持续迭代升级,并成立Nemotron联盟,联合Mistral AI、Perplexity AI等企业,推动开放模型在各领域的落地,助力各国和行业构建“主权AI”。
同时,黄仁勋宣布“物理AI与机器人时代”已至:全球几乎所有机器人公司都与英伟达合作,现场展示超100台机器人,Isaac Lab仿真平台、GR00T机器人基础模型为机器人开发提供全栈技术;自动驾驶的ChatGPT时刻到来,比亚迪、现代、吉利、日产等车企成为新的Robotaxi合作伙伴,年合计产能达1800万辆,英伟达还将与Uber合作部署自动驾驶出租车网络;工业领域与ABB、KUKA等合作,实现生产线智能体自动化,未来通信基站甚至将演变为“机器人AI基站”,动态调控交通与网络。
写在最后:AI基建时代,重构才是核心
黄仁勋在演讲结尾总结,AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命、物理AI与机器人时代。这场变革中,没有真正消亡的行业,只有被重构的模式——SaaS并非消失,而是以AaaS的全新形态,融入智能体时代的企业服务体系;算力并非单纯的硬件竞争,而是软硬件协同的全栈比拼;数据并非冰冷的存储,而是被AI激活的核心生产资料。
英伟达的这场演讲,不仅是自身技术布局的展示,更是对AI基建时代的全面预告:当计算、存储、网络深度耦合,当智能体成为企业核心生产力,当Token成为新的数字商品,整个科技产业的底层逻辑,正在被彻底重构。而对于所有企业而言,跟上这场变革的核心,不是恐惧“消失”,而是拥抱“进化”。