英伟达(NVDA.O)在中国台北举行的NVIDIA GTC Taipei大会上发布NVIDIA DSX平台,将业务布局进一步延伸至AI工厂基础设施领域。
与过去以GPU销售为核心不同,DSX试图为企业提供从设计、仿真、部署到运营管理的完整AI工厂解决方案。
随着AI模型规模不断扩大,数据中心面临的挑战已不仅是芯片性能,更涉及电力供应、散热能力、资源调度以及整体运营效率。英伟达认为,未来AI行业竞争的关键指标将逐步从单颗芯片性能转向整体基础设施效率,即如何在有限的电力、空间和资源条件下生产更多算力和智能服务。
为此,DSX平台整合了英伟达的芯片、系统、软件、参考架构以及合作伙伴技术,覆盖AI工厂建设和运营的全生命周期。平台通过统一计算、软件和设施等技术栈,帮助客户提升部署速度、可靠性和运营效率,并降低AI推理过程中生成Token的成本。
黄仁勋表示:
“我们不仅是在交付芯片——我们是在向每一位基础设施建设者提供打造AI工厂的完整方法体系。借助DSX平台,你可以在一分钱不花的情况下模拟整个工厂,在安装第一台机架之前验证性能,并以生产级AI所需的可靠性进行运营。”
此次发布的软件体系主要包括DSX MaxLPS和DSX OS。
其中,DSX MaxLPS利用45摄氏度液冷与机架级功耗优化技术,提高每兆瓦电力对应的Token产出。英伟达表示,该技术可在对性能影响极小的情况下额外部署最多40%的GPU,从而在固定电力预算下进一步降低计算成本。
DSX OS则是一套面向AI工厂运营的开源软件平台,支持生命周期管理、智能调度、健康自动化、多租户运营以及平台服务等功能。英伟达还将开源模块化软件库、API、参考设计和加速计算平台,构建统一的软件架构。
除核心软件外,DSX还整合了多项现有能力。DSX Reference Design提供覆盖计算、网络、存储、供电和制冷系统的参考架构;DSX Sim支持从规划到运营全过程的数字孪生仿真与优化;DSX Flex可根据电网负荷和电价变化动态调整工作负载;DSX Exchange则实现计算、网络、能源和制冷系统之间的数据协同。
在商业落地方面,CoreWeave、Crusoe、IREN和Lambda等云服务商已部署DSX核心组件,以提升GPU利用率并缩短AI云服务上线时间。
硬件生态也在同步扩展。戴尔科技(DELL.N)、慧与科技(HPE.N)、联想集团(0992.HK)、超微电脑(SMCI.O)、华硕、富士康、技嘉、和硕以及广达云科技等厂商正开发NVIDIA DSX就绪系统,帮助客户建设全栈AI工厂。
与此同时,DSX Flex已与Emerald AI及Silicon Valley Power开展商业化试点项目,验证AI工厂根据电网需求动态调节功耗的能力。
从战略层面看,DSX标志着英伟达继续从AI芯片供应商向AI基础设施平台提供商转型。通过将芯片、软件、数据中心架构、运营管理和能源调度纳入统一体系,英伟达希望建立覆盖AI工厂全生命周期的行业标准,并进一步巩固其在全球AI基础设施市场的领先地位。