NVIDIA DGX Spark:AI 性能
NVIDIA DGX Spark 自2025年10月15日起上市,承诺在 FP4 精度下提供高达 1 PetaFLOP 的 AI 性能,价格为 3,999 美元。该个人 AI 计算机面向开发者、研究人员和学生,他们希望对 AI 模型进行本地原型设计、微调和执行。
简介
NVIDIA DGX Spark 是一款小型、低功耗的 AI 计算机,基于 Grace-Blackwell 超级芯片。它面向本地 AI 开发、推理和微调。该系统在 FP4 下提供高达 1 PetaFLOP 的 AI 性能,具有 128 GB 的一致、统一系统内存。本地可处理的模型参数规模约可达 2000 亿参数,具体取决于量化和稀疏性。DGX Spark 配备 4 TB NVMe 存储、一个 ConnectX-7 网络卡,以及尺寸为 150 × 150 × 50.5 mm 的外壳。DGX OS 操作系统基于 Ubuntu,并包含 CUDA 堆栈以及常用的 NVIDIA AI 库。
需要注意的是,这里的“Spark”并不指 Apache Spark,这一大数据引擎。为使用 Apache Spark 加速数据管道,NVIDIA 提供了 用于 Apache Spark 的 RAPIDS 加速器 ,这是一个插件,通常无需改动代码即可实现对 GPU 的加速。也 AWS EMR 支持该加速器,用于 Spark 工作负载 .
背景与发展
NVIDIA 于 2025 年 3 月在 GTC 框架内宣布 DGX Spark,并与更大的 DGX Station 一同推出。DGX Spark 之前被称为“Project DIGITS”。在 2025 年 10 月 15 日开始发售,价格为 3,999 美元 , 与原先设想的五月时间相比有所延迟。NVIDIA 将该设备定位为“ 全球最小的 AI 超级计算机 ” 面向桌面,提供高达 1 PetaFLOP 的 AI 性能(FP4)和 128 GB 统一存储。多家 OEM 合作伙伴推出了自己的变体。NVIDIA 自家商店在初上市时部分缺货,市场供应因地区而异。NVIDIA 市场列出技术参数、价格和配件 。首批来自市场与专业媒体的实测确认了 GB10 设计、20 核 Grace CPU、128 GB LPDDR5X 统一内存以及 ConnectX-7 连接。

Quelle: hothardware.com
Lieferumfang des NVIDIA DGX Spark 的随设备附带配件,便于立即投入运行。
分析与应用领域
NVIDIA 通过 DGX Spark 降低了对本地 AI 工作的门槛。原型设计、微调和测试无需云端 GPU 和数据中心开销,并可无缝迁移至 DGX Cloud 或其他加速基础设施。该设备加强了对 NVIDIA 软件生态系统(CUDA、cuDNN、Triton、NeMo)的绑定,使开发者直接进入 NVIDIA 堆栈。第三方目标是“边缘”和“物理 AI”,在这里紧凑、联网的计算节点具有优势。观察者预计在网络边缘和机器人场景中尤为相关。早期测试显示绝对速度并非在所有高端 GPU 中都第一,但大容量、统一内存使得在显存限制下,常见的消费级显卡无法承载的模型也能处理。
Quelle: YouTube
该视频 展示了首批出货情况,并从 NVIDIA 的视角勾勒出目标群体与应用场景 ,作为背景资料很有帮助。
事实与评估
有证据表明,DGX Spark 在 FP4 下提供高达 1 PetaFLOP 的 AI 性能,基于 GB10 Grace-Blackwell 超级芯片,具备 128 GB 统一内存。该设备价格为 3,999 美元,自 2025 年 10 月 15 日起开卖 . 两个 DGX Spark 可通过 ConnectX-7 连接,以处理大约 4050 亿参数的模型;NVIDIA 描述 官方指南中的连线和设置 .

Quelle: signal65.com
NVIDIA DGX Spark:桌面上的个人 AI 超级计算机。
尚不清楚在常规工作流中,与搭载大型桌面显卡的工作站相比,真实优势有多大。初步测试显示,对需要大量显存的模型有优势,但并非在标准基准测试中总是最快。关于在选定经销商之外的可用性也有混合报道;有些地区在初上市时设备很快售罄。
错误或具误导性的说法是,DGX Spark 是用来替代 Frontier 模型大规模前训练的单独解决方案。NVIDIA 明确将其定位为原型设计、微调和推理,并为最终训练提供通往云端或更大型数据中心的路径。声称它“仅仅”是一个营销用的小型电脑,忽略了其在一致、统一存储和 ConnectX-7 的扩展性这样的架构特征,这在消费级领域并不常见。

Quelle: thecekodok.com
一窥 DGX Spark 的内部,便可见其强大的硬件架构。
技术媒体强调权衡:巨大的存储容量与开发者导向,但并非在每个领域都对标顶级显卡的纯速度冠军。经销商方面,实测确认了规格与目标群体“开发/研究”。关于上市的报道提到价格较早期公告有所上涨并推迟至十月。分析预计将为边缘计算和物理 AI 场景带来推动力,而非大众市场 PC。
实际含义
如果你想在本地对大模型进行实验、微调和集成,DGX Spark 是一个有趣的选择——尤其是在 VRAM 限制让你当前的硬件变慢时。对于数据密集型管线(ETL/特征工程),可关注带有 RAPIDS 加速器的 Apache Spark 工作负载,在许多情况下无需改动代码即可将工作负载提升到 GPU——本地或云端。后续扩展时,可以把结果迁移到 DGX Cloud 或其他加速基础设施,NVIDIA 明确将其作为路径。
Quelle: YouTube
AWS re:Invent 的讲座 展示了如何通过 RAPIDS,在 GPU 上加速 Apache Spark 管道的实际做法 — 有助于将本地实验转化为生产数据路径。
尚有未解的问题:在 ARM64 下,NVIDIA 堆栈之外的软件生态系统会如何发展——例如驱动、工具链和小众库?在未来几个月里,这些硬件的稳定性和广泛可用性是否也会提高,亦不只限于个别经销商?在你们具体的工作流中,会产生哪些实际的效率提升——尤其是与使用大型桌面 GPU 的工作站相比?以及何时会推出更大的 DGX Station,并在桌面部署上提供比 DGX Spark 更完整的细节?
结论
DGX Spark 将严肃的 AI 开发带到了桌面的可及范围:大量统一内存、稳定的 AI 性能,以及通往更大基础设施的清晰路径。它不是万能神器,但为原型设计、微调和本地推理提供了一个聚焦工具。若要加速大数据工作流,应与 Apache Spark 及 RAPIDS 合理配合,并规划向可扩展环境过渡——无论是本地还是云端。