NVIDIA DGX Spark er en lille "AI-supercomputer" til dit skrivebord. Den er bygget op omkring NVIDIAs GB10 Grace Blackwell Superchip og er designet til at give udviklere og forskere mulighed for at prototypeteste, finjustere og køre inferens på store AI-modeller lokalt uden at skulle reservere tid på et datacenter-cluster. Den tilbyder op til 1 petaFLOP (FP4) AI-ydeevne og 128 GB samlet hukommelse i en kompakt formfaktor med NVIDIAs AI-softwarestack forudinstalleret.
DGX Spark er udviklet til AI's "få det til at fungere på mit skrivebord"-fase:
Nej, DGX Spark er et hardwaresystem, mens Apache Spark er et distribueret databehandlingsframework. Det gode ved det er, at hvis du bruger Apache Spark, kan NVIDIAs RAPIDS Accelerator for Apache Spark overføre dele af dine pipelines til GPU'en, og DGX Spark understøtter denne stack.
NVIDIAs officielle produktside for DGX Spark fokuserer på specifikationer og tilmeldinger, mens tilgængeligheden varierer mellem NVIDIA og partner-OEM'er. NVIDIA har annonceret, at Acer, ASUS, Dell, GIGABYTE, HP, Lenovo og MSI vil tilbyde DGX Spark-systemer, som vil være tilgængelige fra juli (regional udrulning varierer).
Hvad angår priserne, tyder rapporter på, at konfigurationer starter ved omkring 3.999 dollars, men de endelige priser afhænger af OEM- og lagerindstillingerne. Nogle detailhandlende viser stadig "kommer snart", så tjek partneroversigterne for aktuelle priser og lagerbeholdning.
Hvis DGX Spark er din udviklingsboks ved skrivebordet, er DGX Station det kraftfulde desktop-AI-system. DGX Station (GB300 Ultra) er beregnet til de mest krævende trænings- og finjusteringsopgaver og leverer op til ~20 petaFLOPs (FP4) og hundredvis af gigabyte samlet hukommelse. Den er meget større og designet til teams eller delte laboratoriemiljøer.
Ja, hvis du er AI-udvikler, dataforsker eller forsker, der konstant arbejder med LLM'er, agenter eller multimodale modeller og har brug for hurtig lokal behandling, privat datahåndtering og en softwarestack, der kan mappes rent til datacentret eller skyen.
Måske ikke, hvis dine behov er begrænset til GPU-rendering eller gaming, eller hvis du allerede har stabil adgang til cluster- eller HPC-tid. I så fald kan en traditionel arbejdsstation eller cloud-kreditter være mere omkostningseffektive.