NVIDIA DGX Spark este un „supercomputer AI” de dimensiuni reduse pentru biroul dvs. Construit în jurul supercipului GB10 Grace Blackwell de la NVIDIA, este conceput pentru a permite dezvoltatorilor și cercetătorilor să creeze prototipuri, să ajusteze și să execute inferențe pe modele AI de mari dimensiuni la nivel local, fără a fi nevoie să rezerve timp pe un cluster de date. Oferă până la 1 petaFLOP (FP4) de performanță AI și 128 GB de memorie unificată într-un format compact, cu pachetul software AI de la NVIDIA preinstalat.
DGX Spark este conceput pentru faza „fă-l să funcționeze pe biroul meu” a IA:
Nu, DGX Spark este un sistem hardware, în timp ce Apache Spark este un cadru distribuit de procesare a datelor. Avantajul este că, dacă utilizați Apache Spark, acceleratorul RAPIDS de la NVIDIA pentru Apache Spark poate descărca părți din pipeline-urile dvs. pe GPU, iar DGX Spark acceptă această stivă.
Pagina oficială a produsului NVIDIA pentru DGX Spark se concentrează pe specificații și înscrieri, iar disponibilitatea este asigurată de NVIDIA și partenerii OEM. NVIDIA a anunțat că Acer, ASUS, Dell, GIGABYTE, HP, Lenovo și MSI vor oferi sisteme DGX Spark, disponibile începând din iulie (lansarea regională variază).
În ceea ce privește prețul, rapoartele sugerează configurații începând de la aproximativ 3.999 USD, deși prețurile finale depind de OEM și de opțiunile de stocare. Unele pagini de vânzare cu amănuntul încă afișează „în curând”, așa că verificați listele partenerilor pentru prețurile actuale și stocul disponibil.
Dacă DGX Spark este cutia dvs. de dezvoltare pentru birou, DGX Station este motorul AI pentru desktop. DGX Station (GB300 Ultra) vizează cele mai exigente sarcini de instruire și reglare fină, oferind până la ~20 petaFLOPs (FP4) și sute de gigaocteți de memorie unificată. Este mult mai mare și conceput pentru echipe sau medii de laborator partajate.
Da, dacă sunteți dezvoltator AI, specialist în date sau cercetător care lucrează constant cu LLM-uri, agenți sau modele multimodale și aveți nevoie de procesare locală rapidă, gestionare privată a datelor și un stack software care se integrează perfect cu centrul de date sau cloudul.
Poate că nu, dacă nevoile dvs. se limitează la redarea GPU sau jocuri, sau dacă aveți deja acces constant la cluster sau timp HPC. În acest caz, o stație de lucru tradițională sau credite cloud ar putea fi mai rentabile.