BLOG

Ce este NVIDIA DGX Spark?

Ultima actualizare:

  Această pagină a fost tradusă automat de DeepL. Switch to English

NVIDIA DGX Spark este un „supercomputer AI” de dimensiuni reduse pentru biroul dvs. Construit în jurul supercipului GB10 Grace Blackwell de la NVIDIA, este conceput pentru a permite dezvoltatorilor și cercetătorilor să creeze prototipuri, să ajusteze și să execute inferențe pe modele AI de mari dimensiuni la nivel local, fără a fi nevoie să rezerve timp pe un cluster de date. Oferă până la 1 petaFLOP (FP4) de performanță AI și 128 GB de memorie unificată într-un format compact, cu pachetul software AI de la NVIDIA preinstalat.

Ce conține?

  • GB10 Grace Blackwell Superchip (procesor Grace + procesor grafic Blackwell într-un singur pachet)
  • Memorie sistem unificată LPDDR5x de 128 GB (CPU și GPU o partajează în mod coerent prin NVLinkC2C)
  • Rețea NVIDIA ConnectX (10GbE integrată; ConnectX7 SmartNIC)
  • Până la 4 TB spațiu de stocare NVMe
  • Dimensiuni reduse: aproximativ 150 x 150 x 50,5 mm; aproximativ 1,2 kg
  • DGX OS + pachetul software NVIDIA AI gata de utilizare

Ce poate face DGX Spark de fapt?

DGX Spark este conceput pentru faza „fă-l să funcționeze pe biroul meu” a IA:

  • Prototipare: Construiți și validați modele și aplicații augmentate cu AI la nivel local, apoi transferați-le către o infrastructură mai mare, dacă este necesar.
  • Reglare fină: Modificați modelele cu până la ~70 miliarde de parametri direct pe dispozitiv.
  • Concluzie: Rulați modele de ultimă generație cu până la ~200 miliarde de parametri pentru testare și validare. Conectați două unități DGX Spark prin ConnectX pentru a ajunge la ~405 miliarde de parametri.
  • Știința datelor: Accelerați procesele end-to-end cu NVIDIA RAPIDS (și chiar îmbunătățiți Apache Spark cu RAPIDS Accelerator).
  • Dezvoltare Edge și robotică: Experimentați cu cadre precum Isaac, Metropolis și Holoscan pe un sistem de birou.
Screenshot 2025-10-14 061833

În ce se deosebește DGX Spark de un PC pentru jocuri sau de o stație de lucru „normală”?

  • Memorie unificată vs. VRAM separată: memoria de 128 GB a DGX Spark este o memorie de sistem coerentă, partajată între CPU și GPU, ceea ce o face ideală pentru ferestre de context mari și transfer eficient de date. PC-urile convenționale separă memoria RAM și memoria VRAM a GPU-ului.
  • AI-First Silicon: Nucleele Tensor de generația a cincea și suportul FP4 ale GB10 sunt proiectate special pentru LLM-urile moderne și agenții AI. Aceasta nu este o mașină care funcționează pe baza numărului de cadre pe secundă.
  • Stack inclus: DGX OS și platforma AI NVIDIA sunt preinstalate, astfel încât sunteți mult mai aproape de „deschideți notebook-ul, rulați modelul” decât de „instalați drivere, căutați containere”.

Este aceeași „scânteie” ca Apache Spark?

Nu, DGX Spark este un sistem hardware, în timp ce Apache Spark este un cadru distribuit de procesare a datelor. Avantajul este că, dacă utilizați Apache Spark, acceleratorul RAPIDS de la NVIDIA pentru Apache Spark poate descărca părți din pipeline-urile dvs. pe GPU, iar DGX Spark acceptă această stivă.

nvidia-project-digits-exploded-vew-ari-22

Cât costă și când pot să-l achiziționez?

Pagina oficială a produsului NVIDIA pentru DGX Spark se concentrează pe specificații și înscrieri, iar disponibilitatea este asigurată de NVIDIA și partenerii OEM. NVIDIA a anunțat că Acer, ASUS, Dell, GIGABYTE, HP, Lenovo și MSI vor oferi sisteme DGX Spark, disponibile începând din iulie (lansarea regională variază).

În ceea ce privește prețul, rapoartele sugerează configurații începând de la aproximativ 3.999 USD, deși prețurile finale depind de OEM și de opțiunile de stocare. Unele pagini de vânzare cu amănuntul încă afișează „în curând”, așa că verificați listele partenerilor pentru prețurile actuale și stocul disponibil.

DGX Spark vs. DGX Station (fratele său mai mare)

Dacă DGX Spark este cutia dvs. de dezvoltare pentru birou, DGX Station este motorul AI pentru desktop. DGX Station (GB300 Ultra) vizează cele mai exigente sarcini de instruire și reglare fină, oferind până la ~20 petaFLOPs (FP4) și sute de gigaocteți de memorie unificată. Este mult mai mare și conceput pentru echipe sau medii de laborator partajate.

nvidia-project-digits-exploded-vew-ari-22

Merită?

Da, dacă sunteți dezvoltator AI, specialist în date sau cercetător care lucrează constant cu LLM-uri, agenți sau modele multimodale și aveți nevoie de procesare locală rapidă, gestionare privată a datelor și un stack software care se integrează perfect cu centrul de date sau cloudul.

Poate că nu, dacă nevoile dvs. se limitează la redarea GPU sau jocuri, sau dacă aveți deja acces constant la cluster sau timp HPC. În acest caz, o stație de lucru tradițională sau credite cloud ar putea fi mai rentabile.

Tabel cu specificații rapide (pe scurt)

  • Performanță AI: până la 1 PFLOP (FP4)
  • Memorie: 128 GB LPDDR5x unificată (273 GB/s)
  • Stocare: 1 TB sau 4 TB NVMe (cu criptare automată)
  • Rețea: 10GbE, ConnectX-7 SmartNIC, Wi-Fi 7, BlueTooth 5.3
  • I/O: 4x USB-C, 1x HDMI 2.1a, NVENC/NVDEC (1/1)
  • Dimensiuni și greutate: 150 x 150 x 50,5 mm; ~1,2 kg
  • Sistem de operare: NVIDIA DGX OS