BLOG

O que é o NVIDIA DGX Spark?

Última atualização:

  Esta página foi traduzida automaticamente por DeepL. Switch to English

O NVIDIA DGX Spark é um «supercomputador de IA» compacto para a sua secretária. Construído com base no superchip GB10 Grace Blackwell da NVIDIA, foi concebido para permitir que programadores e investigadores criem protótipos, ajustem e executem inferências em grandes modelos de IA localmente, sem precisarem de reservar tempo num cluster de data center. Oferece até 1 petaFLOP (FP4) de desempenho de IA e 128 GB de memória unificada num formato compacto, com a pilha de software de IA da NVIDIA pré-instalada.

O que há dentro?

  • GB10 Grace Blackwell Superchip (CPU Grace + GPU Blackwell num único pacote)
  • Memória de sistema unificada LPDDR5x de 128 GB (CPU e GPU partilham-na de forma coerente através de NVLinkC2C)
  • Rede NVIDIA ConnectX (10 GbE integrada; ConnectX7 SmartNIC)
  • Até 4 TB de armazenamento NVMe
  • Pequena pegada: aproximadamente 150 x 150 x 50,5 mm; cerca de 1,2 kg
  • DGX OS + pacote de software NVIDIA AI pronto a usar

O que o DGX Spark realmente pode fazer?

O DGX Spark foi criado para a fase «faça funcionar na minha secretária» da IA:

  • Prototipagem: crie e valide modelos e aplicações aumentadas por IA localmente e, em seguida, transfira-os para uma infraestrutura maior, se necessário.
  • Ajuste fino: ajuste modelos com até ~70 bilhões de parâmetros diretamente na caixa.
  • Conclusão: execute modelos de última geração com até ~200 bilhões de parâmetros para teste e validação. Conecte duas unidades DGX Spark via ConnectX para atingir ~405 bilhões de parâmetros.
  • Ciência de dados: acelere pipelines completos com o NVIDIA RAPIDS (e até mesmo impulsione o Apache Spark com o RAPIDS Accelerator).
  • Desenvolvimento de borda e robótica: experimente frameworks como Isaac, Metropolis e Holoscan em um sistema de mesa.
Screenshot 2025-10-14 061833

Em que o DGX Spark difere de um PC para jogos ou de uma estação de trabalho «normal»?

  • Memória unificada vs. VRAM separada: os 128 GB do DGX Spark são uma memória de sistema coerente partilhada entre a CPU e a GPU, tornando-a ideal para janelas de contexto grandes e movimentação eficiente de dados. Os PCs convencionais dividem a RAM e a VRAM da GPU.
  • Silício com prioridade para IA: os Tensor Cores de quinta geração e o suporte FP4 do GB10 foram projetados especificamente para LLMs e agentes de IA modernos. Esta não é uma máquina de frames por segundo.
  • Pacote incluído: o DGX OS e a plataforma de IA da NVIDIA vêm pré-instalados, por isso está muito mais perto de «abrir o portátil, executar o modelo» do que «instalar controladores, procurar contentores».

É a mesma «faísca» do Apache Spark?

Não, o DGX Spark é um sistema de hardware, enquanto o Apache Spark é uma estrutura de processamento de dados distribuída. A parte boa é que, se utilizar o Apache Spark, o acelerador RAPIDS da NVIDIA para Apache Spark pode transferir partes dos seus pipelines para a GPU, e o DGX Spark suporta essa pilha.

nvidia-project-digits-exploded-vew-ari-22

Quanto custa e quando posso adquirir um?

A página oficial do produto DGX Spark da NVIDIA concentra-se nas especificações e inscrições, enquanto a disponibilidade é feita através da NVIDIA e dos seus parceiros OEM. A NVIDIA anunciou que a Acer, ASUS, Dell, GIGABYTE, HP, Lenovo e MSI irão oferecer sistemas DGX Spark, com disponibilidade a partir de julho (o lançamento regional varia).

Quanto ao preço, os relatórios sugerem configurações a partir de cerca de US$ 3.999, embora os preços finais dependam do fabricante original e das opções de armazenamento. Algumas páginas de varejo ainda mostram "em breve", portanto, verifique as listas dos parceiros para obter os preços e o estoque atuais.

DGX Spark vs. DGX Station (o seu irmão mais velho)

Se o DGX Spark é a sua caixa de desenvolvimento para secretária, o DGX Station é o potente computador de mesa com IA. O DGX Station (GB300 Ultra) destina-se às tarefas mais exigentes de treino e ajuste fino, oferecendo até ~20 petaFLOPs (FP4) e centenas de gigabytes de memória unificada. É muito maior e foi concebido para equipas ou ambientes de laboratório partilhados.

nvidia-project-digits-exploded-vew-ari-22

Vale a pena?

Sim, se for um programador de IA, cientista de dados ou investigador que trabalha constantemente com LLMs, agentes ou modelos multimodais e precisa de respostas rápidas a nível local, tratamento de dados privados e uma pilha de software que se adapte perfeitamente ao centro de dados ou à nuvem.

Talvez não, se as suas necessidades se limitam à renderização por GPU ou jogos, ou se já tem acesso constante a tempo de cluster ou HPC. Nesse caso, uma estação de trabalho tradicional ou créditos na nuvem podem ser mais económicos.

Tabela rápida de especificações (em resumo)

  • Desempenho da IA: até 1 PFLOP (FP4)
  • Memória: 128 GB LPDDR5x unificada (273 GB/s)
  • Armazenamento: 1 TB ou 4 TB NVMe (auto-criptografado)
  • Rede: 10GbE, ConnectX-7 SmartNIC, Wi-Fi 7, Bluetooth 5.3
  • E/S: 4x USB-C, 1x HDMI 2.1a, NVENC/NVDEC (1/1)
  • Dimensões e peso: 150 x 150 x 50,5 mm; ~1,2 kg
  • SO: NVIDIA DGX OS