O NVIDIA DGX Spark é um «supercomputador de IA» compacto para a sua secretária. Construído com base no superchip GB10 Grace Blackwell da NVIDIA, foi concebido para permitir que programadores e investigadores criem protótipos, ajustem e executem inferências em grandes modelos de IA localmente, sem precisarem de reservar tempo num cluster de data center. Oferece até 1 petaFLOP (FP4) de desempenho de IA e 128 GB de memória unificada num formato compacto, com a pilha de software de IA da NVIDIA pré-instalada.
O DGX Spark foi criado para a fase «faça funcionar na minha secretária» da IA:
Não, o DGX Spark é um sistema de hardware, enquanto o Apache Spark é uma estrutura de processamento de dados distribuída. A parte boa é que, se utilizar o Apache Spark, o acelerador RAPIDS da NVIDIA para Apache Spark pode transferir partes dos seus pipelines para a GPU, e o DGX Spark suporta essa pilha.
A página oficial do produto DGX Spark da NVIDIA concentra-se nas especificações e inscrições, enquanto a disponibilidade é feita através da NVIDIA e dos seus parceiros OEM. A NVIDIA anunciou que a Acer, ASUS, Dell, GIGABYTE, HP, Lenovo e MSI irão oferecer sistemas DGX Spark, com disponibilidade a partir de julho (o lançamento regional varia).
Quanto ao preço, os relatórios sugerem configurações a partir de cerca de US$ 3.999, embora os preços finais dependam do fabricante original e das opções de armazenamento. Algumas páginas de varejo ainda mostram "em breve", portanto, verifique as listas dos parceiros para obter os preços e o estoque atuais.
Se o DGX Spark é a sua caixa de desenvolvimento para secretária, o DGX Station é o potente computador de mesa com IA. O DGX Station (GB300 Ultra) destina-se às tarefas mais exigentes de treino e ajuste fino, oferecendo até ~20 petaFLOPs (FP4) e centenas de gigabytes de memória unificada. É muito maior e foi concebido para equipas ou ambientes de laboratório partilhados.
Sim, se for um programador de IA, cientista de dados ou investigador que trabalha constantemente com LLMs, agentes ou modelos multimodais e precisa de respostas rápidas a nível local, tratamento de dados privados e uma pilha de software que se adapte perfeitamente ao centro de dados ou à nuvem.
Talvez não, se as suas necessidades se limitam à renderização por GPU ou jogos, ou se já tem acesso constante a tempo de cluster ou HPC. Nesse caso, uma estação de trabalho tradicional ou créditos na nuvem podem ser mais económicos.