Nova classe de supercomputador de IA conecta 256 superchips Grace Hopper em GPU massiva, 1-Exaflop e 144 TB para modelos gigantes que alimentam IA generativa, sistemas de recomendação e processamento de dados
TAIPEI, Taiwan – COMPUTEX – 29 de maio de 2023 – A NVIDIA anuncia uma nova classe de supercomputadores de IA com grande capacidade de memória — um supercomputador NVIDIA DGX™ com tecnologia NVIDIA® GH200 Grace Hopper Superchips e o NVIDIA NVLink® Switch System — criado para permitir o desenvolvimento de modelos gigantes de última geração para aplicações de linguagem generativas de IA, sistemas de recomendação e cargas de trabalho de análise de dados.
O enorme espaço de memória compartilhada da NVIDIA DGX GH200 utiliza a tecnologia de interconexão NVLink com o NVLink Switch System para combinar 256 superchips GH200, permitindo que funcionem como uma única GPU. Isso fornece 1 exaflop de desempenho e 144 terabytes de memória compartilhada — quase 500x mais memória do que a geração anterior NVIDIA DGX A100, lançada em 2020.
“IA generativa, grandes modelos de linguagem (LLMs) e sistemas de recomendação são os motores digitais da economia moderna”, diz Jensen Huang, fundador e CEO da NVIDIA. “Os supercomputadores de IA DGX GH200 integram as tecnologias de computação e rede aceleradas mais avançadas da NVIDIA para expandir a fronteira da IA.”
A tecnologia NVIDIA NVLink expande a IA em escala
Os superchips GH200 eliminam a necessidade de uma conexão tradicional de CPU para GPU PCIe combinando uma CPU NVIDIA Grace™ baseada em Arm com uma GPU NVIDIA H100 Tensor Core no mesmo pacote, usando interconexões de chip NVIDIA NVLink-C2C. Isso aumenta a largura de banda entre GPU e CPU em 7x em comparação com a mais recente tecnologia PCIe, reduz o consumo de energia de interconexão em mais de 5x e fornece um bloco de construção de GPU de arquitetura Hopper de 600 GB para supercomputadores DGX GH200.
A arquitetura DGX GH200 é o primeiro supercomputador a emparelhar Grace Hopper Superchips com o NVIDIA NVLink Switch System, uma nova interconexão que permite que todas as GPUs em um sistema DGX GH200 funcionem juntas como uma só. O sistema da geração anterior fornecia apenas oito GPUs para serem combinadas com o NVLink como uma GPU sem comprometer o desempenho.
“Cada vez mais a NVIDIA vem investindo em soluções mais potentes para supercomputadores. Isso segue a tendência de mercado devido à demanda crescente por poder computacional avançado e aceleração de inteligência artificial”, reforça Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
A arquitetura DGX GH200 fornece 48x mais largura de banda NVLink do que a geração anterior, oferecendo o poder de um enorme supercomputador de IA com a simplicidade de programar uma única GPU.
Uma nova ferramenta de pesquisa para pioneiros da IA
Google Cloud, Meta e Microsoft estão entre os primeiros a obter acesso a DGX GH200 para explorar seus recursos para cargas de trabalho de IA generativas. A NVIDIA também pretende fornecer o design DGX GH200 como um modelo para provedores de serviços em nuvem e outros hiperescaladores, para que possam personalizá-lo ainda mais para sua infraestrutura.
“A construção de modelos generativos avançados requer abordagens inovadoras para a infraestrutura de IA”, afirma Mark Lohmeyer, vice-presidente de computação do Google Cloud. “A nova escala NVLink e a memória compartilhada dos Superchips Grace Hopper abordam os principais gargalos da IA em larga escala e estamos ansiosos para explorar seus recursos para o Google Cloud e nossas iniciativas de IA generativa.”
“À medida que os modelos de IA crescem, eles precisam de uma infraestrutura poderosa que possa ser dimensionada para atender às demandas crescentes”, ressalta Alexis Björlin, vice-presidente de infraestrutura, sistemas de IA e plataformas aceleradas da Meta. “O design Grace Hopper da NVIDIA procura fornecer aos pesquisadores a capacidade de explorar novas abordagens para resolver seus maiores desafios.”
Novo supercomputador NVIDIA Helios para pesquisa e desenvolvimento avançados
A NVIDIA está construindo seu próprio supercomputador IA baseado em DGX GH200 para potencializar o trabalho de seus pesquisadores e equipes de desenvolvimento. Batizado de NVIDIA Helios, o supercomputador contará com quatro sistemas DGX GH200.
Cada sistema no supercomputador Helios será interconectado com a rede NVIDIA Quantum-2 InfiniBand com largura de banda de até 400 Gb/s para aumentar a taxa de transferência de dados para treinar grandes modelos de IA. O Helios incluirá 1.024 Grace Hopper Superchips e deverá estar online até o final do ano.
Totalmente integrado e construído especificamente para modelos gigantes
Os supercomputadores DGX GH200 incluem softwares NVIDIA para fornecer uma solução completa e pronta para uso para as maiores cargas de trabalho de IA e análise de dados. O software NVIDIA Base Command™ oferece gerenciamento de fluxo de trabalho de IA, gerenciamento de cluster de nível empresarial, bibliotecas que aceleram computação, armazenamento e infraestrutura de rede e software de sistema otimizado para executar cargas de trabalho de IA.
Também está incluso o NVIDIA AI Enterprise, a camada de software da plataforma NVIDIA AI. Ele fornece mais de 100 estruturas, modelos pré-treinados e ferramentas de desenvolvimento para simplificar o desenvolvimento e a implantação da IA de produção, incluindo IA generativa, visão computacional, IA de fala e muito mais.
Disponibilidade
Estima-se que os supercomputadores NVIDIA DGX GH200 estejam disponíveis até o final do ano.
Assista a Huang discutir os supercomputadores NVIDIA DGX GH200 na COMPUTEX 2023 no keynote transmitido online.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado na criação do metaverso industrial. A NVIDIA agora é uma empresa de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://blog.nvidia.com.br/.
Acesse também:
Site oficial da NVIDIA no Brasil: https://www.nvidia.com/pt-br/
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Certas declarações neste comunicado à imprensa, incluindo, entre outras, declarações sobre: os benefícios, impacto, desempenho, recursos e disponibilidade de nossos produtos, serviços e tecnologias, incluindo superchips e supercomputadores NVIDIA Grace Hopper, NVIDIA DGX e DGX GH200, NVLink incluindo o NVLink Switch System e a tecnologia de interconexão NVLink, DGX H100, NVIDIA Grace CPU, H100 Tensor Core GPU, supercomputador Helios, Quantum-2 InfiniBand, NVIDIA Base Command, NVIDIA AI Enterprise; nossas colaborações com Google, Meta e Microsoft e os benefícios, impacto, desempenho, recursos e disponibilidade dos mesmos; IA generativa, sistemas de recomendação e análise de dados sendo motores da economia moderna, exigindo escala, velocidade e eficiência sem precedentes; e a intenção da NVIDIA de fornecer o projeto DGX GH200 como um modelo para provedores de serviços em nuvem e outros hiperescaladores para que eles possam personalizá-lo ainda mais para sua infraestrutura são declarações prospectivas sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas . Fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas globais; nossa dependência de terceiros para fabricar, montar, embalar e testar nossos produtos; o impacto do desenvolvimento tecnológico e da concorrência; desenvolvimento de novos produtos e tecnologias ou aprimoramentos de nossos produtos e tecnologias existentes; aceitação no mercado de nossos produtos ou produtos de nossos parceiros; defeitos de projeto, fabricação ou software; mudanças nas preferências ou demandas do consumidor; mudanças nos padrões e interfaces da indústria; perda inesperada de desempenho de nossos produtos ou tecnologias quando integrados a sistemas; bem como outros fatores detalhados de tempos em tempos nos relatórios mais recentes que a NVIDIA arquiva com a Securities and Exchange Commission, ou SEC, incluindo, mas não limitado a, seu relatório anual no Formulário 10-K e relatórios trimestrais no Formulário 10-Q . Cópias de relatórios arquivados na SEC são publicadas no site da empresa e estão disponíveis gratuitamente na NVIDIA. Essas declarações prospectivas não são garantias de desempenho futuro e valem apenas a partir da presente data e, exceto conforme exigido por lei, a NVIDIA se isenta de qualquer obrigação de atualizar essas declarações prospectivas para refletir eventos ou circunstâncias futuras.
© 2023 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo NVIDIA, DGX, NVIDIA Base Command, NVIDIA Grace, NVIDIA Hopper e NVLink são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas às quais estão associados. Recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso prévio.
Informações para a imprensa:
Sing Comunicação de Resultados
29/05/2023