*Por Marcio Aguiar
A IA está revolucionando a maneira como lidamos com grandes volumes de dados e essa técnica vem sendo utilizada para diversas funcionalidades. Um exemplo notável de evolução é o NVIDIA NIM – NVIDIA Inference Microservices, uma tecnologia que otimiza a comunicação entre componentes essenciais em sistemas de alto desempenho, como servidores e datacenters, tornando a implantação de recursos de IA muito mais rápida.
Esses microsserviços de inferência funcionam como uma ponte de alta velocidade entre unidades de processamento gráficos (GPUs) e outros elementos críticos do sistema, como CPUs, memória e armazenamento. Essa conexão direta permite uma transferência de dados eficiente e rápida, reduzindo significativamente a latência e melhorando o desempenho geral do sistema.
Por exemplo, imagine que você está transitando em uma cidade grande e precisa ir de um lado para o outro, porém, o trânsito está lento e há grandes chances de você perder tempo nesse trajeto. Existe a opção de usar uma via expressa que é exclusiva e permite que você se desloque de um lado para o outro muito mais rápido.
No computador, as ruas congestionadas seriam as conexões normais entre os componentes, que em muitos casos podem ser lentas e ineficientes. Já a via expressa seria como o NVIDIA NIM, permitindo que as informações sejam transmitidas de forma rápida e direta.
A grande sutileza desta ferramenta é que pode ser utilizada por empresas que possuem desenvolvedores e até por organizações que não contam com a atuação desses profissionais. Pois, por meio de parceiros, é possível criar e implementar esse serviço, independentemente do porte da companhia, desde que ela tenha uma GPU e a licença da plataforma de software NVIDIA AI Enterprise.
Com esses recursos, os microsserviços de inferência podem ser utilizados para executar aplicações de geração de texto, imagens e vídeo, fala e até humanos digitais. Há diversas possibilidades, sendo possível criar NIMs específicos para geração de moléculas, análise de crédito, entre outros serviços com opções de segurança, de validação e de domínio personalizados.
O uso do NVIDIA NIM pode contribuir de maneira significativa na otimização de projetos de IA. Citando um outro exemplo, se uma empresa utiliza um modelo pronto e faz adequações por conta própria, ela consegue gerar 250 palavras por segundo. Já com a implementação do NIM, é possível gerar 1.346 palavras por segundo, sendo cinco vezes mais rápido utilizando o mesmo hardware e modelo.
Recentemente, tivemos o anúncio do NVIDIA NIM™ Agent Blueprints, um conjunto de software para criação e implantação de aplicações de IA generativa para casos de uso como avatares de atendimento ao cliente, triagem virtual para descoberta de medicamentos, entre outros. Os NIM Agent Blueprints podem ser modificados pelas empresas, com dados do próprio negócio e serem executados por meio de aplicações de IA generativa em data centers acelerados e em nuvens.
De acordo com previsões da Gartner, 80% das ofertas conversacionais irão incorporar IA generativa até 2025. O NIM Agent Blueprint de humano digital para atendimento ao cliente poderá ajudar as empresas nessa jornada, proporcionando uma experiência mais envolvente para o usuário. Na área da saúde, para desenvolver um novo medicamento o custo normalmente envolve cerca de US$ 2,6 bilhões e pode durar um período de 10 a 15 anos. As empresas farmacêuticas poderão reduzir esses custos e minimizar os prazos de desenvolvimento no mercado farmacêutico global de US$ 1,5 trilhão, tornando o design molecular mais inteligente com o NIM Agent Blueprint. Além de reduzir o tempo e custo no desenvolvimento de medicamentos, o acesso a tratamentos aos pacientes será mais eficiente.
É importante ressaltar que caso seja necessário treinar esses modelos específicos, o tempo de treinamento pode variar de acordo com a quantidade de dados, o tamanho do modelo que a empresa quer criar, além de quantas GPUs a companhia possui para fazer essa integração.
O NVIDIA NIM não apenas otimiza o desempenho dos sistemas computacionais, mas também representa um avanço significativo na capacidade de processamento de dados. Com sua capacidade de conectar GPUs e outros componentes de forma eficiente, essa tecnologia é essencial para empresas e organizações que buscam maximizar a eficiência operacional e a inovação tecnológica.
Ao adotar o NVIDIA NIM, as empresas não só melhoram seus processos internos, mas também abrem portas para novas aplicações e descobertas científicas que antes poderiam ser limitadas pela capacidade computacional disponível. Estamos diante de um avanço que não apenas eleva o desempenho dos sistemas de IA, mas que também amplia as possibilidades de transformação digital em escala global.
*Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://www.nvidia.com/pt-br/.
Acesse também:
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil
Informações para a imprensa:
Sing Comunicação de Resultados
11/11/2024