Desenvolvido por uma rede de 15 países e 60 organizações, modelo busca oferecer soberania digital para instituições e startups da região
Latam-GPT – A América Latina deu um mais passo em direção à autonomia tecnológica com o lançamento do Latam-GPT, um modelo de inteligência artificial de código aberto desenvolvido especificamente para compreender as complexidades culturais e linguísticas da região.
O projeto é o resultado de um esforço colaborativo liderado pelo Centro Nacional de Inteligência Artificial do Chile (CENIA) em conjunto com uma rede de mais de 60 organizações espalhadas por 15 países latino-americanos, incluindo o Brasil. A iniciativa mobilizou mais de cem especialistas, entre pesquisadores, cientistas e engenheiros, contando ainda com o apoio do Banco de Desenvolvimento da América Latina e Caribe (CAF) e do Data Observatory.
LEIA: Supremo mantém mudança na correção do FGTS e nega revisão retroativa
Diferente dos modelos de IA dominantes no mercado global, que são treinados majoritariamente com conteúdos em língua inglesa, o Latam-GPT foi alimentado com um massivo corpus linguístico de 300 bilhões de tokens em português e espanhol, o que equivale a aproximadamente 230 bilhões de palavras.
Essa estratégia visa corrigir uma disparidade crítica no cenário digital atual, onde o português representa apenas 2% dos textos disponíveis nos repositórios globais de treinamento, enquanto o espanhol alcança somente 4%. O acervo textual utilizado passou por um rigoroso processo de curadoria para eliminar desinformação e discursos discriminatórios, garantindo a anonimização de dados pessoais e integrando conhecimentos estratégicos em áreas como saúde, políticas públicas e culturas indígenas.
Do ponto de vista técnico, o Latam-GPT utiliza a arquitetura Llama 3.1 com impressionantes 70 bilhões de parâmetros. Para viabilizar o processamento de tamanha magnitude, o projeto utilizou a infraestrutura de nuvem da Amazon Web Services (AWS), o que permitiu uma otimização severa no cronograma de desenvolvimento: o tempo de treinamento foi reduzido em 64%, caindo de 25 para apenas 9 dias.
Esse desempenho técnico robusto sustenta o objetivo principal da iniciativa de criar um bem público digital que democratize o acesso à tecnologia de ponta, permitindo que o ecossistema tecnológico local reconheça particularidades históricas e políticas frequentemente negligenciadas por sistemas estrangeiros.
Por ser um modelo de licença aberta, o Latam-GPT permite que universidades, órgãos governamentais e startups utilizem a ferramenta livremente para criar aplicações customizadas em diversos setores, desde a educação até o atendimento em serviços públicos.
Na visão de Álvaro Soto, diretor do CENIA, o lançamento não deve ser encarado como um produto finalizado, mas sim como uma base fundamental sobre a qual diferentes atores poderão construir soluções adaptadas às realidades locais. Dessa forma, a iniciativa pretende impulsionar a inovação tecnológica com uma identidade genuinamente latino-americana, promovendo um ecossistema autônomo e conectado com as necessidades da população regional.
(Com informações de Hardware.com.br)
(Foto: Reprodução/Freepik/Trend2023)