Plano brasileiro de IA é lançado, mas especialistas criticam
Especialistas criticam plano brasileiro de IA por ignorar curadoria de dados e diversidade linguística. Saiba por que isso pode comprometer os resultados da tecnologia.
TECNOLOGIA


Brasil quer liderar a IA em português, mas ignora um ponto essencial, dizem especialistas
📌 Um plano ambicioso para a Inteligência Artificial brasileira
O Brasil deu um passo importante com o lançamento oficial do Plano Brasileiro de Inteligência Artificial (PBIA). A iniciativa, divulgada em junho de 2025, estabelece uma estratégia nacional para o desenvolvimento de tecnologias baseadas em IA, com foco na valorização do idioma e da cultura brasileira.
A proposta é ousada: criar modelos de linguagem avançados — como os LLMs (Large Language Models) — utilizando dados em língua portuguesa coletados no Brasil. Essa medida, segundo o governo, busca reduzir a dependência de ferramentas estrangeiras e tornar o país protagonista na revolução da inteligência artificial.
Mas será que basta reunir uma grande quantidade de dados em português para alcançar esse objetivo?
Especialistas dizem que não.
⚠️ O alerta de quem entende do assunto: curadoria importa mais do que volume
O linguista Tiago Torrent, professor da Universidade Federal de Juiz de Fora (UFJF), publicou recentemente uma análise crítica no portal UOL Tilt, alertando sobre um problema fundamental no plano do governo: a falta de clareza sobre o que significa “curadoria de dados”.
Segundo Torrent, o documento oficial do PBIA menciona a importância de utilizar dados nacionais, mas falha ao explicar como será feita a escolha desses conteúdos, quem participará da seleção e quais critérios serão adotados para garantir diversidade, qualidade e representatividade cultural.
Esse ponto é central. Na inteligência artificial, a qualidade dos dados de treinamento determina o comportamento e a precisão dos modelos. Se um modelo é treinado com textos tendenciosos, com linguagem ofensiva, limitada a uma única região ou sem pluralidade de ideias, ele acabará reproduzindo esses problemas.
🧠 IA precisa de mais do que dados — precisa de contexto, diversidade e cuidado
A ideia de usar dados em português para treinar grandes modelos de linguagem é excelente. Afinal, modelos como o ChatGPT, Gemini e Claude são treinados, em sua maioria, com textos em inglês — o que pode dificultar o entendimento de expressões, regionalismos e referências culturais brasileiras.
No entanto, simplesmente coletar textos de sites “.br” ou redes sociais não é o suficiente.
Para que a IA fale “com a cara do Brasil”, é preciso:
Escolher conteúdos de diferentes regiões, classes sociais e grupos culturais
Evitar conteúdos com preconceitos ou desinformação
Garantir o respeito aos direitos autorais
Anotar os dados manualmente, quando necessário, com ajuda de especialistas humanos
Filtrar ruídos, repetições e inconsistências
Essa curadoria detalhada exige o envolvimento de profissionais como linguistas, sociólogos, educadores e jornalistas — não apenas programadores e engenheiros.
🌐 A diferença entre “language” e “língua” que pode mudar tudo
Um dos pontos mais interessantes levantados por Tiago Torrent é a confusão entre os termos “language” e “língua”.
Nos debates sobre IA, muitas vezes se fala em “modelos de linguagem” no sentido técnico — ou seja, algoritmos que processam qualquer idioma. Mas há uma diferença profunda entre isso e uma língua natural, como o português brasileiro.
Cada língua traz consigo:
História
Cultura
Gírias
Expressões afetivas
Variações regionais
Códigos sociais únicos
Ou seja, um modelo treinado em português precisa mais do que traduzir palavras. Ele precisa compreender os significados implícitos, as ironias, os sentimentos escondidos nas entrelinhas — coisas que só quem vive a cultura brasileira conhece de verdade.
🔍 Por que modelos treinados com dados de fora podem ser perigosos
Você já conversou com um chatbot que usava termos estranhos, tratava tudo com frieza ou simplesmente não entendia a pergunta?
Esse é um sintoma clássico de IA treinada com dados de outras culturas. E o risco disso se torna maior quando esses modelos reproduzem preconceitos estruturais, como racismo, machismo, homofobia ou elitismo.
Pesquisas como SHADES e CVQA mostram que muitos sistemas de IA globais falham quando expostos a contextos culturais diferentes daqueles para os quais foram originalmente desenvolvidos. O que é ofensivo em uma cultura pode passar despercebido em outra — e vice-versa.
Se o Brasil quiser usar IA em políticas públicas, educação, atendimento ao cidadão e segurança, precisa garantir que os modelos sejam realmente brasileiros — não apenas no idioma, mas na forma de pensar.
🧩 Curadoria precisa ser feita por pessoas — não só por algoritmos
No plano atual, a ideia de “curadoria de dados nacionais” é citada, mas sem explicações detalhadas.
Como os dados serão selecionados?
Quem vai decidir se um texto é adequado?
Haverá preocupação com inclusão, representatividade e proteção de grupos minoritários?
Sem essas respostas, corremos o risco de repetir um erro comum no mundo da IA: acreditar que mais dados significam automaticamente melhores resultados.
A realidade é mais complexa. Às vezes, menos dados, mas bem escolhidos, fazem toda a diferença.
🗣️ O papel dos linguistas e especialistas em cultura
Para que o Brasil tenha sucesso em sua estratégia de IA, especialistas indicam que linguistas devem fazer parte do processo desde o início.
Linguistas são profissionais treinados para entender:
Variações regionais e sociais da linguagem
Ambiguidades, sentidos ocultos e interpretações subjetivas
Formas de discurso que mudam com contexto, idade, gênero ou classe social
Eles podem ajudar a montar bancos de dados mais representativos e sensíveis, garantindo que a IA não fale de forma artificial, elitista ou excludente.
Além disso, é essencial envolver:
Educadores (para pensar na aplicação da IA na educação pública)
Jornalistas (que sabem filtrar informações relevantes e éticas)
Pesquisadores em diversidade e inclusão
Comunidades tradicionais (quilombolas, indígenas, etc.)
Essa abordagem multidisciplinar é o que permitirá ao Brasil criar um modelo de IA verdadeiramente nosso.
🧾 O que falta no plano de IA do governo?
Embora o Plano Brasileiro de Inteligência Artificial tenha méritos — como o financiamento previsto e o incentivo à pesquisa nacional —, ele ainda deixa algumas lacunas importantes:
Ponto positivo Ponto a melhorar Investimento bilionário até 2028 Falta de critérios claros para curadoria de dados Prioridade para o português Ausência de metodologias de avaliação de viés Inclusão de pesquisa e universidades Baixo detalhamento sobre governança ética Incentivo à infraestrutura Não menciona participação de comunidades afetadas
A falta de diretrizes claras abre espaço para improvisações perigosas e pode comprometer a credibilidade dos projetos que forem desenvolvidos com base nesse plano. Ponto positivo Ponto a melhorar Investimento bilionário até 2028 Falta de critérios claros para curadoria de dados Prioridade para o português Ausência de metodologias de avaliação de viés Inclusão de pesquisa e universidades Baixo detalhamento sobre governança ética Incentivo à infraestrutura Não menciona participação de comunidades afetadas
🔐 Transparência e explicabilidade: as chaves para a confiança
Outro ponto crucial é a explicabilidade dos sistemas de IA. Ou seja: o usuário precisa entender por que a IA tomou determinada decisão.
Se a IA indicar um diagnóstico médico, um texto jurídico ou uma análise financeira, é fundamental que o sistema explique:
De onde veio aquela informação
Com base em quais dados foi tomada a decisão
Se houve alguma filtragem ou viés no processo
A falta de transparência pode gerar desconfiança, desinformação e até ações judiciais.
Por isso, a IA brasileira precisa ser desenvolvida com mecanismos de auditoria, documentação técnica acessível e responsabilidade ética.
🤖 O futuro da IA brasileira pode ser brilhante — se for bem-feita
O plano do governo coloca o Brasil em um caminho estratégico para se tornar referência em inteligência artificial aplicada à realidade nacional. Com investimento, incentivo à pesquisa e foco no idioma, há muito potencial para gerar soluções públicas e privadas de alto impacto.
Mas tudo depende da qualidade da implementação.
Sem uma curadoria séria, sem diversidade de vozes, sem governança responsável e sem participação da sociedade, os riscos são grandes.
Esse é o momento ideal para ajustar rotas, ouvir especialistas e envolver quem realmente entende de linguagem, cultura, inclusão e tecnologia.
❓ FAQ – Perguntas frequentes sobre IA e o plano brasileiro
1. O que é curadoria de dados na IA?
É o processo de selecionar, revisar e organizar os dados que serão usados para treinar os modelos de inteligência artificial. Inclui filtragem de conteúdo, remoção de dados problemáticos, anotação e análise contextual.
2. Por que não basta usar textos em português da internet?
Porque a internet contém informações erradas, ofensivas ou não representativas. Além disso, há desequilíbrios regionais e sociais nos conteúdos online.
3. IA em português é diferente de IA traduzida?
Sim. Modelos treinados diretamente em português entendem melhor os contextos locais, gírias, expressões afetivas e construções culturais únicas.
4. Quem deve fazer parte do time que cuida disso?
Linguistas, sociólogos, programadores, educadores, jornalistas, representantes de minorias e especialistas em ética.
5. O plano do governo é suficiente?
É um bom começo, mas precisa de ajustes técnicos e políticos para garantir que os resultados sejam justos, inclusivos e confiáveis.
6. Como saber se a IA que estou usando é segura e ética?
Verifique se há transparência sobre os dados usados, quem fez a curadoria, se o modelo foi auditado por terceiros e se há canais de explicação.
🔗 Veja também no Uberaba Digital
Galaxy M36: Lançamento oficial agendado e ficha técnica completa
Óculos com IA da Meta e Oakley: novo passo da tecnologia vestível
Fraudes online afetam 4 em cada 10 brasileiros: como se proteger