Plano brasileiro de IA é lançado, mas especialistas criticam

Especialistas criticam plano brasileiro de IA por ignorar curadoria de dados e diversidade linguística. Saiba por que isso pode comprometer os resultados da tecnologia.

TECNOLOGIA

Uberaba digital

6/23/20256 min ler

Plano brasileiro de IA é lançado, mas especialistas criticam
Plano brasileiro de IA é lançado, mas especialistas criticam

Brasil quer liderar a IA em português, mas ignora um ponto essencial, dizem especialistas

📌 Um plano ambicioso para a Inteligência Artificial brasileira

O Brasil deu um passo importante com o lançamento oficial do Plano Brasileiro de Inteligência Artificial (PBIA). A iniciativa, divulgada em junho de 2025, estabelece uma estratégia nacional para o desenvolvimento de tecnologias baseadas em IA, com foco na valorização do idioma e da cultura brasileira.

A proposta é ousada: criar modelos de linguagem avançados — como os LLMs (Large Language Models) — utilizando dados em língua portuguesa coletados no Brasil. Essa medida, segundo o governo, busca reduzir a dependência de ferramentas estrangeiras e tornar o país protagonista na revolução da inteligência artificial.

Mas será que basta reunir uma grande quantidade de dados em português para alcançar esse objetivo?

Especialistas dizem que não.

⚠️ O alerta de quem entende do assunto: curadoria importa mais do que volume

O linguista Tiago Torrent, professor da Universidade Federal de Juiz de Fora (UFJF), publicou recentemente uma análise crítica no portal UOL Tilt, alertando sobre um problema fundamental no plano do governo: a falta de clareza sobre o que significa “curadoria de dados”.

Segundo Torrent, o documento oficial do PBIA menciona a importância de utilizar dados nacionais, mas falha ao explicar como será feita a escolha desses conteúdos, quem participará da seleção e quais critérios serão adotados para garantir diversidade, qualidade e representatividade cultural.

Esse ponto é central. Na inteligência artificial, a qualidade dos dados de treinamento determina o comportamento e a precisão dos modelos. Se um modelo é treinado com textos tendenciosos, com linguagem ofensiva, limitada a uma única região ou sem pluralidade de ideias, ele acabará reproduzindo esses problemas.

🧠 IA precisa de mais do que dados — precisa de contexto, diversidade e cuidado

A ideia de usar dados em português para treinar grandes modelos de linguagem é excelente. Afinal, modelos como o ChatGPT, Gemini e Claude são treinados, em sua maioria, com textos em inglês — o que pode dificultar o entendimento de expressões, regionalismos e referências culturais brasileiras.

No entanto, simplesmente coletar textos de sites “.br” ou redes sociais não é o suficiente.

Para que a IA fale “com a cara do Brasil”, é preciso:

  • Escolher conteúdos de diferentes regiões, classes sociais e grupos culturais

  • Evitar conteúdos com preconceitos ou desinformação

  • Garantir o respeito aos direitos autorais

  • Anotar os dados manualmente, quando necessário, com ajuda de especialistas humanos

  • Filtrar ruídos, repetições e inconsistências

Essa curadoria detalhada exige o envolvimento de profissionais como linguistas, sociólogos, educadores e jornalistas — não apenas programadores e engenheiros.

🌐 A diferença entre “language” e “língua” que pode mudar tudo

Um dos pontos mais interessantes levantados por Tiago Torrent é a confusão entre os termos “language” e “língua”.

Nos debates sobre IA, muitas vezes se fala em “modelos de linguagem” no sentido técnico — ou seja, algoritmos que processam qualquer idioma. Mas há uma diferença profunda entre isso e uma língua natural, como o português brasileiro.

Cada língua traz consigo:

  • História

  • Cultura

  • Gírias

  • Expressões afetivas

  • Variações regionais

  • Códigos sociais únicos

Ou seja, um modelo treinado em português precisa mais do que traduzir palavras. Ele precisa compreender os significados implícitos, as ironias, os sentimentos escondidos nas entrelinhas — coisas que só quem vive a cultura brasileira conhece de verdade.

🔍 Por que modelos treinados com dados de fora podem ser perigosos

Você já conversou com um chatbot que usava termos estranhos, tratava tudo com frieza ou simplesmente não entendia a pergunta?

Esse é um sintoma clássico de IA treinada com dados de outras culturas. E o risco disso se torna maior quando esses modelos reproduzem preconceitos estruturais, como racismo, machismo, homofobia ou elitismo.

Pesquisas como SHADES e CVQA mostram que muitos sistemas de IA globais falham quando expostos a contextos culturais diferentes daqueles para os quais foram originalmente desenvolvidos. O que é ofensivo em uma cultura pode passar despercebido em outra — e vice-versa.

Se o Brasil quiser usar IA em políticas públicas, educação, atendimento ao cidadão e segurança, precisa garantir que os modelos sejam realmente brasileiros — não apenas no idioma, mas na forma de pensar.

🧩 Curadoria precisa ser feita por pessoas — não só por algoritmos

No plano atual, a ideia de “curadoria de dados nacionais” é citada, mas sem explicações detalhadas.

Como os dados serão selecionados?

Quem vai decidir se um texto é adequado?

Haverá preocupação com inclusão, representatividade e proteção de grupos minoritários?

Sem essas respostas, corremos o risco de repetir um erro comum no mundo da IA: acreditar que mais dados significam automaticamente melhores resultados.

A realidade é mais complexa. Às vezes, menos dados, mas bem escolhidos, fazem toda a diferença.

🗣️ O papel dos linguistas e especialistas em cultura

Para que o Brasil tenha sucesso em sua estratégia de IA, especialistas indicam que linguistas devem fazer parte do processo desde o início.

Linguistas são profissionais treinados para entender:

  • Variações regionais e sociais da linguagem

  • Ambiguidades, sentidos ocultos e interpretações subjetivas

  • Formas de discurso que mudam com contexto, idade, gênero ou classe social

Eles podem ajudar a montar bancos de dados mais representativos e sensíveis, garantindo que a IA não fale de forma artificial, elitista ou excludente.

Além disso, é essencial envolver:

  • Educadores (para pensar na aplicação da IA na educação pública)

  • Jornalistas (que sabem filtrar informações relevantes e éticas)

  • Pesquisadores em diversidade e inclusão

  • Comunidades tradicionais (quilombolas, indígenas, etc.)

Essa abordagem multidisciplinar é o que permitirá ao Brasil criar um modelo de IA verdadeiramente nosso.

🧾 O que falta no plano de IA do governo?

Embora o Plano Brasileiro de Inteligência Artificial tenha méritos — como o financiamento previsto e o incentivo à pesquisa nacional —, ele ainda deixa algumas lacunas importantes:

Ponto positivo Ponto a melhorar Investimento bilionário até 2028 Falta de critérios claros para curadoria de dados Prioridade para o português Ausência de metodologias de avaliação de viés Inclusão de pesquisa e universidades Baixo detalhamento sobre governança ética Incentivo à infraestrutura Não menciona participação de comunidades afetadas

A falta de diretrizes claras abre espaço para improvisações perigosas e pode comprometer a credibilidade dos projetos que forem desenvolvidos com base nesse plano. Ponto positivo Ponto a melhorar Investimento bilionário até 2028 Falta de critérios claros para curadoria de dados Prioridade para o português Ausência de metodologias de avaliação de viés Inclusão de pesquisa e universidades Baixo detalhamento sobre governança ética Incentivo à infraestrutura Não menciona participação de comunidades afetadas

🔐 Transparência e explicabilidade: as chaves para a confiança

Outro ponto crucial é a explicabilidade dos sistemas de IA. Ou seja: o usuário precisa entender por que a IA tomou determinada decisão.

Se a IA indicar um diagnóstico médico, um texto jurídico ou uma análise financeira, é fundamental que o sistema explique:

  • De onde veio aquela informação

  • Com base em quais dados foi tomada a decisão

  • Se houve alguma filtragem ou viés no processo

A falta de transparência pode gerar desconfiança, desinformação e até ações judiciais.

Por isso, a IA brasileira precisa ser desenvolvida com mecanismos de auditoria, documentação técnica acessível e responsabilidade ética.

🤖 O futuro da IA brasileira pode ser brilhante — se for bem-feita

O plano do governo coloca o Brasil em um caminho estratégico para se tornar referência em inteligência artificial aplicada à realidade nacional. Com investimento, incentivo à pesquisa e foco no idioma, há muito potencial para gerar soluções públicas e privadas de alto impacto.

Mas tudo depende da qualidade da implementação.

Sem uma curadoria séria, sem diversidade de vozes, sem governança responsável e sem participação da sociedade, os riscos são grandes.

Esse é o momento ideal para ajustar rotas, ouvir especialistas e envolver quem realmente entende de linguagem, cultura, inclusão e tecnologia.

❓ FAQ – Perguntas frequentes sobre IA e o plano brasileiro

1. O que é curadoria de dados na IA?
É o processo de selecionar, revisar e organizar os dados que serão usados para treinar os modelos de inteligência artificial. Inclui filtragem de conteúdo, remoção de dados problemáticos, anotação e análise contextual.

2. Por que não basta usar textos em português da internet?
Porque a internet contém informações erradas, ofensivas ou não representativas. Além disso, há desequilíbrios regionais e sociais nos conteúdos online.

3. IA em português é diferente de IA traduzida?
Sim. Modelos treinados diretamente em português entendem melhor os contextos locais, gírias, expressões afetivas e construções culturais únicas.

4. Quem deve fazer parte do time que cuida disso?
Linguistas, sociólogos, programadores, educadores, jornalistas, representantes de minorias e especialistas em ética.

5. O plano do governo é suficiente?
É um bom começo, mas precisa de ajustes técnicos e políticos para garantir que os resultados sejam justos, inclusivos e confiáveis.

6. Como saber se a IA que estou usando é segura e ética?
Verifique se há transparência sobre os dados usados, quem fez a curadoria, se o modelo foi auditado por terceiros e se há canais de explicação.

🔗 Veja também no Uberaba Digital