Opinião

A inteligência artificial nas tranças de Rapunzel

Modelos de IA são treinados em dados extraídos da internet. A consequência é que, cada vez mais, IAs serão treinadas em materiais produzidos por outras IA

Quanto tempo, portanto, até que Rapunzel evoque seu amaldiçoado teorema e nossos modelos colapsem? Como escapar de suas tranças? -  (crédito: Tamara Bellis)
Quanto tempo, portanto, até que Rapunzel evoque seu amaldiçoado teorema e nossos modelos colapsem? Como escapar de suas tranças? - (crédito: Tamara Bellis)

Felipe Buchbinder, professor da Fundação Getulio Vargas (FGV), doutor em administração pela FGV e mestre em inteligência artificial pela Duke University ( EUA)

Tudo o que é bom dura pouco, exceto o que é bom mesmo. O Teorema de Pitágoras já dura milênios, mas nunca falhou em encontrar a tão cobiçada hipotenusa. A inteligência artificial (IA) terá a mesma longevidade? Após dezenas de bilhões de dólares investidos na certeza de que sim, o mercado agora sofre a dúvida do talvez não.

Como um jovem Davi que nunca conheceu uma Bate-Seba, a IA ainda não teve tempo de ser posta seriamente à prova. Já mostrou vícios: exige volumes inenarráveis de dados, dados que são obtidos muitas vezes sem consentimento, e, às vezes, produzem resultados sem sentido algum. Talvez, esses vícios sejam sanáveis. O tempo dirá.

O que já foi dito, todavia, justifica cautela. Estudos do Massachusetts Institute of Technology (MIT), do Fundo Monetário Internacional (FMI) e da  Organização para Cooperação e Desenvolvimento Econômico (OCDE), separadamente, concluíram que os efeitos da IA sobre a produtividade serão modestos: menos de 1% em 10 anos, segundo o estudo do MIT. O do FMI destaca, ainda, a falta de casos de sucesso — isso é, de empresas que, ao incorporarem IA aos seus processos, tenham dado saltos revolucionários de desempenho. 

Não ajuda que cerca de 85% dos projetos de IA falhem, segundo um relatório da Gartner, e entre 70% e 80%, de acordo com outras fontes. Tampouco ajudam as crescentes regulações impostas ao setor e os processos judiciais movidos por verdadeiros titãs da mídia — empresas como The New York Times e Universal Studios, entre outras — questionando o uso não autorizado de suas produções para treinar modelos como o ChatGPT. Eis o cenário que levou o The Economist a falar em uma bolha de IA prestes a explodir.

Com um fluxo de caixa operacional de US$ 459 bilhões e US$ 151 bilhões de investimento anuais, Apple, Microsoft, Amazon, Alphabet e Meta têm artilharia pesada para lutar. Mas há um oponente que nem todo o dinheiro do mundo consegue vencer: a matemática. Modelos de IA são treinados em dados extraídos da internet. Eles também produzem textos, imagens e vídeos que, por sua vez, vão parar na internet. Assim, a internet contém uma quantidade cada vez maior de material produzido por IA. A consequência é que, cada vez mais,  IAs serão treinadas em materiais produzidos por outras IAs.

Um artigo da Nature estudou o que acontece quando um modelo de inteligência artificial  treinado originalmente em dados reais é atualizado sucessivas vezes com os resultados das  próprias previsões. Inicialmente, os resultados vão ficando cada vez mais homogêneos. Perdem variedade, expressividade. Tornam-se bonitinhos, mas ordinários. Frases se tornam simples, vocabulários ficam reduzidos, estilos se tornam convenções. Súbito, ocorre o pior: a IA produz resultados absurdos e sem sentido. O modelo colapsa.

De certa forma, o mesmo acontece conosco, seres humanos. Que conhecimento do mundo terá a pobre Rapunzel, trancada na torre, ouvindo apenas os relatos de sua mãe, requentados pela própria imaginação? Rapunzel terá uma visão muito limitada do mundo, e é inevitável que forme ideias que não condizem com a realidade.

O mais interessante é que isso não é uma limitação da nossa tecnologia atual, passível de ser superado com mais investimentos. Não! É um teorema matemático. É preocupante, portanto, que cientistas da Amazon tenham recentemente estimado que 57% do conteúdo da internet é produzido por IA. Esse conteúdo consiste majoritariamente de traduções automáticas, de frases simples e objetivas, sem a pletora de recursos estilísticos das linguagens deveras humanas. Quanto tempo, portanto, até que Rapunzel evoque seu amaldiçoado teorema e nossos modelos colapsem? Como escapar de suas tranças?

Escapam-se com dados originais e verdadeiramente criativos. Escapam-se com nova arte e nova literatura, não aquelas produzidas pelo ClaudeAI, mas as produzidas pelos Claudes Monets de cada geração.  Não é claro como se conciliará a necessidade massiva de dados reais com o direito à proteção de dados pessoais e material autoral. O tempo trará a resposta, juntamente com os lucros ou os prejuízos dos que investem no setor. Até lá, resta-nos apreciar a ironia: a salvação da IA é a criatividade humana.

postado em 10/11/2024 06:01
x