Jornal Correio Braziliense

Tecnologia

Inteligência artificial consegue reproduzir imagens a partir do pensamento

Sistema de inteligência artificial reproduz, quase em tempo real, vídeos assistidos por humanos analisando apenas a atividade cerebral deles. Índice de acerto em testes é de até 70%



A inteligência artificial conquista cada vez mais espaços. Ela está presente em supercomputadores, redes sociais, robôs e celulares, como os assistentes instalados em smartphones. No mundo das pesquisas, também se torna cada vez mais popular e já mostrou superar cérebros humanos em atividades como jogos de xadrez e no reconhecimento de imagens. Agora, ela pode ler a sua mente.

Feche os olhos por um instante e imagine uma flor. Você provavelmente consegue produzir uma imagem razoavelmente nítida. Acontece que as imagens são ferramentas importantíssimas para o cérebro e ajudam a estruturar o pensamento. Por isso que, ao ler concentradamente um livro, somos capazes de ver as cenas acontecerem como se estivéssemos assistindo a um filme.

Assim, um dos passos mais importantes para melhor compreender o pensamento é ter acesso à forma como o cérebro processa imagens. Pesquisadores da Universidade Purdue, nos Estados Unidos, conseguiram avançar um pouco nessa direção ao criar um algoritmo capaz de reconstruir parcialmente vídeos curtos assistidos por humanos tendo como base apenas a atividade cerebral deles.

[SAIBAMAIS]Em tempo real, a inteligência artificial consegue também classificar os vídeos em categorias, como animais aquáticos, rostos e pássaros. A precisão do algoritmo parece baixa, com 70% de chance de ser correta uma das três primeiras categorias sugeridas por ele, mas é um avanço em relação às estratégias mais antigas, que dependem de uma base de dados de imagens para fazer as comparações.

;O algoritmo lê imagens de ressonância magnética do cérebro e as interpreta como combinações de milhares de características. Elas incluem arestas, formas, objetos ou uma combinação de objetos;, ilustra Zhongming Liu, um dos autores do estudo, divulgado na revista Cerebral Cortex.

Neurônios artificiais

Três mulheres participaram do experimento e assistiram a 972 vídeos contendo diferentes cenas comuns, como gravações de animais, pessoas e veículos. Ao mesmo tempo, os pesquisadores registraram a atividade cerebral das voluntárias usando um aparelho de ressonância magnética funcional. A intenção era descobrir quais áreas do córtex visual das participantes eram ativadas com cada tipo de vídeo.

Parte dos dados foi inserida em um algoritmo de inteligência artificial a fim de treiná-lo a reconstruir e classificar as imagens apenas com base na atividade cerebral. A solução tem uma estrutura chamada rede neural convolucional, uma série de neurônios artificiais organizados em camadas que se comunicam entre si. Essa organização imita justamente o funcionamento do córtex visual de animais e é bastante utilizada para o reconhecimento de imagens.

;Os neurônios são agrupados em três tipos de camadas: a de entrada, as ocultas e a de saída;, explica Anselmo Paiva, professor do Departamento de Informática da Universidade Federal do Maranhão (UFMA). Segundo o especialista, que não participou da pesquisa, a primeira recebe dados de entrada. ;Por exemplo, imagens contendo objetos;, ilustra. ;Ela, então, passa os dados para as camadas ocultas, que realizam cálculos matemáticos e passam os resultados para a seguinte, a de saída, que tem os dados finais;, complementa.

Ao todo, o algoritmo criado pela equipe de Purdue tem oito camadas. Depois do treinamento, elas recebem como entrada apenas os dados de ressonância magnética e extraem informações sobre o vídeo em etapas. A última camada é responsável por categorizar a cena observada entre 15 grupos predeterminados, e o processamento das informações acontece quase ao mesmo tempo em que a cena é observada.

Preto e branco

O resultado final é uma reconstrução do vídeo assistido originalmente com pixels pretos e brancos, nos quais manchas brancas representam os objetos mais próximos da cena. Além disso, o algoritmo sugere as categorias mais prováveis que representam o conteúdo do vídeo, e há 70% de chance de uma das três primeiras categorias estar correta. Para que a primeira esteja certa, a taxa é de 48%.

;Nosso estudo mostra uma maneira inteligente de reconstruir ;diretamente; a experiência visual;, afirma Liu. ;Não importa qual ela seja ou se ela está ou não em uma base de dados. Esse último fator é especialmente importante ; o mundo é muito diverso e uma pessoa sempre tem experiências visuais novas.;

Segundo o pesquisador, em termos práticos, o algoritmo decodifica imagens de ressonância magnética quase em tempo real. ;Enquanto a atividade cerebral está sendo registrada, a experiência visual é reconstruída e classificada. Isso é um detalhe um tanto técnico, mas importante;, ressalta.

Anselmo Paiva destaca que o trabalho americano apresenta uma abordagem interessante para associar áreas de ativação do cérebro a estímulos visuais. ;Esse é um processo de difícil generalização, porque, na ressonância magnética, as pessoas terão respostas diferentes quando submetidas ao mesmo estímulo;, explica. Segundo ele, as principais limitações do trabalho se devem à complexidade do problema abordado, o que resultou em taxas de acerto abaixo de 60%. ;Para algumas imagens apresentadas, os resultados de acerto são ainda muito iniciais, mas promissores;, diz.

Foco no fluxo


A ressonância magnética é, geralmente, utilizada para observar detalhes anatômicos do cérebro. Já a versão funcional consegue registrar a ativação ou a desativação de várias regiões do órgão a partir do fluxo sanguíneo do órgão em resposta à atividade neural. Por não ser invasiva e não utilizar radiação, é muito usada em pesquisas científicas para o mapeamento cerebral.