A OpenAI anunciou um novo modelo de IA chamado CriticGPT, treinado com base no GPT-4 e usado para corrigir possíveis erros em respostas do ChatGPT sobre programação. De acordo com a empresa, pessoas que usam a ferramenta notam melhorias em 60% dos casos.
A ferramenta foi criada para refinar os processos de revisão das respostas do ChatGPT: a OpenAI informa que o chatbot fica mais preciso ao longo do tempo, com erros mais sutis, e isso pode dificultar a vida dos profissionais que analisam imprecisões na plataforma. A solução, então, foi treinar o CriticGPT para escrever críticas que destaquem vulnerabilidades nas respostas, incluindo bugs que passam despercebidos pelos humanos.
A empresa quer integrar modelos similares à novidade nos sistemas de Aprendizado de Reforço por Feedback Humano (RLHF, na sigla em inglês), que usam o treinamento de profissionais para encontrar possíveis erros e comparar respostas do chatbot.
Os resultados colhidos pela empresa revelam que o CriticGPT não acerta em todas as sugestões, mas os treinadores têm desempenho melhor com a ferramenta em comparação com aqueles que não a usam. Os insights oferecidos pela IA ajudam a criar críticas mais compreensíveis e reduzem os riscos de bugs por alucinação da tecnologia (processo quando a IA cria fatos inexistentes ou imprecisos).
Limitações
A ferramenta pode ser útil para detectar bugs, mas a desenvolvedora ainda aponta algumas limitações:
- O CriticGPT é treinado apenas em respostas curtas do ChatGPT, então ainda precisa de aprimoramentos para compreender pedidos mais longos;
- Os modelos ainda podem causar alucinações e dificultar o trabalho dos treinadores da IA;
- A ferramenta pode corrigir um erro individual num código, mas pode deixar passar outros problemas dentro da própria resposta;
- O CriticGPT tem dificuldade para ajudar em tarefas muito complexas, até mesmo com a supervisão de experts.
Inicialmente, a ferramenta está disponível apenas para quem trabalha com o treinamento das ferramentas de IA. E por falar em OpenAI, o CEO Sam Altman comentou recentemente que o sucessor do GPT-4, já em desenvolvimento, trará um “salto significativo” em comparação ao modelo atual.