A OpenAI anunciou um novo modelo de IA chamado CriticGPT, treinado com base no GPT-4 e usado para corrigir possíveis erros em respostas do ChatGPT
sobre programação. De acordo com a empresa, pessoas que usam a ferramenta notam melhorias em 60% dos casos.
A ferramenta foi criada para refinar os processos de revisão das respostas do ChatGPT: a OpenAI informa que o chatbot
fica mais preciso ao longo do tempo, com erros mais sutis, e isso pode dificultar a vida dos profissionais que analisam imprecisões na plataforma. A solução, então, foi treinar o CriticGPT para escrever críticas que destaquem vulnerabilidades nas respostas, incluindo bugs que passam despercebidos pelos humanos.
A empresa quer integrar modelos similares à novidade nos sistemas de Aprendizado de Reforço por Feedback Humano (RLHF, na sigla em inglês), que usam o treinamento de profissionais para encontrar possíveis erros e comparar respostas do chatbot.
–
Siga o Canaltech no Twitter
e seja o primeiro a saber tudo o que acontece no mundo da tecnologia.
–
Os resultados colhidos pela empresa revelam que o CriticGPT não acerta em todas as sugestões, mas os treinadores têm desempenho melhor com a ferramenta em comparação com aqueles que não a usam. Os insights oferecidos pela IA ajudam a criar críticas mais compreensíveis e reduzem os riscos de bugs por alucinação da tecnologia
(processo quando a IA cria fatos inexistentes ou imprecisos).
Limitações
A ferramenta pode ser útil para detectar bugs, mas a desenvolvedora ainda aponta algumas limitações:
- O CriticGPT é treinado apenas em respostas curtas do ChatGPT, então ainda precisa de aprimoramentos para compreender pedidos mais longos;
- Os modelos ainda podem causar alucinações e dificultar o trabalho dos treinadores da IA;
- A ferramenta pode corrigir um erro individual num código, mas pode deixar passar outros problemas dentro da própria resposta;
- O CriticGPT tem dificuldade para ajudar em tarefas muito complexas, até mesmo com a supervisão de experts.
Inicialmente, a ferramenta está disponível apenas para quem trabalha com o treinamento das ferramentas de IA. E por falar em OpenAI, o CEO Sam Altman
comentou recentemente que o sucessor do GPT-4, já em desenvolvimento, trará um “salto significativo”
em comparação ao modelo atual.
Leia a matéria no Canaltech
.
Trending no Canaltech: