A OpenAI anunciou a chegada do GPT-4o, o novo modelo fundacional de IA para abastecer o ChatGPT
e outras ferramentas da empresa. O grande modelo de linguagem
(LLM na sigla em inglês) supera o desempenho de seus antecessores, inclusive o GPT-4 Turbo, por ser multimodal e interpretar com agilidade áudio, texto e imagem.
A novidade, anunciada nesta segunda (13) pela CTO da OpenAI, Mira Murati, durante a conferência Spring Updates, começa a ser distribuída ainda hoje para usuários gratuitos e assinantes do ChatGPT Plus. Vale lembrar, o GPT-4 Turbo estava disponível apenas para quem usava a versão paga da plataforma.
Experiência multimodal
O GPT-4o segue a proposta da projeto em tornar a IA mais acessível e intuitiva para todos os consumidores — para isso, reforça o aspecto multimodal do ChatGPT. O chatbot
agora é capaz de processar nativamente comandos que envolvam voz, imagem e texto, inclusive ao misturar mais de um formato durante o mesmo prompt.
–
Canaltech no Youtube: notícias, análise de produtos, dicas, cobertura de eventos e muito mais! Assine nosso canal no YouTube
, todo dia tem vídeo novo para você!
–
No caso das conversas de voz, o modelo diminui a latência entre o comando e a resposta da IA, com resultados cada vez mais imediatos. A demonstração da empresa indica que o ChatGPT é capaz de compreender barulhos externos, como uma respiração ofegante, e ainda consegue mudar de assunto com facilidade, como se estivesse numa conversa em tempo real.
A ferramenta, agora compatível com mais de 50 idiomas diferentes, também consegue traduzir conversas simultaneamente em qualquer dispositivo.
A interpretação de imagens também está mais poderosa: durante uma conversa de áudio, é possível enviar fotos para a análise da IA, que retorna com respostas em poucos segundos. A empresa revela que o recurso é útil para resolver equações matemáticas ou traduzir um cardápio em outro idioma, por exemplo.
Por fim, o chatbot também lê arquivos que misturam texto e imagem, enquanto a versão para desktop tem um atalho para enviar prints para análise rapidamente.
Mais poderoso
O GPT-4o pode ser considerado o novo modelo de topo de linha da OpenAI. Durante testes feitos na plataforma LMSys, que avalia a performance de um modelo de linguagem, a IA teve resultados superiores ao GPT-4 Turbo e outros concorrentes contemporâneos, como o Gemini 1.5 Pro e o Claude 3.
GPT-4o is our new state-of-the-art frontier model. We’ve been testing a version on the LMSys arena as im-also-a-good-gpt2-chatbot 🙂. Here’s how it’s been doing. pic.twitter.com/xEE2bYQbRk
— William Fedus (@LiamFedus) May 13, 2024
Gratuito
A OpenAI anunciou que o novo modelo e uma série de funções que eram do ChatGPT Plus estão disponíveis para todos os usuários do chatbot. De acordo com o CEO Sam Altman no X (antigo Twitter
), a empresa quer “colocar grandes ferramentas de IA nas mãos de todo mundo”.
Além do GPT-4o, qualquer usuário terá acesso à GPT Store, com versões personalizadas do chatbot, à pesquisa em tempo real, ao recurso que lembra o conteúdo de conversas passadas e à ferramenta de análise avançada de dados. Todos esses recursos eram limitados à assinatura paga da ferramenta.
Inicialmente, o novo modelo foi liberado para usuários dos serviços ChatGPT Plus e Team. A versão gratuita também foi liberada, mas tem limites de uso — a expectativa é que a assinatura Plus tenha limites até cinco vezes maiores, e a capacidade será ainda maior nos planos Team e Enterprise.
Leia a matéria no Canaltech
.
Trending no Canaltech: