A OpenAI anunciou a chegada do Sora, uma inteligência artificial generativa para criar vídeos a partir de comandos de texto. A novidade é apresentada nesta quinta-feira (15) como algo capaz de “simular o mundo físico em movimento” e se junta às IAs para criar texto ( ChatGPT
) e imagens estáticas ( DALL-E
) da companhia liderada por Sam Altman.
O Sora é capaz de criar vídeos de até um minuto de duração sem perder qualidade visual e permanecendo fiel aos parâmetros definidos pelo comando do usuário, garante a desenvolvedora. Os exemplos de vídeos criados com a IA publicados pela OpenAI são absolutamente incríveis e deixam no ar a ideia de uma tecnologia
de ponta capaz de criar vídeos “do zero” de maneira impecável — confira os vídeos ao longo deste texto.
Apesar do alto potencial de despertar a curiosidade do público, o Sora por enquanto está disponível a um grupo restrito de testadores de segurança, digamos assim, que tentam identificar potenciais danos e riscos gerados pela IA. Além disso, a OpenAI avisa que já liberou a tecnologia a artistas visuais e cineastas a fim de obter feedback para tornar a ferramenta “o mais útil possível para profissionais criativos”.
–
Siga no Instagram
: acompanhe nossos bastidores, converse com nossa equipe, tire suas dúvidas e saiba em primeira mão as novidades que estão por vir no Canaltech.
–
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
De texto para vídeo
Atualmente já existem algumas IAs capazes de criar vídeos de forma satisfatória, mas parece que a OpenAI quer ir além. A nova IA tecnologia seria capaz de entender a solicitação de quem digita um comando de forma contextualizada a fim de gerar um resultado avançado e coerente com o mundo real.
“O Sora pode gerar cenas complexas com diversos personagens, tipos específicos de movimento e detalhes precisos da cena principal e do plano de fundo”, explica a criadora do ChatGPT. “O modelo compreende não apenas o que o usuário pediu no prompt, mas também a forma como aquelas coisas existem no mundo real.”
Nesse sentido, o Sora promete ser capaz de criar diversas “capturas” de imagens com diferentes perspectivas a fim de alcançar o padrão solicitado pelo prompt.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Nem tudo são flores
Apesar de não poupar elogios a sua própria ferramenta, a OpenAI também alerta para as suas fraquezas. De acordo com a empresa, o Sora pode ter dificuldade em simular a física de efeitos mais complexos e em entender coisas muito específicas.
“Por exemplo, uma pessoa pode morder um pedaço de uma bolacha, mas, depois disso, a bolacha não tem uma marca de dentes”, explica a companhia.
Localizar no espaço a “câmera” que guia a perspectiva do espectador também pode ser um problema para o Sora. De acordo com a desenvolvedora, o modelo “pode sofrer com descrições precisas de eventos que acontecem ao longo do tempo, como seguir uma trajetória de câmera específica.”
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
E os riscos?
Em um mundo cada vez mais repleto de deepfakes eróticos de pessoas famosas ou não
, uma IA poderosa para criar vídeos levanta algumas preocupações. A OpenAI parece ciente disso e de antemão reforça que seu novo modelo tem sido testado por especialistas de áreas chave como desinformação, conteúdo de ódio e preconceito.
“Nós também construímos ferramentas para ajudar a detectar o mau uso de conteúdo como um classificador que avisa quando um vídeo foi gerado pelo Sora”, completa a companhia. A dona do ChatGPT também informa que planeja incluir códigos de metadados C2PA, o mesmo que passou a usar recentemente em imagens geradas pelo DALL-E
, a fim de facilitar a identificação de conteúdo gerado por IA.
Por fim, a OpenAI garante que trabalha junto a “legisladores, educadores e artistas do mundo” para compreender possíveis usos equivocados e prejudiciais da tecnologia.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Outro ponto crucial envolvendo IA generativa
, a base de dados para treinar tais modelos não ganhou muito destaque da OpenAI no anúncio da ferramenta. A única menção a isso dá conta de que o Sora foi construído sobre “pesquisas anteriores com os modelos GPT e DALL-E”.
De qualquer forma, a empresa prometeu liberar o paper técnico com todos os detalhes da nova IA ainda nesta quinta.
Disponibilidade
A OpenAI não revelou quando o Sora (ou algum produto seu baseado nesta tecnologia) será liberado ao público geral.
Leia a matéria no Canaltech
.
Trending no Canaltech: