domingo, 15 de março de 2026

Apple desenvolve IA para animar imagens estáticas

Apple desenvolve IA para animar imagens estáticas
Bruno De Blasi

Apple desenvolve IA para animar imagens estáticas

Pesquisadores da Apple
revelaram o Keyframer, um modelo de inteligência artificial (IA) para animar imagens estáticas sem depender de apps de edição avançada. O estudo foi assinado por Tiffany Tseng, Ruijia Cheng e Jeffrey Nichols e publicado no repositório arXiv no começo de fevereiro.

Animação de imagens estáticas

A solução ataca uma área que é pouco explorada por esse campo, segundo os pesquisadores: a animação. A ideia é aplicar um grande modelo de linguagem (LLM)
para auxiliar o trabalho de artistas, designers, desenvolvedores e afins que atuam em diversas frentes, como publicidade, jogos e interfaces de usuário.

“Baseado em entrevistas com designers e engenheiros de animação profissionais, o Keyframer oferece suporte à exploração e ao refinamento de animações por meio da combinação de prompt e edição direta da saída gerada”, diz o estudo. “O sistema também permite que os usuários solicitem variantes de design, apoiando a comparação e a idealização.”


Feedly: assine nosso feed RSS
e não perca nenhum conteúdo do Canaltech em seu agregador de notícias favorito.

Apesar da prévia, a tecnologia
ainda não tem um destino final definido neste momento. Por outro lado, o modelo tem o potencial de oferecer recursos do sistema operacional
para apps de edição de imagens e de ilustrações desenvolvidos para iPad ou Mac, por exemplo.

Além disso, é um caminho diferente dos softwares que pegam fotos ou pinturas para transformá-las em vídeos. O Keyframer, na verdade, tem como foco ilustrações, ícones e similares guardados em arquivos de imagem no formato SVG
.

Como funciona o Keyframer

O algoritmo utiliza o GPT-4, modelo de linguagem da OpenAI
, para dar vida a arquivos SVG, que são compostos por vetores e garantem grande flexibilidade para edições sem perder a resolução e qualidade.

No estudo, a interface ainda é bem rudimentar, focada apenas na demonstração dos “motores” da ferramenta. Todavia, ela já dá uma noção de como a solução funcionaria no dia a dia.

Primeiro, o usuário precisa inserir o código da imagem SVG no Keyframer. De acordo com os pesquisadores, como o formato é baseado na linguagem XML
, o modelo usa as descrições do código para identificar os objetos.

Ao enviar o código, basta inserir o prompt (comando do usuário)
com o tipo de animação desejada. No exemplo dado, os pesquisadores utilizaram uma ilustração de um planeta e solicitaram uma animação para alterar a cor do céu.

O processamento é realizado pelo GPT-4, que analisa o pedido feito em linguagem natural e desenvolve o código CSS para animar o arquivo SVG. Depois, a ferramenta oferece a opção para ajustar a animação.

Para conferir os detalhes da pesquisa, acesse o repositório arXiv ( arxiv.org/abs/2402.06071
).

Apple vai focar em IA

O Keyframer ainda é um projeto em desenvolvimento sem expectativa de lançamento. Mesmo assim, é mais uma movimentação da Apple para correr atrás do tempo perdido, depois que Google
, Microsoft
e outras empresas do setor apostaram quase todas as suas fichas em inteligência artificial.

No começo de fevereiro
, o CEO Tim Cook
afirmou que a empresa vai continuar a “investir nessas e em outras tecnologias que moldarão o futuro”, incluindo IA. “Estamos entusiasmados em compartilhar os detalhes do nosso trabalho contínuo nessa área ainda neste ano”, complementou o executivo na época.

De lá para cá, alguns avanços vieram à tona, como o MLLM-Guided Image Editing (MGIE), modelo capaz de transformar texto em imagem
e que segue os passos do DALL-E e o MidJourney.

A expectativa é de que os novos recursos sejam apresentados na WWDC 2024, junto com o futuro iOS 18
.

Leia a matéria no Canaltech
.

Trending no Canaltech:

Fonte