Stable Diffusion 3 Medium é a IA geradora de imagens mais avançada da Stability
A Stability AI anunciou o Stable Diffusion 3 Medium, a primeira versão aberta da nova geração do modelo de IA para gerar imagens. De acordo com a empresa, é o “modelo aberto de texto para imagem mais avançado até o momento”, com dois bilhões de parâmetros.
Os maiores destaques estão no realismo e na habilidade com tipografia. As primeiras imagens reveladas pelo SD3 Medium chamam a atenção pela quantidade de detalhes nos quais a IA normalmente tem dificuldade de acertar, como rostos e mãos, além de proporcionar resultados de alta qualidade.
A arquitetura do Diffusion Transformer permite criar imagens com textos sem erros de digitação ou problemas na formatação das letras, enquanto o modelo é capaz de compreender prompts cada vez mais complexos para ajudar na personalização do resultado.
–
CT no Flipboard
: você já pode assinar gratuitamente as revistas Canaltech no Flipboard do iOS e Android e acompanhar todas as notícias em seu agregador de notícias favorito.
–
Performance otimizada
O modelo de dois bilhões de parâmetros é otimizado para garantir eficiência em computadores pessoais e GPUs de nível empresarial — o Stable Diffusion 3 tem modelos que podem chegar a oito bilhões de parâmetros, por exemplo, então a Stability AI pretende usar o tamanho da versão média como um padrão para conversão de texto para imagem.
A empresa informa que o consumo de VRAM
foi reduzido, o que melhora a performance da ferramenta em placas de vídeo mais limitadas. Além disso, a desenvolvedora contou com a colaboração de NVIDIA e AMD
para otimizar o Stable Diffusion 3 em diferentes dispositivos, como as placas de vídeo da série RTX e APUs da AMD.
Já disponível
A Stability AI anunciou a família de modelos do Stable Diffusion 3 em fevereiro deste ano
, mas ainda não era possível testá-la em diferentes ferramentas. O SD3 Medium está disponível para uso via API
da Stability Platform ou pelos serviços pagos Stable Assistant e Stable Artisan.
A empresa também é responsável por outros modelos de IA generativa, como é o caso do Stable Audio
, capaz de criar músicas com até três minutos de duração a partir de prompts de texto.
Leia a matéria no Canaltech
.
Trending no Canaltech: