Thumbnail

O novo modelo é capaz de gerar vídeos de até um minuto a partir de comandos textuais ou prompts. Crédito: Reprodução.

Sora

OpenAI lança o Sora, modelo de inteligência artificial que cria vídeos realistas

GazzConecta
16/02/2024 11:19
A OpenAI, criadora do ChatGPT, lançou nesta quinta-feira (15) o Sora, um novo modelo de inteligência artificial capaz de gerar vídeos de até um minuto a partir de comandos textuais ou prompts. O modelo, que ainda não está disponível ao público, chama a atenção pela qualidade realista das imagens geradas conforme as instruções dos usuários.
A empresa concedeu acesso ao Sora a um time de especialistas para avaliar seu desempenho, além de disponibilizar acesso a artistas visuais, designers e cineastas para receber insights sobre como melhorar sua utilidade para profissionais criativos.
O Sora é capaz de criar cenas complexas com múltiplos personagens, diferentes tipos de movimento e detalhes precisos, não apenas compreendendo as solicitações dos usuários, mas também considerando como esses elementos existem no mundo físico.
No entanto, a OpenAI reconhece que o modelo atual possui algumas limitações, como dificuldades em simular com precisão a física de cenas complexas e compreender instâncias específicas de causa e efeito. "Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito pode não ter uma marca de mordida", especifica o comunicado da OpenAI no seu site oficial.
Para garantir a segurança, a OpenAI está implementando medidas como a colaboração com especialistas e o desenvolvimento de ferramentas de detecção de conteúdo enganoso.
Como exemplo, a empresa cita que utilizará seu classificador para verificar e rejeitar as solicitações de entrada de texto que violarem as políticas de uso dos produtos, como aquelas que solicitem violência extrema, conteúdo sexual, imagens odiosas, semelhança com celebridades ou propriedade intelectual de outros. 
"Também desenvolvemos classificadores de imagem robustos que são usados para revisar os quadros de cada vídeo gerado para garantir que ele esteja em conformidade com nossas políticas de uso antes de ser mostrado ao usuário", continua o comunicado.
O Sora utiliza uma arquitetura de transformador semelhante aos modelos GPT, representando vídeos e imagens como coleções de unidades de dados menores chamadas patches, permitindo uma ampla gama de treinamento em diferentes durações, resoluções e proporções de aspecto.
Além disso, o Sora se baseia em pesquisas anteriores em modelos DALL·E e GPT, usando a técnica de recaptioning do DALL·E 3 para seguir com fidelidade as instruções dos usuários.
Para a criação do vídeo de um bando de mamutes correndo sobre a neve, a OpenAI deu como exemplo, na sua conta do X, o seguinte prompt:
"Vários gigantes mamutes peludos se aproximam, atravessando uma pradaria nevada, seus longos pelos felpudos sopram levemente ao vento enquanto caminham, árvores cobertas de neve e dramáticas montanhas com picos nevados ao longe, luz da tarde com nuvens esvoaçantes e um sol alto cria um brilho quente, a vista da câmera baixa é impressionante, capturando o grande mamífero peludo com bela fotografia e profundidade de campo."
De acordo com o comunicado de lançamento, o modelo representa um avanço significativo na capacidade de entender e simular o mundo real, sendo considerado um marco importante no caminho em direção às capacidades da IA geral.

E vem aí o GazzSummit

O GazzSummit Agro e Foodtechs é uma iniciativa pioneira do GazzConecta para debater o cenário de inovação em dois setores de grande relevância para o país. O evento será realizado nos dias 8 e 9 de maio de 2024 com o propósito de conectar e promover conhecimento para geração de novos negócios, discussão de problemas e desafios, além de propor soluções para o setor.
O GazzSummit promove a disseminação de tecnologias e práticas de inovação que possam levar a cadeira produtiva ainda mais longe. Uma super estrutura espera os participantes, que poderão conferir mais de 30 palestrantes e mais de 300 empresas. O evento vai reunir players importantes do ecossistema como grandes empresas, cooperativas, produtores, entidades públicas, startups e inovadores. Garanta já a sua inscrição no site.

Enquete

A inteligência artificial está transformando rapidamente aspectos da sociedade. Como você percebe o impacto da IA em nossas vidas?

Newsletter

Receba todas as melhores matérias em primeira mão