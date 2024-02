Ícone de canto para baixo Ícone em forma de ângulo apontando para baixo. Sam Altman, CEO da OpenAI, revelou um modelo de texto para vídeo chamado Sora. Justin Sullivan

Sam Altman mais uma vez surpreendeu a indústria de IA.

Na quinta-feira, a OpenAI revelou seu novo modelo de conversão de texto para vídeo, Sora.

A capacidade de Sora de produzir vídeos de alta resolução chocou a Internet.

Desta vez, não é por causa de A Expulsão de choque do OpenAI Nem é por causa de algo relacionado a isso Bate-papoGPT . Em vez disso, é devido a um novo modelo de IA chamado Sora.

Quinta-feira é Ele apresentou Sora ao mundo cujo nome vem da palavra japonesa para “céu”, pode criar vídeos de até um minuto de texto.

OpenAI diz que seu objetivo é com Sora O objetivo é ensinar a IA a “compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que exigem interação no mundo real”.

Esta é uma maneira um pouco chata de descrever o que o modelo pode realmente fazer. Ele pode criar vídeos em alta definição de tudo, desde a Califórnia durante a corrida do ouro do século 19 até animações 3D semelhantes a uma produção da Dreamworks. Tudo o que ele pede de você é uma simples mensagem de texto.

Vale ressaltar que esta não é a primeira vez que esse tipo de tecnologia ocorre.

A startup Runway, sediada em Nova York, apoiada pelo Google e pela Nvidia, possui uma ferramenta baseada em IA que cria vídeo a partir de texto. Meta tem algo semelhante chamado Vídeo emo . No mês passado, o Google revelou sua versão de texto para vídeo chamada Lumière .

O hype em torno deles é comparável ao de Sora? não exatamente.

Isto ocorre em parte porque a liderança de Altman é propriedade privada OpenAI Isso lhe dá a liberdade de promover essa tecnologia – mesmo que ela ainda esteja sendo testada quanto a qualquer dano. (Nota: o lançamento de Sora é limitado aos “membros do Red Team” que irão testá-lo, bem como a artistas visuais e cineastas selecionados.)

É por isso que o anúncio de Sora nas redes sociais não incluiu apenas um hiperlink para um blog explicando o novo modelo de IA; Envolvia interação direta com as pessoas que o seguiam.

No X, ele recebeu solicitações rápidas de usuários sobre vídeos que queriam assistir criados por Sora.

“Adoraríamos mostrar o que Sora pode fazer. Por favor, responda com legendas para os vídeos que você gostaria de ver e começaremos a criar alguns!” ele escreveu . Os pedidos começaram a chover.

A personalidade da Internet MrBeast pediu a ele um vídeo de Macaco jogando xadrez no parque. Outro pediu para ver Golden retrievers transmitindo na montanha . O CEO da Nothing, Carl Pei, solicitou um vídeo de Will Smith comendo espaguete. Muitas outras pessoas também fizeram isso.

Nikunj Kothari, sócio da Khosla Ventures, destacou o impacto da estratégia de Altman comparando-a com a forma como o Google se envolveu Uma grande atualização em seu modelo de IA, Gemini por meio de uma postagem no blog no mesmo dia em que Sora foi lançado.

Google anuncia algo incrível Ele disse no X , expandindo a “janela de contexto” do Gemini – o número de palavras que um modelo de IA pode processar em torno de um símbolo alvo – em até 1 milhão. É um progresso enorme, mas é um progresso que o Google não oferece como Altman.

“Não há playground, não posso tentar sozinho. Há alguns vídeos impressionantes na postagem do blog, mas eles não foram feitos para mim”, escreveu Kothari no X, destacando que Altman estava “demonstrando” as habilidades de Sora por Receber solicitações de outras pessoas.

“Isso ofuscará em grande parte as conquistas impressionantes do Google. O Google está ficando para trás e precisa 'aderir' para capturar a atenção novamente”, disse Kothari.

No entanto, o hype pode não durar muito.

O lançamento de um modelo de IA capaz de produzir vídeos impressionantes pode representar novas ameaças à indústria criativa, que já levantou preocupações sobre a capacidade da IA ​​generativa de assumir o controlo dos seus empregos. Depois das greves que Hollywood testemunhou no ano passado.

A adoção generalizada desta tecnologia também pode causar estragos nas eleições deste ano se for usada por malfeitores que procuram criar vídeos falsos como Donald Trump ou Joe Biden.

Isto provavelmente também levará a demandas renovadas para que a OpenAI seja transparente sobre os dados que usa para treinar seus modelos, da mesma forma que os modelos de código aberto.

Mas, por enquanto, as pessoas estão acreditando no hype de Altman.