La empresa OpenAI, creadora de ChatGPT y del generador de imágenes DALL-E, presentó un nuevo desarrollo que eleva todavía más la apuesta por los contenidos sintéticos. La compañía mostró los resultados que ofrece "Sora", un generador que utiliza Inteligencia Artificial (IA) videos con estética realista y de hasta un minuto de duración a partir de instrucciones en texto.
La compañía californiana aclaró que esta novedosa plataforma, creada basándose en las búsquedas anteriores en DALL-E y ChatGPT, está todavía en fase de prueba. Sin embargo, para entusiasmar a sus clientes, compartió este jueves algunos ejemplos de videos hiperrealistas generados a partir de sus direcciones textuales.
"Presentamos a Sora, nuestro modelo de texto a video. Sora puede crear videos de hasta 60 segundos con escenas altamente detalladas, un movimiento de cámara complejo y múltiples personajes con emociones vibrantes. El programa puede generar videos de un minuto de duración, con calidad visual y respetando la demanda del usuario", indicó OpenAI en su sitio web.
El director ejecutivo de la empresa, Sam Altman, consignó que por el momento otorgan "acceso" a un número limitado de "artistas visuales, diseñadores y cineastas", para obtener comentarios sobre "cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos".
Con esta propuesta, la compañía busca "enseñar a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real".
"Sora tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes. También puede crear múltiples tomas dentro de un solo video generado, en las que persisten con precisión los personajes y el estilo visual", describió.
Además, OpenAI consignó que la plataforma permite "crear un video a partir de una imagen fija" y "alargar videos ya existentes".
Así se ven los videos generados por IA
A través de la red social X, tanto OpenAI como Altman compartieron ejemplos de videos generados a través del modelo Sora, junto con las instrucciones en texto para cada uno de los resultados. "La hermosa y nevada ciudad de Tokio está llena de vida. La cámara se mueve por las bulliciosas calles de la ciudad, siguiendo a varias personas disfrutando del hermoso clima nevado y comprando en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto con copos de nieve": Introducing Sora, our text-to-video model. "Un tráiler de la película que presenta las aventuras del hombre espacial de 30 años con un casco de motocicleta tejido de lana roja, cielo azul, desierto salado, estilo cinematográfico, filmado en película de 35 mm, colores vivos": Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB "Una mujer elegante camina por una calle de Tokio llena de luces de neón cálidas y luminosas y carteles animados de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. ella usa gafas de sol y lápiz labial rojo. ella camina con confianza y casualidad. la calle está húmeda y reflectante, creando un efecto espejo de las luces de colores. muchos peatones caminan": Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq "Una carrera de bicicletas en el océano con diferentes animales como atletas montando bicicletas con vista de cámara de drones": https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX "Una carrera de drones futurista al atardecer en el planeta marte": https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b En tanto, OpenAI advirtió que el "actual modelo" de la plataforma presenta "defectos", como una confusión entre izquierda y derecha, o la imposibilidad de mantener una continuidad visual durante toda la extensión del video. "Una persona puede comer una galleta, pero luego, la galleta puede no exhibir una mordedura", ejemplificaron desde la empresa. Por otra parte, la compañía afirmó que la seguridad es un asunto clave en este desarrollo, y afirmó que organizará simulaciones con usuarios a los que se les pedirá tratar de provocar errores o crear contenido inapropiado, para poder definir mejor los límites de la plataforma. "Involucraremos a tomadores de decisiones políticas, educadores y artistas en el mundo para comprender sus preocupaciones e identificar los casos positivos de uso de esta nueva tecnología", aseguró OpenAI.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Las fallas de Sora