[title]
La inteligencia artificial (IA) avanza a una velocidad que da miedo y, este viernes 16 de febrero, Open AI, los creadores de ChatGPT, han anunciado otra herramienta que revolucionará el sector. La empresa ha creado Sora, el primer generador de vídeos de la historia a través de texto que funciona como una suerte de ChatGPT para crear vídeos hiperrealistas de un minuto. Su funcionamiento es muy sencillo; el usuario debe pedir por escrito qué escenario o situación quiere recrear y Sora lo hace no solo según lo que la persona ha descrito en el texto, sino que también tiene en cuenta como estos paisajes, personajes y detalles están representados en el mundo real.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Según ha anunciado Open AI en un comunicado, su objetivo es "enseñar a la IA a comprender y simular el mundo físico en movimiento con el propósito de crear modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real". Por el momento, la herramienta solo está disponible para profesionales que evalúan áreas peligrosas, así como algunos artistas visuales, diseñadores y cineastas para poder valorar la utilidad para los profesionales creativos.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Sora está programada para comprender el profundo conocimiento del lenguaje para crear situaciones con precisión y generar personajes capaces de transmitir emociones y recrear con la máxima precisión posible los de una persona del mundo físico. Además, el modelo también puede generar varias escenas en un mismo vídeo que tienen continuidad entre sí y crean una pequeña historia con el mismo estilo visual.
Un modelo de prueba y error
Aunque la herramienta ha significado un antes y un después en el mundo de la IA, los propios creadores aseguran que todavía tiene "debilidades". En algunos casos, es posible que Sora no simule con precisión una escena compleja o que no comprenda los casos específicos de causa y error, "puede que en una escena la persona dé un mordisco en una galleta, pero luego no tenga la marca del mordisco". También puede mostrar dificultades de orientación con la izquierda y la derecha a la hora de seguir una trayectoria de cámara específica.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Por el momento, todavía no hay una fecha oficial para que Sora esté disponible dentro de los productos de Open AI, ya que la empresa no ha terminado de diseñar algunas herramientas como las necesarias para detectar contenido engañoso y otras relacionadas con la seguridad de los usuarios por evitar, entre otros, que se soliciten escenas de violencia extrema y contenido sexual.