Sora

97

Videos hiperrealistas a partir de lenguaje natural

OpenAI's Sora is racing into a brave new world of misinformation: Digital  Photography Review

Sora es un nuevo e innovador sistema de inteligencia artificial desarrollada por OpenAI, la misma compañía que ha introducido otros notables sistemas como ChatGPT. En este caso, Sora destaca como una IA especializada en la generación de vídeos a partir de texto. La dinámica es simple: le comunicas tus preferencias o deseos mediante un comando textual o prompt, y Sora se encargará de materializarlos virtualmente.

Esta tecnología comparte similitudes con los modelos que transforman descripciones en imágenes, aprovechando la base de la tecnología de modelos de lenguaje como GPT. La singularidad de Sora radica en su capacidad para comprender el lenguaje natural, gracias a su entrenamiento para interpretar nuestras expresiones y solicitudes cotidianas de manera efectiva.

Una vez comprende tu solicitud a través de un prompt, Sora se pone en marcha para generar vídeos que representen fielmente lo solicitado, marcando un significativo avance más allá de la mera creación de imágenes estáticas.

Este logro se debe a su entrenamiento extensivo con una gigantesca biblioteca de vídeos, lo que le confiere la habilidad de reconocer movimientos, descripciones y cualquier detalle solicitado. Ya sea hablando de tipos de personas, indumentaria, accesorios o efectos visuales, Sora entenderá y recreará visualmente tus peticiones con impresionante realismo.

Sora te permite generar escenas complejas en las que participen varias entidades o personajes, realizando un tipo de movimiento indicado. El entorno también es una variable a detallar, junto con la vestimenta o las características de los personajes. Para conseguir estos resultados es necesario realizar un prompt acertado. Cuanto más detallada sea la descripción del prompt, más detallada será la imagen que se muestre con respecto a lo que quieras obtener.

De momento, este modelo de inteligencia artificial está en una fase temprana de su desarrollo, y genera vídeos de hasta 60 segundos. Además, la empresa advierte que puede tener algunos problemas a la hora de recrear con exactitud algunas físicas.

OpenAI confirma que Sora formará parte de su catálogo de productos junto a Chat-GPT, DALL-E y Whisper. Con esto, OpenAI está cada vez más cerca de lo que podría ser una inteligencia artificial general (AGI), teniendo ya modelos generativos para texto, imagen, audio y vídeo.

Página web aquí

Si te resultó útil...Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Email this to someone
email