¿Puede DALL-E 2 producir imágenes fotorrealistas?

| |

En primer lugar: sí, DALL-E 2 puede producir imágenes asombrosamente fotorrealistas. Pero la pregunta es: ¿qué es el fotorrealismo y cómo hacemos que DALL-E 2 lo produzca?

Nuestra percepción está sobresaturada por los medios de comunicación. Esperamos “la misma calidad que en la vida real”. Pero eso es una gran mentira, solo entre nosotros. Una buena foto no traslada la realidad de la vida real al papel fotográfico o en formato digital.

Más bien, es una puesta en escena de la realidad: cierto ángulo, cierta iluminación, cierta lente y más. En definitiva, lo que vemos no es la realidad sino una interpretación del fotógrafo.

Con DALL-E 2 obtenemos una interpretación artificial de nuestro mundo. Para mantenerlo simple y superficial aquí, dividamos el fotorrealismo en

  • emulación de la realidad: Enfoque para presentar una imagen de la manera más convincente posible (adaptándose a las expectativas y experiencias visuales de los espectadores)
  • emulación del medio: Meta enfoque para simular diferentes técnicas fotográficas, cámaras y estilos.

Una Lomografía realista no parece fotorrealista, pero debería convencernos de su realismo. Y DALL-E puede hacer eso.

Emulando la realidad: ¿Qué hay en un aviso?

Si entramos en un indicador de contenido sin modificadores y este contenido tiene un carácter relativamente objetivo o figurativo, ya obtenemos imágenes fotorrealistas.

Por ejemplo, si escribimos «Una manzana», obtendremos una serie de imágenes fotorrealistas de manzanas. Nada mas y nada menos.

Publicación Destacada

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Si ahora agregamos el modificador «von Magritte», esta adición cambiará drásticamente todo el carácter del indicador:

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Las cosas se complican cuando intentamos crear imágenes paradójicas que, sin duda, no estaban incluidas en el conjunto de datos de entrenamiento DALL-E, como: Un gato monta en bicicleta.

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Aquí vemos cómo DALL-E intenta reproducir el símbolo del sistema pero falla. Podemos ayudar a la IA agregando un modificador de artista: Un gato monta en bicicleta, una ilustración de Michael Sowa.

El antropomorfismo animal es típico de las ilustraciones de libros, por lo que esta tarea es fácil para DALL-E con el modificador apropiado.

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Por supuesto, todo es posible, y con el mensaje correcto, por ejemplo, podemos crear una foto de un gato montando en bicicleta agregando el modificador de corrección «pero como fotografía»: Un gato en bicicleta, una ilustración de Michael Sowa , pero como una fotografía.

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Ahora casi hemos alcanzado, si no del todo, el deseado fotorrealismo:

  • Creamos un contenido (gato en bicicleta).
  • Le dejamos fantasear con situaciones absurdas e irreales usando un truco de ilustración.
  • Trajimos esta extraña visión de regreso a los reinos fotográficos con el último modificador.

Pero, ¿qué pasa con el fotorrealismo? ¿Con la imitación de la realidad?

La magia de la lente

Los usuarios de DALL-E comparten ideas, observaciones y experiencias en la discordia interna. Uno de los descubrimientos interesantes de la comunidad DALL-E Discord fue este: agregar especificaciones de lentes como modificadores brinda imágenes fotorrealistas adicionales típicas de las sesiones de fotos con estas especificaciones.

El conjunto de datos de entrenamiento para DALL-E estaba excelentemente etiquetado, o incluso los metadatos en los archivos de imagen se leyeron y se tuvieron en cuenta. Aquí hay ejemplos de lentes (gracias Sharif).

Sigma 85mm f/1.4 — bueno para una lente de retrato

Atención: Debido a las reglas de OpenAI, no publicamos retratos humanos fotorrealistas. Pero podemos hacerlo con animales y objetos.

Publicación Destacada

  • Un retrato de un perro en una biblioteca, Sigma 85mm f/1.4
  • Una manzana mordida que cuelga de la rama de un manzano, Sigma 85mm f/1.4
  • Un vaso de plástico en la acera de una gran ciudad, Sigma 85 mm f/1.4
¿Puede DALL-E 2 producir imágenes fotorrealistas?

Así es como se ve el fotorrealismo. Literalmente puedes ver cada pelo en el pelaje del perro. Y el fondo de la biblioteca es un hermoso bokeh.

Sigma 85 mm f/8: menos profundidad de campo y fondo más nítido (menos bokeh)

  • Un retrato de un perro en una biblioteca, Sigma 85mm f/8
  • Una manzana mordida que cuelga de la rama de un manzano, Sigma 85 mm f/8
  • Un vaso de plástico en la acera de una gran ciudad, Sigma 85 mm f/8
¿Puede DALL-E 2 producir imágenes fotorrealistas?

Observe cómo el fondo brilla a través del vaso de plástico transparente.

Sigma 24 mm f/8: ángulo más amplio, distancia focal más corta

  • Un retrato de un perro en una biblioteca, Sigma 24mm f/8
  • Una manzana mordida que cuelga de la rama de un manzano, Sigma 24 mm f/8
  • Un vaso de plástico en la acera de una gran ciudad, Sigma 24 mm f/8
¿Puede DALL-E 2 producir imágenes fotorrealistas?

Sigma 24 mm f/8, velocidad de obturación de 1/10 s: desenfoque de movimiento, velocidad de obturación más lenta

Toma adecuada cuando queremos captar a alguien en movimiento.

  • Perro corriendo en una biblioteca, Sigma 24 mm f/8, velocidad de obturación de 1/10 s
  • Una manzana mordida aletea en la rama de un manzano en un fuerte viento, en desenfoque de movimiento, Sigma 24mm f/8, 1/10 seg.
  • Un vaso de plástico es arrastrado por el viento en la acera de una ciudad, Sigma 24 mm f/8, 1/10 seg.
¿Puede DALL-E 2 producir imágenes fotorrealistas?

Tenga en cuenta que DALL-E es curiosamente reacio a desenfocar la manzana. Necesitamos agregar explícitamente «desenfoque de movimiento» para obtener más movimiento.

Probablemente no había demasiadas imágenes borrosas de manzanas en el conjunto de datos, ya que generalmente las descartamos como disparos fallidos antes de que entren en un conjunto de datos.

Sigma 24 mm f/8 Velocidad de obturación de 1/1000 s (movimiento pero imagen nítida) con velocidad de obturación más lenta.

  • Perro corriendo en una biblioteca, obturador Sigma 24 mm f/8 1/1000 seg.
  • Una manzana mordida capturada en el momento de la caída, Sigma 24 mm f/8, obturador de 1/10 seg.
  • Un vaso de plástico con líquido capturado en el momento de ser volcado por el viento en la acera de una ciudad, Sigma 24 mm f/8, obturador de 1/1000 seg.
¿Puede DALL-E 2 producir imágenes fotorrealistas?

Curiosamente, en el caso de la imagen del perro, observamos un fenómeno de deterioro visual: la imagen es nítida, pero el perro pierde su fotorrealismo.

Mirar los metadatos de una foto podría proporcionar más ideas sobre cómo podemos lograr la calidad deseada. Con estos escenarios arquitectónicos, por ejemplo, podemos crear tomas interiores convincentes:

Interior de un apartamento luminoso con estanterías, cuadros y ventanas con vistas a la megalópolis, Nikon D810 | ISO 64 | Distancia focal 20 mm (Voigtländer 20 mm f3.5) | Apertura f/9 | Tiempo de exposición 1/40 seg (DRI)

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Encuentre la configuración correcta

Podemos obtener más información sobre la configuración de colecciones de fotos populares como Unsplash o Flickr, ya que los metadatos a menudo se incluyen en la descripción de la imagen. Un ejemplo es este maravillosa foto de momiji japonés.

Según Flickr, se utilizaron los siguientes ajustes de cámara +: Herbst-Momiji, Nikon D810, ƒ/2,5, distancia focal: 85,0 mm, tiempo de exposición: 1/800, ISO: 200

Publicación Destacada

Así que intentemos reproducir el tema y la configuración. Y listo:

¿Puede DALL-E 2 producir imágenes fotorrealistas?

O tomémonos una foto con gente bailando, como en esta foto. Gente bailando al anochecer, vista desde atrás, puesta de sol, Canon EOS 1000D, ƒ/3,5, distancia focal: 18,0 mm, velocidad de obturación: 1/5, ISO 400, flash encendido.

¿Puede DALL-E 2 producir imágenes fotorrealistas?

senderos de luz

Si queremos crear una foto nocturna de un coche con rayos de luz, necesitamos trabajar con ISO: Un coche pasa al fotógrafo de noche con luces, visto desde el exterior, 24 mm, f8, 1,6 s, ISO 1000

¿Puede DALL-E 2 producir imágenes fotorrealistas?

¿teleobjetivo? ¡Por supuesto! Este hermoso tiro de luna fue filmado con los siguientes ajustes. Tratemos de hacerlo más interesante y agreguemos un pájaro. Foto de una luna con un pájaro volando en primer plano, Canon EOS Digital Rebel XTi, 100-300 mm Canon f/5.6, velocidad de obturación: 1/160, ISO 400

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Podemos probar infinitamente diferentes lentes, aperturas y valores ISO. Lo más importante es su propia idea e idea de cómo debería verse la imagen.

luz de estudio

Otro gran truco es usar el modificador Studio Light. Comparemos el mensaje «Una manzana» y el mensaje «Una manzana, luz de estudio».

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Cada objeto mundano y aburrido (lo siento, manzana) se vuelve profundo y visualmente impactante.

¿Puede DALL-E 2 producir imágenes fotorrealistas?

Supongo que había tanto material de estudio en el conjunto de datos que DALL-E ahora sabe cómo crear una imagen perfecta.

Lina
Lina García ha escrito sobre tecnología y marketing, cubriendo todo, desde la analítica hasta la realidad virtual, desde 2010. Antes de eso, obtuvo un doctorado en inglés, enseñó a escribir a nivel universitario y lanzó y publicó una revista en formato impreso y digital. Ahora es escritora, editora y consultora de marketing a tiempo completo.