Saltar al contenido principal

馃煝 Introducci贸n

Encontrar el mejor est铆mulo para crear una imagen perfecta es un desaf铆o particular. La investigaci贸n sobre m茅todos para hacerlo no est谩 tan desarrollada como la de la creaci贸n de textos. Esto puede deberse a los desaf铆os inherentes en la creaci贸n de objetos que son fundamentalmente subjetivos y a menudo carecen de m茅tricas de precisi贸n. Sin embargo, no tem谩is, ya que la comunidad de creaci贸n de im谩genes con est铆mulos1 ha hecho grandes descubrimientos sobre c贸mo estimular varios modelos de im谩genes23.

Esta gu铆a cubre t茅cnicas b谩sicas de estimulaci贸n de im谩genes, y recomendamos encarecidamente que consult茅is los recursos excelentes al final del cap铆tulo. Adem谩s, proporcionamos un ejemplo del proceso de estimulaci贸n de extremo a extremo de la imagen a continuaci贸n.

Ejemplo

Aqu铆 voy a mostrar un ejemplo de c贸mo cre茅 las im谩genes para la p谩gina principal de este curso. Hab铆a estado experimentando con el estilo de baja poli para un proyecto de campo de radiaci贸n neuronal de refuerzo profundo. Me gust贸 el estilo de baja poli y quer铆a usarlo para las im谩genes de este curso.

Quer铆a un astronauta, un cohete y una computadora para las im谩genes de la p谩gina principal.

Investigu茅 mucho sobre c贸mo crear im谩genes de baja poli en r/StableDiffusion y otros sitios, pero no encontr茅 nada muy 煤til.

Decid铆 empezar con DALLE y el est铆mulo Cohete blanco y azul Low poly disparando a la luna delante de un prado verde disperso y ver qu茅 pasaba.

Pens茅 que estos resultados eran bastante decentes para un primer intento; especialmente me gust贸 el cohete de la parte inferior izquierda.

A continuaci贸n, quer铆a una computadora en el mismo estilo: Computadora blanca y azul de baja poli sentada en un prado verde disperso

Finalmente, necesitaba un astronauta! Astronauta de baja poligonizaci贸n en blanco y azul sentado en un prado verde escaso con monta帽as de baja poligonizaci贸n en el fondo pareci贸 funcionar.

Pens茅 que el segundo era decente.

Ahora ten铆a un astronauta, un cohete y una computadora. Estaba contento con ellos, as铆 que los puse en la p谩gina principal. Despu茅s de unos d铆as y con la opini贸n de mis amigos, me di cuenta de que el estilo simplemente no era consistente 馃様.

Investigu茅 un poco m谩s en r/StableDiffusion y encontr茅 personas que usaban la palabra isom茅trico. Decid铆 probarlo, usando Stable Diffusion en lugar de DALLE. Tambi茅n me di cuenta de que necesitaba agregar m谩s modificadores a mi prompt para limitar el estilo. Intent茅 con este prompt: Un mundo de baja poligonizaci贸n, con un astronauta con traje blanco y visor azul sentado en una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

Estos no eran geniales, as铆 que decid铆 empezar con el cohete en su lugar.

Un mundo de baja poligonizaci贸n, con un cohete blanco y azul despegando desde una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

Estos no son particularmente buenos, pero despu茅s de un poco de iteraci贸n, termin茅 con esto:

Ahora necesitaba una mejor laptop.

Un mundo de baja poligonizaci贸n, con una laptop blanca y azul sentada en una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. La pantalla es completamente azul. Altamente detallado, isom茅trico, 4K

Obtuve algunos resultados inconsistentes; Me gust贸 el de la esquina inferior derecha, pero decid铆 ir en una direcci贸n diferente.

Un mundo de baja poligonizaci贸n, con una gema blanca y azul que brilla sentada en una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

Esto no estaba del todo bien. Intentemos algo m谩gico y brillante.

Un mundo de baja poligonizaci贸n, con una gema blanca y azul brillante que flota m谩gicamente en el centro de la pantalla sobre una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

Me gustaron estas im谩genes, pero quer铆a que la piedra estuviera en el centro de la pantalla.

Un mundo de baja poligonizaci贸n, con una piedra preciosa de color azul brillante flotando m谩gicamente en el centro de la pantalla sobre una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

En alg煤n lugar por aqu铆, utilic茅 la capacidad de SD para que una imagen anterior influyera en im谩genes futuras. Y as铆 llegu茅 a:

Finalmente, necesitaba un astronauta.

Un mundo de baja poligonizaci贸n, con un astronauta con traje blanco y visor azul sentado en una pradera verde escasa con monta帽as de baja poligonizaci贸n en el fondo. Altamente detallado, isom茅trico, 4K

En este punto, estaba lo suficientemente satisfecho con la consistencia de estilo entre mis tres im谩genes como para usarlas en el sitio web. Lo m谩s importante para m铆 fue que este fue un proceso muy iterativo y que requiri贸 mucha investigaci贸n, y tuve que modificar mis expectativas e ideas mientras experimentaba con diferentes consignas y modelos.


  1. Parsons, G. (2022). The DALLE 2 Prompt Book. https://dallery.gallery/the-dalle-2-prompt-book/
  2. Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2021). High-Resolution Image Synthesis with Latent Diffusion Models.
  3. Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., & Chen, M. (2022). Hierarchical Text-Conditional Image Generation with CLIP Latents.