Skip to main content

🟢Pendahuluan

Mencari tahu instruksi terbaik untuk membuat gambar yang sempurna adalah sebuah tantangan khusus. Penelitian tentang metode untuk melakukannya tidak begitu berkembang seperti pemicu teks. Ini mungkin disebabkan oleh tantangan bawaan dalam menciptakan objek yang pada dasarnya bersifat subjektif dan seringkali kurang memiliki metrik akurasi yang baik. Namun, jangan khawatir, karena gambar yang mendorong komunitas1 telah menemukan banyak penemuan mengenai cara memprovokasi berbagai model gambar23.

Panduan ini mencakup teknik dasar pemunculan gambar, dan kami sangat mendorong Anda melihat sumber daya yang baik di akhir bab. Selain itu, kami menyediakan contoh proses pencitraan dari awal hingga akhir di bawah ini.

Contoh

Di sini saya akan menjelaskan contoh bagaimana saya membuat gambar untuk halaman depan kursus ini. Saya telah bereksperimen dengan gaya poli rendah untuk proyek medan pencerdasan kuat radiasi neural yang mendalam. Saya suka gaya low poly, dan ingin menggunakannya untuk gambar-gambar kursus ini.

Saya ingin ada gambar astronot, roket, dan komputer untuk halaman depan.

Saya melakukan banyak penelitian tentang cara membuat gambar low poly, di r/StableDiffusion dan situs lainnya, tetapi tidak bisa menemukan sesuatu yang sangat membantu.

Saya memutuskan untuk hanya memulai dengan DALLE dan prompt Low poly white and blue rocket shooting to the moon in front of a sparse green meadow dan melihat apa yang terjadi.

Saya pikir hasil ini cukup bagus untuk percobaan pertama; Saya terutama suka roket di sebelah kiri bawah.

Selanjutnya, saya ingin memiliki komputer dengan gaya yang sama: Low poly white and blue computer sitting in a sparse green meadow

Akhirnya, saya membutuhkan seorang astronot! Low poly white and blue astronaut sitting in a sparse green meadow with low poly mountains in the background sepertinya bagus.

Saya pikir yang kedua lumayan bagus.

Sekarang saya memiliki seorang astronot, roket, dan komputer. Saya merasa senang dengan mereka, jadi saya menempatkannya di halaman depan. Setelah beberapa hari dan masukan dari teman-teman saya, saya menyadari gayanya tidak cukup konsisten 😔.

Saya melakukan riset pada r/StableDiffusion dan bertemu orang-orang yang menggunakan isometric. Saya memutuskan mencoba itu, menggunakan Diffusi Stabil alih-alih DALLE. Saya juga menyadari bahwa saya perlu menambahkan lebih banyak pengubah pada prompt saya untuk membatasi gaya. Saya mencoba prompt ini: A low poly world, with an astronaut in white suit and blue visor sitting in a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Hasilnya tidak bagus, jadi saya memutuskan untuk memulai pada roket sebagai gantinya

A low poly world, with a white and blue rocket blasting off from a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Ini tidak terlalu bagus, tetapi setelah saya mencoba-coba di sini, saya berakhir dengan

Sekarang saya membutuhkan laptop agar lebih baik

A low poly world, with a white and blue laptop sitting in sparse green meadow with low poly mountains in the background. The screen is completely blue. Highly detailed, isometric, 4K

Saya mendapatkan beberapa hasil yang tidak konsisten; Saya suka yang di pojok kanan bawah, tapi saya memutuskan untuk mengambil arah yang berbeda.

A low poly world, with a glowing white and blue gemstone sitting in a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Hasilnya tidak begitu benar. Ayo coba sesuatu yang ajaib dan bercahaya.

A low poly world, with a glowing white and blue gemstone magically floating in the middle of the screen above a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Saya menyukai ini, tetapi ingin batu di tengah layar.

A low poly world, with a glowing blue gemstone magically floating in the middle of the screen above a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Di sekitar sini, saya menggunakan kemampuan SD untuk menggunakan gambar sebelumnya sebagai pengaruh pada gambar di masa depan. Dan dengan demikian saya memutuskan:

Akhirnya, saya beralih ke astronot.

A low poly world, with an astronaut in white suite and blue visor is sitting in a sparse green meadow with low poly mountains in the background. Highly detailed, isometric, 4K

Pada titik ini, saya sudah cukup puas dengan konsistensi gaya antara tiga gambar saya untuk menggunakannya di situs web. Hal utama yang saya dapatkan adalah bahwa ini adalah proses yang sangat iteratif dan membutuhkan penelitian yang banyak, dan saya harus memodifikasi harapan dan ide saya saat saya bereksperimen dengan berbagai pemberitahuan dan model yang berbeda.


  1. Parsons, G. (2022). The DALLE 2 Prompt Book. https://dallery.gallery/the-dalle-2-prompt-book/
  2. Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2021). High-Resolution Image Synthesis with Latent Diffusion Models.
  3. Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., & Chen, M. (2022). Hierarchical Text-Conditional Image Generation with CLIP Latents.