ایک بہترین تصویر بنانے کے لیے بہترین پرامپٹ کا پتہ لگانا ایک خاص چیلنج ہے۔ ایسا کرنے کے طریقوں کی تحقیق اتنی ترقی یافتہ نہیں ہے جتنا کہ ٹیکسٹ پرمپٹنگ۔ یہ اشیاء کی تخلیق میں موروثی چیلنجوں کی وجہ سے ہو سکتا ہے جو بنیادی طور پر ساپیکش ہیں۔ اور اکثر اچھے درستگی میٹرکس کی کمی ہوتی ہے۔ تاہم، خوف نہ کریں، جیسا کہ تصویر اشارہ کرتی ہے۔ کمیونٹی نے مختلف امیج ماڈلز کو فوری طور پر کیسے پیش کیا جائے اس بارے میں بڑی دریافتیں کی ہیں۔
اس گائیڈ میں تصویر کی ترغیب دینے کی بنیادی تکنیکوں کا احاطہ کیا گیا ہے، اور ہم اس کی بھرپور حوصلہ افزائی کرتے ہیں۔ کہ آپ باب کے آخر میں عظیم وسائل کو دیکھتے ہیں۔ مزید برآں، ہم ذیل میں آخر سے آخر تک تصویری اشارہ دینے کے عمل کی ایک مثال فراہم کرتے ہیں۔
یہاں میں ایک مثال کے ذریعے جاؤں گا کہ میں نے اس کورس کے صفحہ اول کے لیے تصاویر کیسے بنائیں۔ میں گہری کمک سیکھنے کے لیے کم پولی اسٹائل کے ساتھ تجربہ کر رہا تھا۔ نیورل ریڈیئنس فیلڈ پروجیکٹ۔ مجھے کم پولی اسٹائل پسند آیا، اور میں اسے استعمال کرنا چاہتا تھا۔ اس کورس کی تصاویر کے لیے۔
میں صفحہ اول پر موجود تصاویر کے لیے ایک خلاباز، ایک راکٹ اور ایک کمپیوٹر چاہتا ہوں۔
میں نے r/StableDiffusion پر، کم پولی امیجز بنانے کے بارے میں بہت سی تحقیق کی۔ اور دیگر سائٹس، لیکن کچھ بھی زیادہ مددگار نہیں مل سکا۔
میں نے صرف DALLE اور مندرجہ ذیل پرامپٹ سے شروع کرنے کا فیصلہ کیا، اور دیکھیں کہ کیا ہوا۔
میں نے سوچا کہ یہ نتائج پہلی کوشش کے لیے کافی اچھے تھے۔ مجھے خاص طور پر پسند آیا نیچے بائیں راکٹ.
اس کے بعد، مجھے اسی انداز میں ایک کمپیوٹر چاہیے تھا:
آخر میں، مجھے ایک خلاباز کی ضرورت تھی! ایسا لگتا ہے کہ یہ اشارہ چال کرتا ہے:
میں نے سوچا کہ دوسرا مہذب تھا۔
اب میرے پاس ایک خلاباز، ایک راکٹ اور ایک کمپیوٹر تھا۔ میں ان سے خوش تھا، تو میں نے انہیں صفحہ اول پر رکھا۔ کچھ دنوں کے بعد اور اپنے دوستوں کے ان پٹ کے بعد میں احساس ہوا کہ انداز صرف یکساں نہیں تھا 😔
میں نے r/StableDiffusion پر کچھ اور تحقیق کی اور لوگوں کو isometric کا لفظ استعمال کرتے پایا۔ میں نے DALLE کی بجائے Stable Diffusion کا استعمال کرتے ہوئے اسے آزمانے کا فیصلہ کیا۔ میں نے یہ بھی محسوس کیا کہ مجھے اپنے پرامپٹ میں مزید ترمیم کرنے والوں کو شامل کرنے کی ضرورت ہے۔ انداز کو محدود کرنے کے لیے۔ میں نے یہ اشارہ آزمایا:
یہ بہت اچھے نہیں تھے، اس لیے میں نے اس کے بجائے راکٹ پر شروع کرنے کا فیصلہ کیا۔
یہ خاص طور پر اچھے نہیں ہیں، لیکن تھوڑا سا ادھر ادھر اعادہ کرنے کے بعد، میں نے ختم کر دیا۔
اب مجھے ایک بہتر لیپ ٹاپ کی ضرورت ہے:
مجھے کچھ متضاد نتائج ملے۔ مجھے نیچے والا دائیں طرف پسند ہے، لیکن میں نے ایک مختلف سمت جانے کا فیصلہ کیا۔
یہ بالکل ٹھیک نہیں تھا۔ آئیے کچھ جادوئی اور چمکدار کرنے کی کوشش کریں۔
مجھے یہ پسند آئے، لیکن میں اسکرین کے بیچ میں پتھر چاہتا تھا۔
یہاں کے آس پاس کہیں، میں نے SD کی سابقہ تصویر رکھنے کی صلاحیت کا استعمال کیا جو مستقبل کی تصاویر کے لیے کچھ اثر و رسوخ فراہم کرتا ہے۔ اور اس طرح میں یہاں پہنچا:
آخر میں، میں خلاباز کے پاس تھا۔
اس موقع پر، میں اپنی تینوں تصویروں کے استعمال کے لیے انداز کی مستقل مزاجی سے کافی خوش تھا۔ ویب سائٹ پر میرے لیے اہم نکتہ یہ تھا کہ یہ ایک بہت ہی تکراری، تحقیقی بھاری عمل تھا، اور مجھے اپنی توقعات اور خیالات کو تبدیل کرنا پڑا جب میں نے مختلف اشارے اور ماڈلز کے ساتھ تجربہ کیا۔
Parsons, G. (2022). The DALLE 2 Prompt Book. https://dallery.gallery/the-dalle-2-prompt-book/ ↩
Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2021). High-Resolution Image Synthesis with Latent Diffusion Models. ↩
Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., & Chen, M. (2022). Hierarchical Text-Conditional Image Generation with CLIP Latents. ↩