Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!

Check it out →
💪 پرامپٹ ٹیوننگقابل تشریح نرم پرامپٹ

قابل تشریح نرم پرامپٹ

نے اپ ڈیٹ کیا۔ سینڈر شلہوف کو August 7, 2024 آخری بار

نرم پرامپٹس ویکٹر کی ایک ترتیب ہیں جو الفاظ میں کسی بھی حقیقی ٹوکن سے مطابقت نہ رکھیں۔ یہ مشکل بناتا ہے پرامپٹ کی تشریح کرنے کے لیے۔ تاہم، ہم اب بھی ایسا کرنے کی کوشش کر سکتے ہیں۔ ویکٹر کو ذخیرہ الفاظ میں قریب ترین ٹوکن پر نقشہ بنا کر۔ تاہم، متوقع نرم پرامپٹ اکثر بے راہ ہوتے ہیں۔ وہ حل کر سکتے ہیں کام اچھی طرح سے کرتا ہے، لیکن ذخیرہ الفاظ1 میں صوابدیدی ٹوکنز کے لیے پیش کیا جاتا ہے۔

مثال کے طور پر، اگر ہم ریاضی کے سوالات جیسے GSM8K2 پر تربیت دے رہے ہیں، ہم فوری طور پر شروع کر سکتے ہیں 'آپ ایک ریاضی دان ہیں۔ اس سوال کو حل کریں:''۔ اگر ہم اس پر فوری ٹیوننگ کرتے ہیں، تو اسے دوبارہ ٹوکن اسپیس میں پروجیکٹ کریں، ہم کر سکتے ہیں۔ کوئی ایسی بے ہودہ چیز چھوڑ دیں جیسے 'ایک بس ایک بس ہے۔ یہاں کام کریں:''۔ یہ اکثر ہوتا ہے۔ اس صورت میں کہ نرم پرامپٹ جو اس بے ہودہ پرامپٹ کو نقشہ بناتا ہے کام پر بہتر کارکردگی فراہم کر سکتا ہے!

بے راہ روی کا مفروضہ

Khashabi et al.1 یہ ناقابل یقین مفروضہ تجویز کرتے ہیں۔ اس کا کہنا ہے جس نے ایک کام دیا ہے، کسی بھی مجرد ہدف کے پرامپٹ کے لیے، وہاں موجود ہے۔ کام پر اچھی کارکردگی کا مظاہرہ کرتے ہوئے، مسلسل فوری طور پر اس پر پروجیکٹ کرتا ہے۔

اس کا مطلب ہے کہ 1000 مختلف کاموں کو دیکھتے ہوئے، 1000 مختلف موجود ہیں۔ پرفارمنٹ نرم پرامپٹس (ہر کام کے لیے ایک) جو ایک ہی مجرد پرامپٹ پر نقشہ بناتے ہیں۔

تشریحی خطرات

وہ متعدد خطرات کو اجاگر کرنے کے لیے Waywardness Hypothesis کا استعمال کرتے ہیں۔ نرم پرامپٹ کی تشریح کرتے وقت۔ خاص طور پر، ایک نرم فوری طور پر پیش کیا جا سکتا ہے ایک مجرد اشارہ جو گمراہ کن ارادہ دیتا ہے۔

ریزیومیز کی درجہ بندی کے لیے نرم پرامپٹ پر غور کریں۔ جب ٹوکن اسپیس میں پیش کیا جائے تو یہ ہوسکتا ہے۔ بنو 'آپ مینیجر کی خدمات حاصل کرتے ہیں۔ اچھے ریزیوموں کی درجہ بندی کریں:۔ یہ مہذب لگتا ہے، شاید تھوڑا سا کمی گرامریت میں تاہم، ٹوکن 'اچھے' کا 'سفید' کے ٹوکن جیسا پروجیکشن ہوسکتا ہے، اور وہاں پرامپٹ میں مضمر تعصب موجود ہو سکتا ہے۔ تھوڑا سا مختلف پروجیکشن طریقہ استعمال کرتے ہوئے، ہم 'آپ کے مینیجر کی خدمات حاصل کرنے کے ساتھ ختم ہوسکتے ہیں۔ رینک وائٹ ریزیومز:۔ یہ ظاہر ہے کافی ہے۔ مختلف، اور اہم مضمرات ہو سکتے ہیں۔

اسی طرح ایک باقاعدہ مجرد پرامپٹ کی تشریح کرنے کے لیے، ہمیں انتہائی ہونا چاہیے۔ ان تعصبات سے آگاہ ہوں جو پرامپٹ میں موجود ہو سکتے ہیں۔ ہمیں خاص طور پر ہونا چاہئے۔ نرم پرامپٹ سے محتاط رہیں، کیونکہ ان کی تشریح کرنا زیادہ مشکل ہے۔

Footnotes

  1. Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. 2

  2. Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems.

Word count: 0

Get AI Certified by Learn Prompting


Copyright © 2024 Learn Prompting.