جائزہ
فوری انجیکشن کو روکنا انتہائی مشکل ہوسکتا ہے، اور اس کے خلاف کچھ مضبوط دفاع موجود ہیں۔ تاہم، کچھ کامن سینس ہیں حل. مثال کے طور پر، اگر آپ کی ایپلیکیشن کو فری فارم ٹیکسٹ آؤٹ پٹ کرنے کی ضرورت نہیں ہے، تو ایسے آؤٹ پٹ کی اجازت نہ دیں۔ پرامپٹ کا دفاع کرنے کے بہت سے مختلف طریقے ہیں۔ ہم یہاں کچھ سب سے عام بات کریں گے۔
یہ باب اضافی عام فہم حکمت عملیوں کا احاطہ کرتا ہے جیسے الفاظ کو فلٹر کرنا۔ اس میں فوری بہتری کی حکمت عملیوں کا بھی احاطہ کیا گیا ہے (ہدایت کا دفاع، پوسٹ پرمپٹنگ، صارف کے ان پٹ کو منسلک کرنے کے مختلف طریقے، اور XML ٹیگنگ)۔ آخر میں، ہم آؤٹ پٹ کا جائزہ لینے کے لیے LLM استعمال کرنے اور کچھ اور ماڈل مخصوص طریقوں پر تبادلہ خیال کرتے ہیں۔
🟢 فلٹرنگ
🟢 انسٹرکشن ڈیفنس
🟢 ایل ایل ایم کی الگ تشخیص
🟢 دیگر نقطہ نظر
🟢 پوسٹ پرمپٹنگ
🟢 بے ترتیب ترتیب انکلوژر
🟢 سینڈوچ ڈیفنس
🟢 XML ٹیگنگ
Footnotes
-
Crothers, E., Japkowicz, N., & Viktor, H. (2022). Machine Generated Text: A Comprehensive Survey of Threat Models and Detection Methods. ↩
-
Goodside, R. (2022). GPT-3 Prompt Injection Defenses. https://twitter.com/goodside/status/1578278974526222336?s=20&t=3UMZB7ntYhwAk3QLpKMAbw ↩