پرامپٹ ہیکنگ کو روکنے کے لیے فلٹرنگ ایک عام تکنیک ہے۔ فلٹرنگ کی چند قسمیں ہیں، لیکن بنیادی خیال یہ ہے کہ ابتدائی پرامپٹ یا آؤٹ پٹ میں الفاظ اور فقرے کی جانچ پڑتال کی جائے جسے بلاک کیا جانا چاہیے۔ آپ اس مقصد کے لیے بلاک لسٹ یا اجازت لسٹ استعمال کر سکتے ہیں۔ بلاک لسٹ ان الفاظ اور فقروں کی فہرست ہے جن کو مسدود کیا جانا چاہیے، اور اجازت دینے والی فہرست ان الفاظ اور فقروں کی فہرست ہے جن کی اجازت ہونی چاہیے۔
Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks. ↩
Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/ ↩