Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!

Check it out →
🔓 پرامپٹ ہیکنگ🟢 دفاعی اقدامات🟢 فلٹرنگ

🟢 فلٹرنگ

نے اپ ڈیٹ کیا۔ سینڈر شلہوف کو August 7, 2024 آخری بار

پرامپٹ ہیکنگ1 کو روکنے کے لیے فلٹرنگ ایک عام تکنیک ہے۔ فلٹرنگ کی چند قسمیں ہیں، لیکن بنیادی خیال یہ ہے کہ ابتدائی پرامپٹ یا آؤٹ پٹ میں الفاظ اور فقرے کی جانچ پڑتال کی جائے جسے بلاک کیا جانا چاہیے۔ آپ اس مقصد کے لیے بلاک لسٹ یا اجازت لسٹ استعمال کر سکتے ہیں2۔ بلاک لسٹ ان الفاظ اور فقروں کی فہرست ہے جن کو مسدود کیا جانا چاہیے، اور اجازت دینے والی فہرست ان الفاظ اور فقروں کی فہرست ہے جن کی اجازت ہونی چاہیے۔

Footnotes

  1. Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks.

  2. Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/

Word count: 0

Get AI Certified by Learn Prompting


Copyright © 2024 Learn Prompting.