Announcing our new Course: AI Red-Teaming and AI Safety Masterclass

Check it out →
🔓 提示駭客攻擊🟢 防禦措施🟢 過濾

🟢 過濾

最後更新於August 7, 2024,作者:桑德舒爾霍夫

過濾是防止提示駭客攻擊的常用技術(@kang2023exploiting)。過濾有幾種類型,但基本思想是檢查初始提示或輸出中應阻止的單字和短語。為此,您可以使用封鎖清單或允許清單1。封鎖列表是應封鎖的單字和短語的列表,允許列表是應允許的單字和短語的列表。

Footnotes

  1. Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/

Edit this page
Word count: 0
Copyright © 2024 Learn Prompting.