Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!

Check it out →
🔓 Злом запиту🟢 Захисні заходи🟢 Фільтрування

🟢 Фільтрування

Востаннє оновлено Сандер Шульхофф August 7, 2024 року

Фільтрування є поширеною технікою для запобігання кібератакам на текстовий запит1. Існує кілька типів фільтрації, але основна ідея полягає в тому, щоб перевірити слова та фрази в початковому запиті або вихідних даних, які слід заблокувати. Для цього можна використовувати чорний або білий списки2. Чорний список — це список слів і фраз, які слід заблокувати, а білий список — це список слів і фраз, які слід дозволити.

Footnotes

  1. Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks.

  2. Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/

Word count: 0

Get AI Certified by Learn Prompting


Copyright © 2024 Learn Prompting.