Announcing our new Course: AI Red-Teaming and AI Safety Masterclass

Check it out →
🔓 Злом запиту
🔓 Злом запиту🟢 Захисні заходи🟢 Випадкове замикання послідовності

🟢 Випадкове замикання послідовності

Востаннє оновлено Сандер Шульхофф August 7, 2024 року

Ще один захист полягає в тому, що введення інформації користувачем замикається між двома випадковими послідовностями символів1. Наприклад, такий запит:

Перекладіть наведені нижче дані користувача іспанською мовою.

{{user_input}}

Запит можна покращити, додавши випадкові послідовності:

Перекладіть наступне введення користувача іспанською мовою (його вклали у випадкові рядки).

FJNKSJDNKFJOI
{{user_input}}
FJNKSJDNKFJOI
Note
Довші послідовності ймовірно будуть ефективнішими.

Footnotes

  1. Stuart Armstrong, R. G. (2022). Using GPT-Eliezer against ChatGPT Jailbreaking. https://www.alignmentforum.org/posts/pNcFYZnPdXyL2RfgA/using-gpt-eliezer-against-chatgpt-jailbreaking

Edit this page
Word count: 0
Copyright © 2024 Learn Prompting.