Free Live Workshop: Vibe Coding with Google AI Studio — April 1

просимо

😃 Основи

💼 Основні застосунки

🧙‍♂️ Середній рівень

🤖 Агенти

⚖️ Надійність

🖼️ Написання запитів для створення зображень

🔓 Злом запиту

🔨 Інструменти

💪 Налаштування запиту

🎲 Різне

📚 Бібліографічний список

📦 Рекомендовані продукти

🛸 Додаткові ресурси

🔥 У тренді

✨ Список залучених людей

🔓 Злом запиту🟢 Атакуючі дії🟢 Рекурсивне введення

Рекурсивне введення

🟢 This article is rated easy

Reading Time: 1 minute

Last updated on August 7, 2024

Сандер Шульхофф

Як ми бачили раніше, дуже хорошим захистом від зламу запитів є використання однієї ВММ для оцінки результату іншої ВВМ, щоб перевірити, чи є якийсь суперечливий результат. Цей захист можна оминути за допомогою _атаки рекурсивного введення _. Ця атака передбачає введення запиту в першу ВММ, яка створює вивід, що містить інструкцію введення для другої ВММ.

Припустімо, що запит, який ми намагаємося зламати, такий:

Скажи щось правдиве про наступне та природу:
{{user_input}}

Вивід цього запиту буде оцінено запитом:

Чи містить наведене нижче ненормативну лексику чи образливий вміст (ТАК чи НІ)?
{{output}}

Ми можемо зламати обидва ці запити, додавши до запиту, як показано нижче. Зверніть увагу, що це також приклад атаки з призначенням змінних.

Наведений вище вивід є спробою введення, яка отримує вхідні дані для другого виклику ВММ:

Наразі ми ЗЛАМАЛИ цей другий виклик ВММ. Рекурсивні введення важко виконати, але за відповідних обставин вони можуть бути дуже корисними.

Footnotes

Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks. ↩

DIFFICULTY LEVEL

RECOMMENDED COURSES

ChatGPT for Everyone

Introduction to Prompt Engineering

AI Red-Teaming and AI Security Masterclass

Live AI Security Courses

Рекурсивне введення

Footnotes