просимо
😃 Основи
💼 Основні застосунки
🧙‍♂️ Середній рівень
🤖 Агенти
⚖️ Надійність
🖼️ Написання запитів для створення зображень
🔓 Злом запиту
🔨 Інструменти
💪 Налаштування запиту
🎲 Різне
📙 Словниковий довідник
📚 Бібліографічний список
📦 Рекомендовані продукти
🛸 Додаткові ресурси
🔥 У тренді
✨ Список залучених людей
💪 Налаштування запитуІнтерпретовані м'які запити

Інтерпретовані м'які запити

Reading Time: 1 minute
Last updated on August 7, 2024

Сандер Шульхофф

М'які запити – це послідовність векторів, які не відповідають жодним токенам у словнику. Це ускладнює інтерпретацію запиту. Та попри це ми все ж можемо спробувати зіставити вектори з найближчими токенами у словнику. Хоч спроєктовані м'які запити часто бувають непостійними, вони можуть непогано вирішити завдання, але проєктуються такі запити на довільні токени у словнику.

Наприклад, якщо ми тренуємося на таких математичних завданнях, як GSM8K, ми можемо почати із запиту You are a mathematician. Solve this question:. Якщо ми налаштуємо запит на нього, а потім спроєктуємо назад у простір токенів, у нас може вийти нісенітниця, наприклад: A bus is a bus. Do thing here:. Часто трапляється так, що м'які запити, подібні до цього безглуздого, можуть забезпечити кращу продуктивність при виконанні завдання!

Гіпотеза непостійності

Хашабі та інші пропонують цю неймовірну гіпотезу. Згідно з нею, для будь-якого дискретного цільового запиту існує постійний запит, який проєктується на нього, успішно виконуючи завдання.

Це означає, що для 1000 різних завдань існує 1000 різних м'яких запитів (по одному для кожного), які зіставляються з тим самим дискретним запитом.

Ризики інтерпретації

Вони використовують гіпотезу непостійності, щоб висвітлити низку ризиків, які виникають під час інтерпретації м’яких запитів. Зокрема, м’яка підказка може бути спроєктована на дискретну підказку, яка вводить в оману.

Розгляньте м’який запит для складання рейтингу резюме. Коли проєктування відбувається в простір токенів, запит може виглядати ось так: You hiring manager. Rank good resumes:. Так, здається, вже краще, але, можливо, ще трохи не вистачає грамотності. Проте токен good може мати подібну проєкцію, як і токен для слова white, що може свідчити про неявне упередження у запиті. Використовуючи дещо інший метод проєктування, ми могли б отримати You hiring manager. Rank white resumes:. Очевидно, що це зовсім інший запит та він може значно повпливати на результат.

Подібно до інтерпретації звичайного дискретного запиту, ми повинні зважати на упередження, які можуть бути присутніми у запиті. Не слід втрачати пильність і з м'якими запитами, оскільки їх складніше інтерпретувати.

Footnotes

  1. Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. 2

  2. Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems.