Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!

Check it out →
💪 Налаштування запитуІнтерпретовані м'які запити

Інтерпретовані м'які запити

Востаннє оновлено Сандер Шульхофф August 7, 2024 року

М'які запити – це послідовність векторів, які не відповідають жодним токенам у словнику. Це ускладнює інтерпретацію запиту. Та попри це ми все ж можемо спробувати зіставити вектори з найближчими токенами у словнику. Хоч спроєктовані м'які запити часто бувають непостійними, вони можуть непогано вирішити завдання, але проєктуються такі запити на довільні токени у словнику1.

Наприклад, якщо ми тренуємося на таких математичних завданнях, як GSM8K2, ми можемо почати із запиту You are a mathematician. Solve this question:. Якщо ми налаштуємо запит на нього, а потім спроєктуємо назад у простір токенів, у нас може вийти нісенітниця, наприклад: A bus is a bus. Do thing here:. Часто трапляється так, що м'які запити, подібні до цього безглуздого, можуть забезпечити кращу продуктивність при виконанні завдання!

Гіпотеза непостійності

Хашабі та інші1 пропонують цю неймовірну гіпотезу. Згідно з нею, для будь-якого дискретного цільового запиту існує постійний запит, який проєктується на нього, успішно виконуючи завдання.

Це означає, що для 1000 різних завдань існує 1000 різних м'яких запитів (по одному для кожного), які зіставляються з тим самим дискретним запитом.

Ризики інтерпретації

Вони використовують гіпотезу непостійності, щоб висвітлити низку ризиків, які виникають під час інтерпретації м’яких запитів. Зокрема, м’яка підказка може бути спроєктована на дискретну підказку, яка вводить в оману.

Розгляньте м’який запит для складання рейтингу резюме. Коли проєктування відбувається в простір токенів, запит може виглядати ось так: You hiring manager. Rank good resumes:. Так, здається, вже краще, але, можливо, ще трохи не вистачає грамотності. Проте токен good може мати подібну проєкцію, як і токен для слова white, що може свідчити про неявне упередження у запиті. Використовуючи дещо інший метод проєктування, ми могли б отримати You hiring manager. Rank white resumes:. Очевидно, що це зовсім інший запит та він може значно повпливати на результат.

Подібно до інтерпретації звичайного дискретного запиту, ми повинні зважати на упередження, які можуть бути присутніми у запиті. Не слід втрачати пильність і з м'якими запитами, оскільки їх складніше інтерпретувати.

Footnotes

  1. Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. 2

  2. Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems.

Word count: 0

Get AI Certified by Learn Prompting


Copyright © 2024 Learn Prompting.