М'які запити – це послідовність векторів, які не відповідають жодним токенам у словнику. Це ускладнює інтерпретацію запиту. Та попри це ми все ж можемо спробувати зіставити вектори з найближчими токенами у словнику. Хоч спроєктовані м'які запити часто бувають непостійними, вони можуть непогано вирішити завдання, але проєктуються такі запити на довільні токени у словнику.
Наприклад, якщо ми тренуємося на таких математичних завданнях, як GSM8K, ми можемо почати із запиту You are a mathematician. Solve this question:
. Якщо ми налаштуємо запит на нього, а потім спроєктуємо назад у простір токенів, у нас може вийти нісенітниця, наприклад: A bus is a bus. Do thing here:
. Часто трапляється так, що м'які запити, подібні до цього безглуздого, можуть забезпечити кращу продуктивність при виконанні завдання!
Хашабі та інші пропонують цю неймовірну гіпотезу. Згідно з нею, для будь-якого дискретного цільового запиту існує постійний запит, який проєктується на нього, успішно виконуючи завдання.
Це означає, що для 1000 різних завдань існує 1000 різних м'яких запитів (по одному для кожного), які зіставляються з тим самим дискретним запитом.
Вони використовують гіпотезу непостійності, щоб висвітлити низку ризиків, які виникають під час інтерпретації м’яких запитів. Зокрема, м’яка підказка може бути спроєктована на дискретну підказку, яка вводить в оману.
Розгляньте м’який запит для складання рейтингу резюме. Коли проєктування відбувається в простір токенів, запит може виглядати ось так: You hiring manager. Rank good resumes:
. Так, здається, вже краще, але, можливо, ще трохи не вистачає грамотності. Проте токен good
може мати подібну проєкцію, як і токен для слова white
, що може свідчити про неявне упередження у запиті. Використовуючи дещо інший метод проєктування, ми могли б отримати You hiring manager. Rank white resumes:
. Очевидно, що це зовсім інший запит та він може значно повпливати на результат.
Подібно до інтерпретації звичайного дискретного запиту, ми повинні зважати на упередження, які можуть бути присутніми у запиті. Не слід втрачати пильність і з м'якими запитами, оскільки їх складніше інтерпретувати.
Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. ↩ ↩2
Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems. ↩