Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!
Check it out →Останні досягнення у великих мовних моделях (ВММ), таких як GPT-3 і ChatGPT викликали багато шуму в індустрії технологій. Ці моделі неймовірно потужні для створення контенту, але вони також мають деякі недоліки, такі як упередженість1 і галюцинації2. Однією зі сфер, у якій ці ВММ можуть бути особливо корисними, є розробка чат-ботів.
Традиційні чат-боти зазвичай базуються на намірах, тобто вони розроблені, щоб реагувати на конкретні наміри користувача. Кожен намір складається з набору зразкових запитань і потрібної відповіді. Наприклад, намір "Погода" може містити питання-зразки: "Яка сьогодні погода?" або "Чи буде сьогодні дощ?" і відповідь типу "Сьогодні буде сонячно." Коли користувач ставить запитання, чат-бот порівнює його з наміром із найбільш схожими питаннями-зразками та дає потрібну відповідь.
Як працює традиційний чат-бот на основі намірів. Зображення від автора.
Однак у чат-ботів на основі намірів є своя низка проблем. Одна проблема полягає в тому, що вони вимагають великої кількості конкретних намірів, щоб дати конкретні відповіді. Наприклад, такі висловлювання користувача, як "Я не можу увійти", "Я забув свій пароль" або "Помилка входу", можуть вимагати трьох різних відповідей і, отже, трьох різних намірів, навіть якщо всі вони досить схожі.
Тут GPT-3 може бути особливо корисним. Замість того, щоб мати багато дуже конкретних намірів, кожен намір може бути ширшим і використовувати документ із вашої Бази знань. База знань (БЗ) — це інформація, що зберігається у вигляді структурованих і неструктурованих даних, готових до використання для аналізу чи висновків. Ваша БЗ може складатися з низки документів, які пояснюють, як використовувати ваші продукти.
Таким чином, кожен намір пов’язується з документом замість списку запитань і конкретної відповіді, напр. один намір для "проблем із входом", один намір для "як підписатися" тощо. Коли користувач ставить запитання щодо входу, ми можемо передати документ "проблеми входу" до GPT-3 як контекстну інформацію та згенерувати конкретну відповідь на запитання користувача.
Як може працювати чат-бот, що використовує GPT-3. Зображення від автора.
Цей підхід зменшує кількість намірів, якими потрібно керувати, і дозволяє отримати відповіді, які краще підходять до кожного запитання. Крім того, якщо документ, пов’язаний із наміром, описує різні процеси (наприклад, процес для "входу на вебсайт" та інший для "входу в мобільному додатку"), GPT-3 може автоматично запитати у користувача роз’яснення, перш ніж дати остаточну відповідь.
Сьогодні такі ВММ, як GPT-3, мають максимальний розмір запиту приблизно 4 тис. маркерів (для моделі text-davinci-003
), що багато, але недостатньо для того, щоб помістити всю базу знань в один запит. ВММ мають максимальний розмір запиту через великі обчислення, оскільки генерування тексту за допомогою них передбачає низку обрахунків, які швидко зростають зі збільшенням розміру запиту.
Майбутні ВММ можуть не мати цього обмеження, але також збережуть можливості генерування тексту. Однак наразі нам потрібно розробити рішення стосовно цього.
Отже, послідовність чат-бота може складатися з двох етапів:
Перший крок по суті вирішується за допомогою семантичного пошуку. Ми можемо використовувати попередньо підготовлені моделі з бібліотеки sentence-transformers
і легко призначати бали кожному документу. Документ з найвищим балом буде використаний для створення відповіді чат-бота.
Як може працювати чат-бот, що використовує GPT-3. GPT-3 можна використовувати для створення правильної відповіді, використовуючи інформацію з документів бази знань. Зображення від автора.
Коли у нас буде потрібний документ, нам потрібно буде створити хороший запит, який буде використовуватися з GPT-3 для генерування відповіді. У наступних експериментах ми завжди використовуватимемо модель text-davinci-003
із температурою 0,7
.
Щоб створити запит, ми поекспериментуємо, використовуючи:
Інформація, яка використовується для створення запиту GPT-3. Зображення від автора.
Почнімо наш запит, використовуючи техніку
рольового запиту.
Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати
користувачам якнайкраще.
Тоді припустімо, що крок семантичного пошуку дістає цей документ із нашої бази знань. Усі документи описують, як працює продукт VideoGram, який є уявним продуктом, схожим на Instagram, але лише для відео.
Документ, що пояснює, як працює вхід у VideoGram. Зображення від автора.
Таким чином ми можемо додати
його вмісту запит.
Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.
START CONTEXT
Увійдіть у VideoGram із вебсайту
- Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.
- Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
Увійдіть у VideoGram із мобільної програми
- Відкрийте програму VideoGram на своєму мобільному пристрої.
- На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
END CONTEXT
Нарешті, нам потрібно додати
розмову та запитання користувачау кінець запиту, як у наступному прикладі.
Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.
START CONTEXT
Увійдіть у VideoGram із вебсайту
- Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.
- Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
Увійдіть у VideoGram із мобільної програми
- Відкрийте програму VideoGram на своєму мобільному пристрої.
- На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
END CONTEXT
СКІППІ: Привіт, я Скіппі! Чим я можу вам допомогти?
КОРИСТУВАЧ: Я не можу знайти кнопку входу.
СКІППІ:
Передаючи цей запит GPT-3, я отримав таку згенеровану відповідь.
Без проблем! На вебсайті кнопка входу розташована у верхньому правому куті
сторінки. У мобільному додатку кнопка входу розташована в нижньому правому
куті. Дайте мені знати, якщо вам потрібна додаткова допомога!
Зверніть увагу, як інформація у згенерованій відповіді надходить із документа бази знань.
Спробуймо менш чіткий вислів користувача, наприклад
"не можу ввійти". Ось повний запит.
Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.
START CONTEXT
Увійдіть у VideoGram із вебсайту
- Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.
- Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
Увійдіть у VideoGram із мобільної програми
- Відкрийте програму VideoGram на своєму мобільному пристрої.
- На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.
- На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.
- Після введення облікових даних натисніть кнопку "Увійти".
- Тепер ви повинні увійти у свій обліковий запис VideoGram.
END CONTEXT
СКІППІ: Привіт, я Скіппі! Чим я можу вам допомогти?
КОРИСТУВАЧ: Не вдається увійти
СКІППІ:
GPT-3 відповідає, намагаючись краще зрозуміти, в чому проблема користувача.
Мені прикро це чути. Чи можете ви мені сказати, чи ви намагаєтеся ввійти
через вебсайт VideoGram або мобільний додаток?
Далі, ось як відбувається повна розмова. Весь запит прихований для кращої видимості.
КОРИСТУВАЧ: Не можу ввійти
СКІППІ: Мені прикро це чути. Чи можете ви мені сказати, чи ви намагаєтеся ввійти через вебсайт VideoGram або мобільний додаток?
КОРИСТУВАЧ: Мобільний додаток
СКІППІ: Добре, без проблем. Щоб увійти через мобільний додаток, відкрийте додаток VideoGram на своєму мобільному пристрої. На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті. На сторінці входу введіть своє ім’я користувача та пароль у VideoGram. Після введення облікових даних натисніть кнопку "Увійти". Тепер ви повинні увійти у свій обліковий запис VideoGram. Будь ласка, дайте мені знати, якщо вам потрібна додаткова допомога.
GPT-3 може керувати усуненням неоднозначності за умови, що він має правильну контекстну інформацію.
Попередні приклади спрацювали добре. Однак є кілька випадків, в яких цей чат-бот може не впоратися.
Якщо ми запитаємо "Мобільний додаток безплатний?" у GPT-3, передаючи документ для входу як контекст, ви часто отримуєте відповідь на кшталт "Так, мобільний додаток VideoGram можна завантажити та використовувати безплатно", навіть якщо така інформація не міститься в контекстній інформації. Створення неправдивої інформації дуже шкідливо для чат-ботів служби підтримки клієнтів!
GPT-3 рідко генерує неправдиву інформацію, якщо відповідь на запитання користувача можна знайти в контексті. Оскільки запитання користувачів часто є короткими та неоднозначними текстами, ми не можемо покладатися на крок семантичного пошуку, щоб завжди отримати правильний документ, і тому ми завжди вразливі до створення неправдивої інформації.
GPT-3 дуже корисний для створення розмовних чат-ботів і здатний відповідати на ряд конкретних запитань на основі контекстної інформації, вставленої в запит. Однак важко змусити модель видавати відповіді, використовуючи лише інформацію в контексті, оскільки модель схильна до галюцинацій (тобто генерування нової інформації, потенційно неправдивої). Генерування неправдивої інформації є проблемою різних ступенів серйозності залежно від випадку використання.
Автор: Фабіо Кьюзано.
Nadeem, M., Bethke, A., & Reddy, S. (2021). StereoSet: Measuring stereotypical bias in pretrained language models. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 5356–5371. https://doi.org/10.18653/v1/2021.acl-long.416 ↩
Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y., Madotto, A., & Fung, P. (2022). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. https://doi.org/10.1145/3571730 ↩