💼 Основні застосунки🟢 Чат-бот + База знань

Чат-бот + База знань

🟢 This article is rated easy

Reading Time: 1 minute

Last updated on August 7, 2024

Останні досягнення у великих мовних моделях (ВММ), таких як GPT-3 і ChatGPT викликали багато шуму в індустрії технологій. Ці моделі неймовірно потужні для створення контенту, але вони також мають деякі недоліки, такі як упередженість і галюцинації. Однією зі сфер, у якій ці ВММ можуть бути особливо корисними, є розробка чат-ботів.

Чат-боти на основі намірів

Традиційні чат-боти зазвичай базуються на намірах, тобто вони розроблені, щоб реагувати на конкретні наміри користувача. Кожен намір складається з набору зразкових запитань і потрібної відповіді. Наприклад, намір "Погода" може містити питання-зразки: "Яка сьогодні погода?" або "Чи буде сьогодні дощ?" і відповідь типу "Сьогодні буде сонячно." Коли користувач ставить запитання, чат-бот порівнює його з наміром із найбільш схожими питаннями-зразками та дає потрібну відповідь.

Як працює традиційний чат-бот на основі намірів. Зображення від автора.

Однак у чат-ботів на основі намірів є своя низка проблем. Одна проблема полягає в тому, що вони вимагають великої кількості конкретних намірів, щоб дати конкретні відповіді. Наприклад, такі висловлювання користувача, як "Я не можу увійти", "Я забув свій пароль" або "Помилка входу", можуть вимагати трьох різних відповідей і, отже, трьох різних намірів, навіть якщо всі вони досить схожі.

Чим може допомогти GPT-3

Тут GPT-3 може бути особливо корисним. Замість того, щоб мати багато дуже конкретних намірів, кожен намір може бути ширшим і використовувати документ із вашої Бази знань. База знань (БЗ) — це інформація, що зберігається у вигляді структурованих і неструктурованих даних, готових до використання для аналізу чи висновків. Ваша БЗ може складатися з низки документів, які пояснюють, як використовувати ваші продукти.

Таким чином, кожен намір пов’язується з документом замість списку запитань і конкретної відповіді, напр. один намір для "проблем із входом", один намір для "як підписатися" тощо. Коли користувач ставить запитання щодо входу, ми можемо передати документ "проблеми входу" до GPT-3 як контекстну інформацію та згенерувати конкретну відповідь на запитання користувача.

Як може працювати чат-бот, що використовує GPT-3. Зображення від автора.

Цей підхід зменшує кількість намірів, якими потрібно керувати, і дозволяє отримати відповіді, які краще підходять до кожного запитання. Крім того, якщо документ, пов’язаний із наміром, описує різні процеси (наприклад, процес для "входу на вебсайт" та інший для "входу в мобільному додатку"), GPT-3 може автоматично запитати у користувача роз’яснення, перш ніж дати остаточну відповідь.

Чому ми не можемо передати всю БЗ до GPT-3?

Сьогодні такі ВММ, як GPT-3, мають максимальний розмір запиту приблизно 4 тис. маркерів (для моделі text-davinci-003), що багато, але недостатньо для того, щоб помістити всю базу знань в один запит. ВММ мають максимальний розмір запиту через великі обчислення, оскільки генерування тексту за допомогою них передбачає низку обрахунків, які швидко зростають зі збільшенням розміру запиту.

Майбутні ВММ можуть не мати цього обмеження, але також збережуть можливості генерування тексту. Однак наразі нам потрібно розробити рішення стосовно цього.

Як може працювати чат-бот із GPT-3

Отже, послідовність чат-бота може складатися з двох етапів:

По-перше, нам потрібно вибрати відповідний намір для запитання користувача, тобто нам потрібно отримати правильний документ із нашої бази знань.
Тоді, коли у нас є потрібний документ, ми можемо використовувати GPT-3, щоб згенерувати точну відповідь для користувача. Для цього нам потрібно буде створити хороший запит.

Перший крок по суті вирішується за допомогою семантичного пошуку. Ми можемо використовувати попередньо підготовлені моделі з бібліотеки sentence-transformers і легко призначати бали кожному документу. Документ з найвищим балом буде використаний для створення відповіді чат-бота.

Як може працювати чат-бот, що використовує GPT-3. GPT-3 можна використовувати для створення правильної відповіді, використовуючи інформацію з документів бази знань. Зображення від автора.

Генерування відповідей за допомогою GPT-3

Коли у нас буде потрібний документ, нам потрібно буде створити хороший запит, який буде використовуватися з GPT-3 для генерування відповіді. У наступних експериментах ми завжди використовуватимемо модель text-davinci-003 із температурою 0,7.

Щоб створити запит, ми поекспериментуємо, використовуючи:

Рольовий запит: евристична техніка, яка призначає ШІ певну роль.
Релевантна інформація з БЗ, тобто документ, отриманий на етапі семантичного пошуку.
Останні повідомлення, якими обмінювалися користувач і чат-бот. Це корисно для повідомлень, надісланих користувачем, у яких не вказано повний контекст. Ми побачимо приклад цього пізніше. Перегляньте цей приклад, щоб дізнатися, як керувати розмовами за допомогою GPT-3.
Нарешті, запитання користувача.

Інформація, яка використовується для створення запиту GPT-3. Зображення від автора.

Почнімо наш запит, використовуючи техніку

рольового запиту.

Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати
користувачам якнайкраще.

Тоді припустімо, що крок семантичного пошуку дістає цей документ із нашої бази знань. Усі документи описують, як працює продукт VideoGram, який є уявним продуктом, схожим на Instagram, але лише для відео.

Документ, що пояснює, як працює вхід у VideoGram. Зображення від автора.

Таким чином ми можемо додати

його вмісту запит.

Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.

START CONTEXT

Увійдіть у VideoGram із вебсайту

Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.

Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

Увійдіть у VideoGram із мобільної програми

Відкрийте програму VideoGram на своєму мобільному пристрої.

На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

END CONTEXT

Нарешті, нам потрібно додати

розмову та запитання користувачау кінець запиту, як у наступному прикладі.

Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.

START CONTEXT

Увійдіть у VideoGram із вебсайту

Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.

Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

Увійдіть у VideoGram із мобільної програми

Відкрийте програму VideoGram на своєму мобільному пристрої.

На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

END CONTEXT

СКІППІ: Привіт, я Скіппі! Чим я можу вам допомогти?

КОРИСТУВАЧ: Я не можу знайти кнопку входу.

СКІППІ:

Передаючи цей запит GPT-3, я отримав таку згенеровану відповідь.

Без проблем! На вебсайті кнопка входу розташована у верхньому правому куті
сторінки. У мобільному додатку кнопка входу розташована в нижньому правому
куті. Дайте мені знати, якщо вам потрібна додаткова допомога!

Зверніть увагу, як інформація у згенерованій відповіді надходить із документа бази знань.

Усунення неоднозначності запитань з GPT-3

Спробуймо менш чіткий вислів користувача, наприклад

"не можу ввійти". Ось повний запит.

Як просунутий чат-бот, на ім’я Скіппі, ваша головна мета — допомагати користувачам якнайкраще.

START CONTEXT

Увійдіть у VideoGram із вебсайту

Відкрийте вебпереглядач і перейдіть на вебсайт VideoGram.

Натисніть кнопку "Увійти", розташовану у верхньому правому куті сторінки.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

Увійдіть у VideoGram із мобільної програми

Відкрийте програму VideoGram на своєму мобільному пристрої.

На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті.

На сторінці входу введіть своє ім’я користувача та пароль у VideoGram.

Після введення облікових даних натисніть кнопку "Увійти".

Тепер ви повинні увійти у свій обліковий запис VideoGram.

END CONTEXT

СКІППІ: Привіт, я Скіппі! Чим я можу вам допомогти?

КОРИСТУВАЧ: Не вдається увійти

СКІППІ:

GPT-3 відповідає, намагаючись краще зрозуміти, в чому проблема користувача.

Мені прикро це чути. Чи можете ви мені сказати, чи ви намагаєтеся ввійти
через вебсайт VideoGram або мобільний додаток?

Далі, ось як відбувається повна розмова. Весь запит прихований для кращої видимості.

КОРИСТУВАЧ: Не можу ввійти

СКІППІ: Мені прикро це чути. Чи можете ви мені сказати, чи ви намагаєтеся ввійти через вебсайт VideoGram або мобільний додаток?

КОРИСТУВАЧ: Мобільний додаток

СКІППІ: Добре, без проблем. Щоб увійти через мобільний додаток, відкрийте додаток VideoGram на своєму мобільному пристрої. На головній сторінці натисніть кнопку "Увійти", розташовану в нижньому правому куті. На сторінці входу введіть своє ім’я користувача та пароль у VideoGram. Після введення облікових даних натисніть кнопку "Увійти". Тепер ви повинні увійти у свій обліковий запис VideoGram. Будь ласка, дайте мені знати, якщо вам потрібна додаткова допомога.

GPT-3 може керувати усуненням неоднозначності за умови, що він має правильну контекстну інформацію.

Проблеми з генеруванням відповідей за допомогою GPT-3

Попередні приклади спрацювали добре. Однак є кілька випадків, в яких цей чат-бот може не впоратися.

Якщо ми запитаємо "Мобільний додаток безплатний?" у GPT-3, передаючи документ для входу як контекст, ви часто отримуєте відповідь на кшталт "Так, мобільний додаток VideoGram можна завантажити та використовувати безплатно", навіть якщо така інформація не міститься в контекстній інформації. Створення неправдивої інформації дуже шкідливо для чат-ботів служби підтримки клієнтів!

GPT-3 рідко генерує неправдиву інформацію, якщо відповідь на запитання користувача можна знайти в контексті. Оскільки запитання користувачів часто є короткими та неоднозначними текстами, ми не можемо покладатися на крок семантичного пошуку, щоб завжди отримати правильний документ, і тому ми завжди вразливі до створення неправдивої інформації.

Висновок

GPT-3 дуже корисний для створення розмовних чат-ботів і здатний відповідати на ряд конкретних запитань на основі контекстної інформації, вставленої в запит. Однак важко змусити модель видавати відповіді, використовуючи лише інформацію в контексті, оскільки модель схильна до галюцинацій (тобто генерування нової інформації, потенційно неправдивої). Генерування неправдивої інформації є проблемою різних ступенів серйозності залежно від випадку використання.

Автор: Фабіо Кьюзано.

Footnotes

Nadeem, M., Bethke, A., & Reddy, S. (2021). StereoSet: Measuring stereotypical bias in pretrained language models. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 5356–5371. https://doi.org/10.18653/v1/2021.acl-long.416 ↩
Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y., Madotto, A., & Fung, P. (2022). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. https://doi.org/10.1145/3571730 ↩