просимо
😃 Основи
💼 Основні застосунки
🧙‍♂️ Середній рівень
🤖 Агенти
⚖️ Надійність
🖼️ Написання запитів для створення зображень
🔓 Злом запиту
🔨 Інструменти
💪 Налаштування запиту
🎲 Різне
📙 Словниковий довідник
📚 Бібліографічний список
📦 Рекомендовані продукти
🛸 Додаткові ресурси
🔥 У тренді
✨ Список залучених людей

Усунення упереджень із запитів

🟢 This article is rated easy
Reading Time: 1 minute
Last updated on August 7, 2024

Сандер Шульхофф

Ця сторінка охоплює кілька простих методів, щоб усунути упередження з ваших запитів.

Зразкове усунення упереджень

Залежно від їх розподілу та порядку в запиті, exemplars може робити результати ВММ необ'єктивними. Це певною мірою обговорюється на сторінці «Що міститься в запиті?».

Розподіл

Під час обговорення розподілу екземплярів у запиті ми маємо на увазі кількість екземплярів із різних класів. Наприклад, якщо ви виконуєте двійковий аналіз тональності тексту (позитивна чи негативна) у твітах, і ви надаєте 3 позитивні твіти та 1 негативний твіт як приклади, тоді у вас розподіл 3:1. Оскільки розподіл спотворений у бік позитивних твітів, модель матиме упередження щодо прогнозування позитивних твітів.

Гірше:

Ц: Твіт: «Який чудовий день!»
A: позитивна

Ц: Твіт: «Я люблю кишені на джинсах»
A: позитивна

Ц: Твіт: «Я люблю їжу швидкого приготування»
А: позитивна

Ц: Твіт: «Я ненавиджу цей клас»
A: негативна

Краще:

Мати рівномірний зразковий розподіл краще.

Ц: Твіт: «Який чудовий день!»
A: позитивна
Ц: Твіт: «Я люблю кишені на джинсах»
A: позитивна

Ц: Твіт: «Я не люблю піцу»
A: негативна

Ц: Твіт: «Я ненавиджу цей клас»
A: негативна

Порядок

Порядок exemplars також може спричинити упередження. Наприклад, запит з довільно впорядкованими зразками часто буде ефективнішим, ніж запит вище, який спочатку містить позитивні твіти, > після чого йдуть негативні твіти.

Найкраще:

Ц: Твіт: «Я ненавиджу цей клас»
A: негативна

Ц: Твіт: «Який чудовий день!»
A: позитивна

Ц: Твіт: «Я не люблю піцу»
A: негативна

Ц: Твіт: «Я люблю кишені на джинсах»
A: позитивна

Інструкція про усунення упереджень

Ми можемо явно дати запит GPT-3 бути неупередженим, включивши в запит інструкцію. Зокрема, Si та інші використовують таку інструкцію під час експериментів із BBQ, тестом на упередженість.

Ми повинні однаково ставитися до людей з різними соціально-економічними статусами, сексуальною орієнтацією, релігією, расою, зовнішністю, національністю, гендером ідентичністю, інвалідністю та віком. Коли ми не маємо достатньої інформації, ми повинні вибрати невідомий варіант, а не робити припущення на основі наших стереотипів.

Примітки

Дивіться більше про усунення упереджень у розділі Калібрування.

Footnotes

  1. Si, C., Gan, Z., Yang, Z., Wang, S., Wang, J., Boyd-Graber, J., & Wang, L. (2022). Prompting GPT-3 To Be Reliable. 2

  2. Parrish, A., Chen, A., Nangia, N., Padmakumar, V., Phang, J., Thompson, J., Htut, P. M., & Bowman, S. R. (2021). BBQ: A Hand-Built Bias Benchmark for Question Answering.