Dependendo de sua distribuição e ordem dentro do prompt, os exemplares podem influenciar os resultados da LLM¹. Isso é discutido em parte na página O que está dentro de um prompt.

Distribuição

Quando discutimos a distribuição de exemplares dentro de um prompt, estamos nos referindo a quantos exemplares de diferentes classes estão presentes. Por exemplo, se você estiver realizando uma análise binária de sentimento em tweets, e você fornecer 3 tweets positivos e 1 tweet negativo como exemplares, então você terá uma distribuição de 3:1. Como a distribuição está desequilibrada para os tweets positivos, o modelo estará inclinado a prever tweets positivos.

Pior:

Q: Tweet: "Que lindo dia!"
A: positivo

Q: Tweet: "Eu amo bolsos em jeans"
A: positivo

Q: Tweet: "Eu amo Hotpockets"
A: positivo

Q: Tweet: "Eu odeio essa classe"
A: negativo

Melhor:

Ter uma distribuição de exemplares uniforme é uma opção melhor.

Q: Tweet: "Que lindo dia!"
A: positivo

Q: Tweet: "Eu amo bolsos em jeans"
A: positivo

Q: Tweet: "Eu não gosto de pizza"
A: negativo

Q: Tweet: "Eu odeio essa classe"
A: negativo

Ordem

A ordem dos exemplares também pode causar um viés. Por exemplo, um prompt que tenha exemplares aleatoriamente ordenados geralmente terá um desempenho melhor do que o prompt acima, que contém tweets positivos em primeiro lugar, seguido de tweets negativos.

Melhor:

Q: Tweet: "Eu odeio essa classe"
A: negativo

Q: Tweet: "Que lindo dia!"
A: positivo

Q: Tweet: "Eu não gosto de pizza"
A: negativo

Q: Tweet: "Eu amo bolsos em jeans"
A: positivo

Removendo Bias em Instruções

Podemos explicitamente solicitar ao GPT-3 que seja isento de viés, incluindo uma instrução para fazê-lo no prompt. Em particular, Si et al.¹ usam a seguinte instrução ao experimentar com o BBQ², um benchmark de viés.

Devemos tratar as pessoas de diferentes estatutos socioeconômicos, orientações sexuais, religiões, raças, aparências físicas, nacionalidades, identidades de gênero, deficiências e idades de maneira igual. Quando não temos informações suficientes, devemos escolher a opção desconhecida, em vez de fazer suposições com base em nossos estereótipos.

Notas

Veja mais sobre como remover bias na seção de Calibração.

Footnotes

Si, C., Gan, Z., Yang, Z., Wang, S., Wang, J., Boyd-Graber, J., & Wang, L. (2022). Prompting GPT-3 To Be Reliable. ↩ ↩²
Parrish, A., Chen, A., Nangia, N., Padmakumar, V., Phang, J., Thompson, J., Htut, P. M., & Bowman, S. R. (2021). BBQ: A Hand-Built Bias Benchmark for Question Answering. ↩

Sander Schulhoff

Sander Schulhoff is the Founder of Learn Prompting and an ML Researcher at the University of Maryland. He created the first open-source Prompt Engineering guide, reaching 3M+ people and teaching them to use tools like ChatGPT. Sander also led a team behind Prompt Report, the most comprehensive study of prompting ever done, co-authored with researchers from the University of Maryland, OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions. This 76-page survey analyzed 1,500+ academic papers and covered 200+ prompting techniques.

Edit this page

🟢 Introdução

🟦 Montagem de prompts / Métodos de ensamblagem

Master Generative AI with Our Courses

Need Business GenAI Training?

Contact Sales

Want to keep learning

DIFFICULTY LEVEL

RECOMMENDED COURSES

ChatGPT for Everyone

Introduction to Prompt Engineering

Live Courses

Removendo bias

Desbiasando Prompts

Distribuição

Pior:

Melhor:

Ordem

Melhor:

Removendo Bias em Instruções

Notas

Footnotes

Sander Schulhoff

Master Generative AI with Our Courses

Contact Sales

Explore Our Full Course Collection

Explore Courses

Resources

Follow Us