¿Qué es una Promoción?
Hemos pasado por algunas estrategias de promoción diferentes en las páginas anteriores. Esta página ofrecerá algunos consejos generales sobre lo que realmente es importante en una promoción.
"La verdad terrenal es de poca importancia"
Sorprendentemente, al proporcionar algunos pocos ejemplos en las promociones, las respuestas reales (gold) en los ejemplos no son importantes. Como se muestra en la figura a continuación, proporcionar etiquetas aleatorias en los ejemplos apenas afecta el rendimiento. "Demo" es sinónimo de ejemplo en esta imagen.
Importa el espacio de etiquetas
Aunque las etiquetas doradas en los ejemplos no son importantes, el espacio de etiquetas sí lo es. Incluso proporcionar etiquetas aleatorias del espacio de etiquetas ayuda al LLM a comprender mejor el espacio de etiquetas y mejora los resultados. Además, es importante representar adecuadamente la distribución del espacio de etiquetas en los ejemplos. En lugar de muestrear uniformemente del espacio de etiquetas en los ejemplos, es mejor muestrear de acuerdo con la distribución real de las etiquetas.
La forma importa
Quizás la parte más importante de los ejemplos es cómo se formatean. Este formato instruye al LLM sobre cómo formatear adecuadamente su respuesta a la promoción.
Por ejemplo, considere los siguientes ejemplos. Usan palabras todas en mayúsculas como respuestas. Aunque las respuestas son completamente incorrectas (2 + 2 no son 50), GPT-3 responde correctamente a la última pregunta y sigue el formato de las otras.
¿Cuánto es 2+2?
CINCUENTA
¿Cuánto es 20+5?
CUARENTA-TRES
¿Cuánto es 12+9?
// highlight-start
VEINTIUNO
// highlight-end
Notas
Entre 4 y 8 ejemplos son una buena cantidad para usar en promociones de pocos disparos, pero a menudo puede ser útil poner tantos como sea posible.
Sander Schulhoff
Sander Schulhoff is the CEO of HackAPrompt and Learn Prompting. He created the first Prompt Engineering guide on the internet, two months before ChatGPT was released, which has taught 3 million people how to prompt ChatGPT. He also partnered with OpenAI to run the first AI Red Teaming competition, HackAPrompt, which was 2x larger than the White House's subsequent AI Red Teaming competition. Today, HackAPrompt partners with the Frontier AI labs to produce research that makes their models more secure. Sander's background is in Natural Language Processing and deep reinforcement learning. He recently led the team behind The Prompt Report, the most comprehensive study of prompt engineering ever done. This 76-page survey, co-authored with OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions, analyzed 1,500+ academic papers and covered 200+ prompting techniques.
