Kami telah mencoba beberapa strategi pengingat yang berbeda di halaman-halaman sebelumnya. Halaman ini akan menawarkan beberapa saran umum tentang apa yang sebenarnya penting dalam sebuah permintaan.
Secara mengejutkan, ketika memberikan beberapa contoh exemplars dalam permintaan, jawaban yang sesungguhnya (gold) dalam contoh tidak penting. Seperti yang ditunjukkan pada gambar di bawah ini, memberikan bels|labels%% acak %%lapada contoh hanya sedikit merusak kinerja. "Demo" adalah sinonim dengan contoh dalam gambar ini.
Meskipun label emas dalam contoh-contoh bukanlah hal yang penting,%labelspace|labelspace%%. Bahkan menyediakan label acak dari labelspace membantu LLM memahami labelspace dengan lebih baik, dan meningkatkan hasil. Selain itu, mewakili distribusi labelspace dengan baik pada contoh sangat penting. Daripada secara seragam mengambil sampel dari label pada contoh, lebih baik mengambil sampel sesuai dengan distribusi sebenarnya dari label-label.
Mungkin bagian paling penting dari contoh adalah bagaimana mereka diformat. Format ini memberitahu LLM cara mengatur format jawabannya dengan benar sesuai dengan petunjuk.
Misalnya, pertimbangkan contoh-contoh berikut. Mereka menggunakan kata-kata kapital sebagai jawaban. Meskipun jawabannya benar-benar salah (2+2 bukan 50), GPT-3 dengan benar menjawab pertanyaan terakhir, dan mengikuti format yang lain.
Apa hasil dari 2+2?
LIMA PULUH
Berapakah 20+5?
EMPAT PULUH TIGA
Apakah 12+9?
DUA PULUH SATU
Antara 4-8 contoh adalah jumlah yang baik untuk digunakan sebagai permintaan tembakan sedikit, tapi seringkali berguna untuk menambahkan sebanyak mungkin.
Sander Schulhoff is the Founder of Learn Prompting and an ML Researcher at the University of Maryland. He created the first open-source Prompt Engineering guide, reaching 3M+ people and teaching them to use tools like ChatGPT. Sander also led a team behind Prompt Report, the most comprehensive study of prompting ever done, co-authored with researchers from the University of Maryland, OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions. This 76-page survey analyzed 1,500+ academic papers and covered 200+ prompting techniques.