Soft prompts adalah urutan vektor yang tidak sesuai dengan token yang sebenarnya dalam kosakata. Hal ini membuat sulit untuk menginterpretasikan prompt. Namun, kita masih dapat mencoba melakukannya dengan memetakan vektor ke token-token terdekat dalam kosakata. Namun, soft prompt yang diproyeksikan sering kali bermasalah; mereka dapat menyelesaikan tugas dengan baik, tetapi diproyeksikan ke token sembarang dalam kosakata.

Misalnya, jika kami sedang melatih pertanyaan matematika seperti GSM8K, kami mungkin akan memulai dengan prompt Anda adalah seorang ahli matematika. Selesaikan pertanyaan ini:. Jika kita melakukan penyetelan cepat pada itu, kemudian memproyeksikan kembali ke dalam ruang token, kita mungkin tersisa dengan sesuatu yang tidak masuk akal seperti Sebuah bus adalah bus. Lakukan tugas di sini:. Seringkali kasusnya adalah, soft prompt yang dipetakan ke prompt yang tidak masuk akal ini dapat memberikan kinerja yang lebih baik pada tugas tersebut!

Hiptesis Waywardness

Khashabi et al. mengusulkan hipotesis luar biasa ini. Iq mengatakan bahwa diberikan sebuah tugas, untuk setiap prompt target diskrit, ada sebuah prompt kontinu yang dapat memproyeksikannya, sambil melakukan tugas dengan baik.

Hal ini berarti bahwa diberikan 1000 tugas yang berbeda, ada 1000 petunjuk lunak performan yang berbeda (satu untuk setiap tugas) yang memetakan ke prompt diskrit yang sama.

Risiko Interpretabilitas

Mereka menggunakan Hipotesis Waywardness untuk menyoroti sejumlah risiko yang muncul saat menginterpretasi sinyal lembut. Secara khusus, sebuah perintah lembut dapat diproyeksikan ke sebuah perintah diskret yang memberikan tujuan yang menyesatkan.

Pertimbangkan saran ringan untuk menilai daftar riwayat hidup. Ketika diproyeksikan ke dalam ruang token, mungkin menjadi Anda yang merekrut manajer. Peringkat resume yang baik:. Ini tampak layak, mungkin sedikit kurang dalam kebenaran gramatikal. Namun token baik mungkin memiliki proyeksi yang sama dengan token untuk putih, dan bisa ada bias tersirat dalam prompt. Dengan menggunakan metode proyeksi yang sedikit berbeda, kita bisa berakhir dengan Anda manajer perekrutan. Peringkat resume putih:. Ini merupakan hal yang sudah jelas bebedam dan bisa saja memberikan hasil yang signifikan.

Sama seperti menginterpretasikan prompt diskrit biasa, kita harus sangat sadar akan bias yang mungkin ada dalam prompt. Kita harus sangat berhati-hati dengan soft prompt, karena lebih sulit untuk diinterpretasikan.

Footnotes

Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. ↩ ↩²
Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems. ↩

Sander Schulhoff

Sander Schulhoff is the Founder of Learn Prompting and an ML Researcher at the University of Maryland. He created the first open-source Prompt Engineering guide, reaching 3M+ people and teaching them to use tools like ChatGPT. Sander also led a team behind Prompt Report, the most comprehensive study of prompting ever done, co-authored with researchers from the University of Maryland, OpenAI, Microsoft, Google, Princeton, Stanford, and other leading institutions. This 76-page survey analyzed 1,500+ academic papers and covered 200+ prompting techniques.

DIFFICULTY LEVEL

RECOMMENDED COURSES

ChatGPT for Everyone

Introduction to Prompt Engineering

Live Courses

Prompt yang Dapat Diinterpretasikan

Hiptesis Waywardness

Risiko Interpretabilitas

Footnotes

Sander Schulhoff