๐ข ์ฌ๊ณ ์ฌ์ฌ ํ๋กฌํํ
์ฌ๊ณ ์ฌ์ฌ (CoT) ํ๋กฌํํ 1์ ์ต๊ทผ์ ๊ฐ๋ฐ๋ ๋ฐฉ๋ฒ์ ๋๋ค. LLM์๊ฒ ์ด์ ์ ๋ํด์ ์ค๋ช ํ๋๋ก ๋ง๋๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์๋์ ์ฌ์ง์์1 ํจ์ท ํ์ค ํ๋กฌํํธ(์ผ์ชฝ)์ ์ฌ๊ณ ์ฌ์ฌ ํ๋กฌํํ (์ค๋ฅธ์ชฝ)์ ๋น๊ตํด ๋ณผ ์ ์์ต๋๋ค.

CoT์ ๋ฉ์ธ ์์ด๋์ด๋ LLM์๊ฒ ๋ต์ด ๋์ค๋ ๊ณผ์ ์ ๋ํด์ ์ค๋ช ํ %%ํ๋ณธ|ํ๋ณธ%%์ ๋ณด์ฌ์ค์ผ๋ก์จ LLM์ด ํ๋กฌํํธ์ ๋ตํ ๋ ๋๊ฐ์ด ๊ทธ์ ๋ํ ๊ณผ์ ์ ์ค๋ช ํ๋๋ก ๋ง๋๋ ๊ฒ์ ๋๋ค. ์ด์ ์ ๋ํ ์ค๋ช ์ ์ข ์ข ๋ต์ ๋ ์ ํํ๊ฒ ๋ง๋ญ๋๋ค.
์์โ
๋ช๊ฐ์ง ์์๊ฐ ์์ต๋๋ค. ๋จผ์ GPT-3 (davinci-003)๊ฐ ๋ช๊ฐ์ง ๊ฐ๋จํ ๋จ์ด ๋ฌธ์ ๋ฅผ ํ๋ฆฐ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค. ๋ ๋ฒ์งธ์์๋ GPT-3(davinci-003)์ด CoT๋ฅผ ํตํด์ ๊ฐ์ ๋ฌธ์ ๋ฅผ ๋ง์ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.
Incorrectโ
Correctโ
๊ฒฐ๊ณผโ
CoT๋ ์ฐ์ ์ , ์์์ , ์์ง์ ์ถ๋ก ๊ณผ์ 1์ ๊ฐ์ ์ผ๋ค์ ๋ ํจ์จ์ ์ผ๋ก ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ค์ด ๋๋ค. ํนํ PaLM 540B2๋ GSM8K3์์ 57%์ ์ ํ๋ ํฅ์์ ๋ณด์๋ค.
์ ํโ
์ค์ํ ์ ์, Wei ๋ฑ์ ๋ฐ๋ฅด๋ฉด, "CoT๋ โผ100์ต ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ๊ณผ ํจ๊ป ์ฌ์ฉํ ๋๋ง ์ฑ๋ฅ ํฅ์์ ๊ฐ์ ธ์ต๋๋ค". ๋ ์์ ๋ชจ๋ธ์ ๋น๋ ผ๋ฆฌ์ ์ธ ์ฌ๊ณ ์ฌ์ฌ์ ์์ฑํ๊ณ ์ด๋ ํ์ค ํ๋กฌํํธ๋ก ์์ฑํ ๋ ๋ณด๋ค ๋ ๋ถ์ ํํ์ต๋๋ค. ๋ชจ๋ธ๋ค์ ๋ณดํต ๋ชจ๋ธ์ ํฌ๊ธฐ์ ๋น๋กํ๋ ๋ฐฉ์์ผ๋ก CoTํ๋กฌํํธ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ํฅ์์ ๋ณด์์ต๋๋ค.
์ฐธ๊ณ โ
์ด ์ฑํฐ๋ฅผ ์์ฑํ๋ ๊ณผ์ ์์ ์ด๋ค ์ธ์ด ๋ชจ๋ธ๋ ๋ค์น์ง ์์๋ต๋๋ค๐.
- Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). Chain of Thought Prompting Elicits Reasoning in Large Language Models. โฉ
- Chowdhery, A., Narang, S., Devlin, J., Bosma, M., Mishra, G., Roberts, A., Barham, P., Chung, H. W., Sutton, C., Gehrmann, S., Schuh, P., Shi, K., Tsvyashchenko, S., Maynez, J., Rao, A., Barnes, P., Tay, Y., Shazeer, N., Prabhakaran, V., โฆ Fiedel, N. (2022). PaLM: Scaling Language Modeling with Pathways. โฉ
- Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems. โฉ