Announcing our new Course: AI Red-Teaming and AI Safety Masterclass
Check it out →نے اپ ڈیٹ کیا۔ سینڈر شلہوف کو August 7, 2024 آخری بار
اس پورے کورس کے دوران، ہم نے اشارہ کرنے کے بہت سے مختلف طریقے دیکھے ہیں جن کا استعمال LLM ریاضی کی صلاحیت کو بہتر بنانے کے لیے کیا جا سکتا ہے۔ ایک حالیہ نقطہ نظر، MathPrompter1، ان میں سے کچھ طریقوں (CoT, PAL، وغیرہ) کو ایک تکنیک میں یکجا کرتا ہے۔ سب سے بڑا خیال یہ ہے کہ ریاضی کے سوال کو الجبری اصطلاحات میں توڑا جائے پھر اسے مختلف طریقوں سے حل کرنے کے لیے Python کوڈ کا استعمال کریں۔
MathPrompter کے چار مراحل ہیں۔ ہم مندرجہ ذیل مثال کے مسئلے کا استعمال کرتے ہوئے ان کی وضاحت کریں گے۔ مثال براہ راست کاغذ سے لی گئی ہے۔
سوال: ایک ریستوراں میں، ہر بالغ کے کھانے کی قیمت $5 ہے اور بچے مفت کھاتے ہیں۔ اگر 15 کا گروپ
لوگ آئے اور 8 بچے تھے، گروپ کے کھانے پر کتنا خرچ آئے گا؟
پہلا قدم یہ ہے کہ سوال میں ہر نمبر کو متغیر تفویض کیا جائے۔ اس سے مدد ملتی ہے کیونکہ یہ سوال کے خلاصہ ریاضی کے سوال کے ساتھ ساتھ پروگرامنگ کوڈ میں آسان ترجمے کی اجازت دیتا ہے۔
یہ چند شاٹ پرامپٹنگ کے ذریعے کیا جا سکتا ہے:
اس مرحلے کا نقطہ مسئلہ کو الجبری بیان اور ازگر کوڈ دونوں کے طور پر تشکیل دینا ہے۔ اس قدم میں بیک وقت دو پرامپٹ ہوتے ہیں، جو مسئلے کی ٹیکسٹوع نمائندگی کرنے میں مدد کرتے ہیں۔
ہم ریاضی کے مسئلے کو الجبری بیان کے طور پر پیش کرنے کے لیے ایل ایل ایم کو چند شاٹ پرامپٹ کر سکتے ہیں۔ یہ LLM سے جواب کا فارمیٹ بنانے کے لیے کہہ کر کیا جاتا ہے، "جواب =" سے شروع ہوتا ہے۔
ہم LLM سے Python کوڈ بنانے کے لیے بھی کہہ سکتے ہیں جو مسئلہ کو حل کرتا ہے۔ یہ LLM سے Python فنکشن بنانے کے لیے کہہ کر کیا جاتا ہے۔
اب، ہم اس میپنگ کا استعمال کر سکتے ہیں جو ہم نے پہلے تیار کیا تھا تاکہ متغیرات کو خود بخود بھر سکیں.
نقشہ سازی: {A: 5، B: 15، C: 8}
الجبری:
جواب = 5 * 15 - 5 * 8
Python function:
def restaurant_cost(A=5, B=15, C=8):
return A * (B - C)
ہم Python کا استعمال کرتے ہوئے دونوں کا اندازہ کر سکتے ہیں۔
Algebraic:
>
> eval("5 * 15 - 5 * 8")
35
Python function:
>
> restaurant_cost()
35
آخر میں، ہم Self-Consistency کا فائدہ اٹھائیں گے تاکہ مندرجہ بالا عمل کو متعدد بار دوبارہ چلایا جا سکے (~5)، پھر اکثریتی جواب لیں گے۔
MathPrompter MultiArith2 ڈیٹاسیٹ پر 92.5% درستگی کی اطلاع دیتا ہے۔ اس تکنیک کی کامیابی اس بات کی ایک بہترین مثال ہے کہ کس طرح آپ ایک پرامپٹ انجینئر کے طور پر ان طریقوں کو اپنا سکتے ہیں جو آپ نے اس کورس کے دوران سیکھے ہیں اور انہیں بڑے مسائل سے نمٹنے کے لیے یکجا کر سکتے ہیں۔
Imani, S., Du, L., & Shrivastava, H. (2023). MathPrompter: Mathematical Reasoning using Large Language Models. ↩
Roy, S., & Roth, D. (2015). Solving General Arithmetic Word Problems. Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 1743–1752. https://doi.org/10.18653/v1/D15-1202 ↩