چیٹ بوٹ + نالج بیس
بڑے لینگویج ماڈلز (LLMs) جیسے کہ GPT-3 اور ChatGPT میں حالیہ پیشرفت نے بہت کچھ پیدا کیا ہے۔ ٹیک انڈسٹری میں buzz کی. یہ ماڈلز مواد کی تخلیق کے لیے ناقابل یقین حد تک طاقتور ہیں، لیکن ان میں کچھ نشیب و فراز بھی ہیں جیسے تعصب اور فریب کاری۔ ایک شعبہ جس میں یہ LLMs خاص طور پر کارآمد ہو سکتے ہیں وہ ہے چیٹ بوٹ کی ترقی۔
ارادے پر مبنی چیٹ بوٹس
روایتی چیٹ بوٹس عام طور پر ارادے پر مبنی ہوتے ہیں، یعنی انہیں مخصوص صارف کے ارادوں کا جواب دینے کے لیے ڈیزائن کیا گیا ہے۔ ہر ارادہ نمونہ سوالات کے ایک سیٹ اور اس سے وابستہ جواب پر مشتمل ہوتا ہے۔ مثال کے طور پر، ارادے "موسم" میں نمونہ سوالات شامل ہو سکتے ہیں جیسے "آج موسم کیسا ہے؟" یا "کیا آج بارش ہوگی؟" اور "آج دھوپ ہو گی" جیسا جواب۔ جب کوئی صارف کوئی سوال پوچھتا ہے تو چیٹ بوٹ اسے سب سے ملتے جلتے نمونے والے سوالات کے ارادے سے میل کرتا ہے اور متعلقہ جواب واپس کرتا ہے۔
تاہم، ارادے پر مبنی چیٹ بوٹس کے اپنے مسائل ہیں۔ ایک مسئلہ یہ ہے کہ انہیں مخصوص جوابات دینے کے لیے بڑی تعداد میں مخصوص ارادوں کی ضرورت ہوتی ہے۔ مثال کے طور پر، صارف کے الفاظ جیسے "میں لاگ ان نہیں ہو سکتا"، "میں اپنا پاس ورڈ بھول گیا ہوں"، یا "لاگ ان ایرر" کے لیے تین مختلف جوابات اور اس لیے تین مختلف ارادوں کی ضرورت ہو سکتی ہے، حالانکہ وہ سب کافی ایک جیسے ہیں۔
GPT-3 کس طرح مدد کر سکتا ہے۔
یہ وہ جگہ ہے جہاں GPT-3 خاص طور پر مفید ہو سکتا ہے۔ بہت سے مخصوص ارادے رکھنے کے بجائے، ہر ایک ارادہ وسیع تر ہو سکتا ہے اور آپ کے [نالج بیس] (https://en.wikipedia.org/wiki/Knowledge_base) سے دستاویز کا فائدہ اٹھا سکتا ہے۔ نالج بیس (KB) وہ معلومات ہوتی ہے جو سٹرکچرڈ اور غیر ساختہ ڈیٹا کے طور پر محفوظ ہوتی ہے، جو تجزیہ یا تخمینہ کے لیے استعمال کے لیے تیار ہوتی ہے۔ آپ کا KB دستاویزات کی ایک سیریز پر مشتمل ہو سکتا ہے جس میں بتایا گیا ہے کہ آپ کی مصنوعات کو کیسے استعمال کیا جائے۔
اس طرح، ہر ارادہ سوالات کی فہرست اور ایک مخصوص جواب کے بجائے ایک دستاویز سے منسلک ہوتا ہے، جیسے "لاگ ان کے مسائل" کے لیے ایک ارادہ، "سبسکرائب کرنے کا طریقہ" وغیرہ کا ایک ارادہ۔ جب کوئی صارف لاگ ان کے بارے میں کوئی سوال پوچھتا ہے، تو ہم "لاگ ان کے مسائل" دستاویز کو سیاق و سباق کی معلومات کے طور پر GPT-3 کو بھیج سکتے ہیں اور اس کے لیے مخصوص جواب پیدا کر سکتے ہیں۔ صارف کا سوال.
یہ نقطہ نظر ان ارادوں کی تعداد کو کم کرتا ہے جن کو منظم کرنے کی ضرورت ہے اور ایسے جوابات کی اجازت دیتا ہے جو ہر سوال کے ساتھ بہتر طور پر موافقت پذیر ہوں۔ مزید برآں، اگر ارادے سے وابستہ دستاویز مختلف عمل کی وضاحت کرتی ہے (مثال کے طور پر "ویب سائٹ پر لاگ ان" اور دوسرا "موبائل ایپ پر لاگ ان" کے لیے، GPT-3 حتمی جواب دینے سے پہلے صارف سے خود بخود وضاحت طلب کر سکتا ہے۔ .
ہم پورے KB کو GPT-3 تک کیوں نہیں پاسکتے؟
آج، LLMs جیسے GPT-3 کا زیادہ سے زیادہ پرامپٹ سائز تقریباً 4k ٹوکن ہے (text-davinci-003
ماڈل کے لیے) جو کہ بہت کچھ ہے لیکن ایک ہی پرامپٹ میں پورے علم کی بنیاد فراہم کرنے کے لیے کافی نہیں ہے۔ LLMs میں کمپیوٹیشنل وجوہات کی بنا پر زیادہ سے زیادہ پرامپٹ سائز ہوتا ہے، کیونکہ ان کے ساتھ ٹیکسٹ بنانے میں متعدد کمپیوٹیشنز شامل ہوتے ہیں جو فوری طور پر بڑھتے ہیں جیسے جیسے فوری سائز بڑھتا ہے۔
ٹیکسٹ جنریشن کی صلاحیتوں کو برقرار رکھتے ہوئے مستقبل کے LLM میں یہ حد نہیں ہو سکتی۔ تاہم، ابھی کے لئے، ہمیں اس کے ارد گرد ایک حل ڈیزائن کرنے کی ضرورت ہے.
GPT-3 کے ساتھ چیٹ بوٹ کیسے کام کر سکتا ہے۔
لہذا، چیٹ بوٹ پائپ لائن کو دو مراحل سے بنایا جا سکتا ہے:
- سب سے پہلے، ہمیں صارف کے سوال کے لیے مناسب ارادے کو منتخب کرنے کی ضرورت ہے، یعنی ہمیں اپنے علم کی بنیاد سے صحیح دستاویز کو بازیافت کرنے کی ضرورت ہے۔
- پھر، ہمارے پاس صحیح دستاویز ہونے کے بعد، ہم صارف کے لیے مناسب جواب تیار کرنے کے لیے GPT-3 کا فائدہ اٹھا سکتے ہیں۔ ایسا کرنے میں، ہمیں ایک اچھا پرامپٹ تیار کرنے کی ضرورت ہوگی۔
پہلا مرحلہ بنیادی طور پر semantic search کے ذریعے حل کیا جاتا ہے۔ ہم sentence-transformers
لائبریری سے پہلے سے تربیت یافتہ ماڈل استعمال کر سکتے ہیں اور آسانی سے ہر دستاویز کو اسکور تفویض کر سکتے ہیں۔ سب سے زیادہ سکور والی دستاویز وہ ہے جو چیٹ بوٹ جواب تیار کرنے کے لیے استعمال کی جائے گی۔
GPT-3 کے ساتھ جوابات تیار کرنا
ہمارے پاس صحیح دستاویز ہونے کے بعد، ہمیں جواب تیار کرنے کے لیے GPT-3 کے ساتھ استعمال کرنے کے لیے ایک اچھا پرامپٹ بنانا ہوگا۔ درج ذیل تجربات میں، ہم ہمیشہ 0.7
درجہ حرارت کے ساتھ text-davinci-003
ماڈل استعمال کریں گے۔
پرامپٹ تیار کرنے کے لیے، ہم استعمال کرتے ہوئے تجربہ کریں گے:
- رول پرمپٹنگ: ایک تحقیقی تکنیک جو AI کو ایک مخصوص کردار تفویض کرتی ہے۔
- متعلقہ KB معلومات، یعنی وہ دستاویز جو لفظی تلاش کے مرحلے میں حاصل کی گئی ہے۔
- صارف اور چیٹ بوٹ کے درمیان آخری پیغامات کا تبادلہ۔ یہ صارف کی طرف سے بھیجے گئے پیغامات کے لیے مفید ہیں جہاں پورا سیاق و سباق بیان نہیں کیا گیا ہے۔ ہم بعد میں اس کی مثال دیکھیں گے۔ GPT-3 کے ساتھ گفتگو کا نظم کرنے کا طریقہ دیکھنے کے لیے اس مثال پر ایک نظر ڈالیں۔
- آخری، صارف کا سوال۔
آئیے
رول پرمپٹنگ تکنیک کا استعمال کرتے ہوئے اپنا پرامپٹ شروع کریں۔
Skippy نامی ایک اعلی درجے کی چیٹ بوٹ کے طور پر، آپ کا بنیادی مقصد اپنی
بہترین صلاحیت کے مطابق صارفین کی مدد کرنا ہے۔
پھر، فرض کریں کہ سیمنٹک سرچ مرحلہ درج ذیل دستاویز کو ہمارے علم کی بنیاد سے نکالتا ہے۔ تمام دستاویزات میں بتایا گیا ہے کہ ویڈیو گرام پروڈکٹ کیسے کام کرتا ہے، جو کہ انسٹاگرام کی طرح ایک خیالی پروڈکٹ ہے، لیکن صرف ویڈیوز کے لیے۔
ہم اس طرح پرامپٹ کے اندر
اس کا مواد شامل کر سکتے ہیں۔
Skippy نامی ایک اعلی درجے کی چیٹ بوٹ کے طور پر، آپ کا بنیادی مقصد اپنی بہترین صلاحیت کے مطابق صارفین کی مدد کرنا ہے۔
CONTEXT شروع کریں
ویب سائٹ
سے ویڈیو گرام میں لاگ ان کریں۔ 1. اپنا ویب براؤزر کھولیں اور ویڈیو گرام ویب سائٹ پر جائیں۔
- صفحہ کے اوپری دائیں کونے میں واقع "لاگ ان" بٹن پر کلک کریں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن پر کلک کریں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
موبائل ایپ
سے ویڈیو گرام میں لاگ ان کریں۔ 1۔ اپنے موبائل ڈیوائس پر ویڈیو گرام ایپ کھولیں۔
- مرکزی صفحہ پر، نیچے دائیں کونے میں واقع "لاگ ان" بٹن کو تھپتھپائیں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن کو تھپتھپائیں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
CONTEXT کو ختم کریں
آخر میں، ہمیں پرامپٹ کے آخر میں
گفتگو اور صارف کا سوال شامل کرنا ہوگا، جیسا کہ درج ذیل مثال میں ہے۔
Skippy نامی ایک اعلی درجے کی چیٹ بوٹ کے طور پر، آپ کا بنیادی مقصد اپنی بہترین صلاحیت کے مطابق صارفین کی مدد کرنا ہے۔
CONTEXT شروع کریں
ویب سائٹ
سے ویڈیو گرام میں لاگ ان کریں۔ 1. اپنا ویب براؤزر کھولیں اور ویڈیو گرام ویب سائٹ پر جائیں۔
- صفحہ کے اوپری دائیں کونے میں واقع "لاگ ان" بٹن پر کلک کریں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن پر کلک کریں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
موبائل ایپ
سے ویڈیو گرام میں لاگ ان کریں۔ 1۔ اپنے موبائل ڈیوائس پر ویڈیو گرام ایپ کھولیں۔
- مرکزی صفحہ پر، نیچے دائیں کونے میں واقع "لاگ ان" بٹن کو تھپتھپائیں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن کو تھپتھپائیں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
CONTEXT کو ختم کریں
SKIPPY: ہیلو، میں سکپی ہوں! میں آپ کی مدد کیسے کر سکتا ہوں؟
صارف: میں لاگ ان بٹن نہیں ڈھونڈ سکتا۔
SKIPY:
اس پرامپٹ کو GPT-3 پر منتقل کرتے ہوئے، مجھے مندرجہ ذیل تیار کردہ جواب ملا۔
کوئی مسئلہ نہیں! ویب سائٹ پر، لاگ ان بٹن صفحہ کے اوپری دائیں کونے میں واقع
ہے۔ موبائل ایپ پر، لاگ ان بٹن نیچے دائیں کونے میں واقع ہے۔ اگر آپ کو مزید
مدد کی ضرورت ہو تو مجھے بتائیں!
غور کریں کہ کس طرح پیدا کردہ جواب میں معلومات نالج بیس دستاویز سے آتی ہیں۔
GPT-3 کے ساتھ ابہام پیدا کرنے والے سوالات
آئیے صارف کے مزید مبہم الفاظ کے ساتھ کوشش کریں، جیسے
"لاگ ان نہیں ہو سکتا"۔ یہاں مکمل پرامپٹ ہے۔
Skippy نامی ایک اعلی درجے کی چیٹ بوٹ کے طور پر، آپ کا بنیادی مقصد اپنی بہترین صلاحیت کے مطابق صارفین کی مدد کرنا ہے۔
CONTEXT شروع کریں
ویب سائٹ
سے ویڈیو گرام میں لاگ ان کریں۔ 1. اپنا ویب براؤزر کھولیں اور ویڈیو گرام ویب سائٹ پر جائیں۔
- صفحہ کے اوپری دائیں کونے میں واقع "لاگ ان" بٹن پر کلک کریں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن پر کلک کریں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
موبائل ایپ
سے ویڈیو گرام میں لاگ ان کریں۔ 1۔ اپنے موبائل ڈیوائس پر ویڈیو گرام ایپ کھولیں۔
- مرکزی صفحہ پر، نیچے دائیں کونے میں واقع "لاگ ان" بٹن کو تھپتھپائیں۔
- لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔
- ایک بار جب آپ اپنی اسناد درج کر لیں، "لاگ ان" بٹن کو تھپتھپائیں۔
- اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔
CONTEXT کو ختم کریں
SKIPPY: ہیلو، میں سکپی ہوں! میں آپ کی مدد کیسے کر سکتا ہوں؟
USER: لاگ ان نہیں ہو سکتا
SKIPPY:
GPT-3 جوابات بہتر طور پر سمجھنے کی کوشش کر رہے ہیں کہ صارف کا مسئلہ کیا ہے۔
مجھے یہ سن کر افسوس ہوا۔ کیا آپ مجھے بتا سکتے ہیں کہ کیا آپ ویڈیو گرام ویب
سائٹ یا موبائل ایپ کے ذریعے لاگ ان کرنے کی کوشش کر رہے ہیں؟
اگلا، یہاں ہے کہ مکمل گفتگو کیسے ہوتی ہے۔ بہتر مرئیت کے لیے پورا پرامپٹ چھپا ہوا ہے۔
صارف: لاگ ان نہیں ہو سکتا
SKIPPY: مجھے یہ سن کر افسوس ہوا۔ کیا آپ مجھے بتا سکتے ہیں کہ کیا آپ ویڈیو گرام ویب سائٹ یا موبائل ایپ کے ذریعے لاگ ان کرنے کی کوشش کر رہے ہیں؟
صارف: موبائل ایپ
SKIPPY: ٹھیک ہے، کوئی مسئلہ نہیں۔ موبائل ایپ کے ذریعے لاگ ان کرنے کے لیے، اپنے موبائل ڈیوائس پر ویڈیو گرام ایپ کھولیں۔ مرکزی صفحہ پر، نیچے دائیں کونے میں واقع "لاگ ان" بٹن کو تھپتھپائیں۔ لاگ ان صفحہ پر، اپنا ویڈیو گرام صارف نام اور پاس ورڈ درج کریں۔ اپنی اسناد داخل کرنے کے بعد، "لاگ ان" بٹن کو تھپتھپائیں۔ اب آپ کو اپنے ویڈیو گرام اکاؤنٹ میں لاگ ان ہونا چاہیے۔ اگر آپ کو مزید مدد کی ضرورت ہو تو براہ کرم مجھے بتائیں۔
GPT-3 ابہام کا انتظام کر سکتا ہے، بشرطیکہ اس کے پاس صحیح سیاق و سباق کی معلومات ہو۔
GPT-3 کے ساتھ جوابات تیار کرنے میں دشواری
پچھلی مثالوں نے اچھا کام کیا۔ تاہم، کئی طریقے ہیں جن میں یہ چیٹ بوٹ ناکام ہو سکتا ہے۔
اگر ہم پوچھیں "کیا موبائل ایپ مفت ہے؟" لاگ ان دستاویز کو سیاق و سباق کے طور پر پاس کرتے ہوئے GPT-3 پر، آپ کو اکثر ایسا جواب ملتا ہے جیسے "ہاں، ویڈیو گرام موبائل ایپ ڈاؤن لوڈ اور استعمال کرنے کے لیے مفت ہے"، چاہے ایسی معلومات سیاق و سباق کی معلومات میں شامل نہ ہو۔ کسٹمر سروس چیٹ بوٹس کے لیے غلط معلومات پیدا کرنا بہت برا ہے!
GPT-3 شاذ و نادر ہی غلط معلومات پیدا کرتا ہے جب صارف کے سوال کا جواب سیاق و سباق میں مل سکتا ہے۔ چونکہ صارف کے سوالات اکثر مختصر اور مبہم ٹیکسٹ ہوتے ہیں، اس لیے ہم ہمیشہ صحیح دستاویز کی بازیافت کے لیے معنوی تلاش کے مرحلے پر بھروسہ نہیں کر سکتے، اور اس لیے ہم ہمیشہ غلط معلومات پیدا کرنے کا خطرہ رکھتے ہیں۔
نتیجہ
GPT-3 بات چیت کے چیٹ بوٹس بنانے کے لیے بہت کارآمد ہے اور پرامپٹ میں دی گئی سیاق و سباق کی معلومات کی بنیاد پر مخصوص سوالات کے جوابات دینے کے قابل ہے۔ تاہم، ماڈل کو سیاق و سباق میں صرف معلومات سے فائدہ اٹھاتے ہوئے جوابات تیار کرنا مشکل ہے، کیونکہ ماڈل فریب کا شکار ہوتا ہے (یعنی نئی معلومات پیدا کرنا، ممکنہ طور پر غلط)۔ غلط معلومات پیدا کرنا استعمال کے معاملے کے لحاظ سے مختلف شدت کا مسئلہ ہے۔
تحریر کردہ بذریعہ Fabio Chiusano۔
Footnotes
-
Nadeem, M., Bethke, A., & Reddy, S. (2021). StereoSet: Measuring stereotypical bias in pretrained language models. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 5356–5371. https://doi.org/10.18653/v1/2021.acl-long.416 ↩
-
Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y., Madotto, A., & Fung, P. (2022). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. https://doi.org/10.1145/3571730 ↩