سسٹم پرامپٹس کے بجائے مہارتیں: ایک Anki ٹیوٹر بنانا

AI مجھے سست بنا رہا ہے۔

میرا مطلب یہ نہیں کہ میں چاہتا ہوں کہ روبوٹ سب کچھ کریں۔ میرا مطلب یہ ہے کہ ایک بار جب آپ بورنگ کاموں کے لیے کسی ایجنٹ کا استعمال شروع کر دیتے ہیں، تو دستی طریقہ کار (manual workflows) غلط محسوس ہونے لگتے ہیں۔

Anki اسپیسڈ ریپیٹیشن (spaced repetition) کے لیے میرا ٹول ہے۔ یہ اچھا کام کرتا ہے۔ لیکن مجھے ایک مسئلہ درپیش ہے۔ میں خود کو دھوکہ دیتے ہوئے پاتا ہوں۔ میں ایک مشکل کارڈ دیکھتا ہوں اور آگے بڑھنے کے لیے خود سے کہتا ہوں "مجھے یہ معلوم تھا"۔ یہ پڑھائی نہیں ہے۔ یہ محض اندازہ لگانا ہے۔

مجھے ایک اسٹڈی بڈی (study buddy) چاہیے تھا۔ میں چاہتا تھا کہ کوئی مجھ سے سوالات پوچھے، میرے جواب کا اصل جواب سے موازنہ کرے، اور مجھے درست ریٹنگ کا فیصلہ کرنے میں مدد دے۔

میں نے ایک بہت بڑے سسٹم پرامپٹ کے ذریعے اسے بنانے کی کوشش کی۔ میں نے ایجنٹ کو بتایا کہ ٹیوشن کیسے دینی ہے، کارڈز کیسے لکھنے ہیں، اور Telegram پر کیسے کام کرنا ہے۔

یہ ناکام رہا۔ بڑے پرامپٹس کباڑ خانے بن جاتے ہیں۔ وہ خراب ہو جاتے ہیں۔ وہ الجھن کا باعث بنتے ہیں۔

میں نے اپنا طریقہ کار بدل دیا۔ میں نے Google Antigravity SDK کا استعمال کیا۔

ایک بڑے پرامپٹ کے بجائے، میں نے تہوں (layers) پر مشتمل ایک ایجنٹ سسٹم بنایا۔

  • ٹولز (Tools) ایجنٹ کو ہاتھ فراہم کرتے ہیں۔
  • مہارتیں (Skills) ایجنٹ کو عادات فراہم کرتی ہیں۔
  • پالیسیز (Policies) حدود کا تعین کرتی ہیں۔
  • ہکس (Hooks) ضمانتیں فراہم کرتے ہیں۔
  • ٹریگرز (Triggers) واقعات پر ردعمل دیتے ہیں۔

میں نے Anki سے منسلک ہونے کے لیے Python ٹولز کا استعمال کیا۔ اب ایجنٹ ڈیکس (decks) کی فہرست بنا سکتا ہے، واجب الادا کارڈز حاصل کر سکتا ہے، اور انہیں ریٹ کر سکتا ہے۔

لیکن ٹولز طرزِ عمل (behavior) نہیں ہیں۔ طرزِ عمل کے لیے، میں نے مہارتوں (skills) کا استعمال کیا۔

ایک مہارت (skill) ایک چھوٹی فائل ہوتی ہے جس میں مخصوص ہدایات ہوتی ہیں۔ میں نے تین بنائی ہیں:

  • review-buddy: اسٹڈی سیشن کیسے چلانا ہے۔
  • plain-cards: اعلیٰ معیار کے فلیش کارڈز کیسے لکھنے ہیں۔
  • codebase-cards: کوڈ کو تعلیمی مواد میں کیسے تبدیل کرنا ہے۔

اس سے مین سسٹم پرامپٹ چھوٹا رہتا ہے۔ شناخت پرامپٹ میں رہتی ہے، جبکہ کام کی تفصیلات مہارتوں (skills) میں ہوتی ہیں۔

میں نے حفاظت (safety) بھی شامل کی۔ ایک پرامپٹ ناکام ہو سکتا ہے، لیکن ایک پالیسی نہیں۔ میں نے پریکٹس موڈ کے دوران مخصوص اقدامات کو روکنے کے لیے ایک پالیسی کا استعمال کیا۔ اگر ایجنٹ کریم سیشن (cram session) کے دوران میرا شیڈول تبدیل کرنے کی کوشش کرتا ہے، تو SDK اسے رن ٹائم لیول پر روک دیتا ہے۔

اس کا نتیجہ ایک ملٹی سرفس ایجنٹ (multi-surface agent) کی صورت میں نکلا۔ میں اسی منطق کو اپنے ٹرمینل، Telegram پر وائس نوٹس کے ذریعے، اور ایک ڈیک بلڈر میں استعمال کرتا ہوں جو میرے کوڈ کی تبدیلیوں پر نظر رکھتا ہے۔

بہتر پرامپٹس بنانے کی کوشش کرنا چھوڑ دیں۔ چھوٹے پرامپٹس اور زیادہ تیز مہارتیں (sharper skills) بنانا شروع کریں۔

Source: https://dev.to/gde/skills-over-system-prompts-building-an-anki-tutor-with-the-antigravity-sdk-2o8f

Optional learning community: https://t.me/GyaanSetuAi