প্রতিটি API এজেন্টদের জন্য নতুন করে তৈরি করা হবে

MCP সংযোগের সমস্যা সমাধান করে। এটি 'verb gap' বা ক্রিয়াগত ব্যবধান সমাধান করে না।

আপনি এক বিকেলেই একটি নিখুঁত REST API-কে MCP-এর মাধ্যমে র‍্যাপ (wrap) করতে পারেন। তবুও, একটি কোডিং এজেন্ট লড়াই করবে। এটি ভুল এন্ডপয়েন্ট (endpoint) বেছে নেবে। একটি টুলের বদলে এটি তিনটি টুল কল করবে। এটি না জিজ্ঞেস করেই কোনো ধ্বংসাত্মক রাইট (destructive write) অপারেশন করে ফেলতে পারে।

API-টি ত্রুটিপূর্ণ নয়। এটি কেবল ভুল ব্যবহারকারীর জন্য তৈরি করা হয়েছে।

বিশ বছর ধরে, API তৈরি করা হয়েছে মানুষের জন্য। মানুষ উদ্দেশ্য (intent) এবং একটি মানসিক মডেল (mental model) নিয়ে আসে। এজেন্টরা দুটির কোনটিই নিয়ে আসে না। তাদের আপনার ইন্টারফেস থেকে উভয়ই পুনর্গঠন করতে হয়।

যখন প্রাথমিক ব্যবহারকারী এতটা বদলে যায়, তখন ইন্টারফেসকেও অবশ্যই পরিবর্তন করতে হবে।

আমি বিশ্বাস করি, সিরিয়াস প্রোডাক্ট সারফেসগুলো কেবল বিদ্যমান API-গুলোকে র‍্যাপ করবে না। তারা সেগুলোকে এজেন্ট-নেটিভ (agent-native) অপারেশনগুলোর ওপর ভিত্তি করে নতুন করে তৈরি করবে।

এর অর্থ হলো রিসোর্স-আকৃতির (resource-shaped) API থেকে ইনটেন্ট-আকৃতির (intent-shaped) কন্ট্রাক্টে চলে আসা। আমাদের লক্ষ্য (goals), অবস্থা (state), পার্শ্বপ্রতিক্রিয়া (side-effects), অনুমোদন (approval) এবং রিকভারির (recovery) ওপর ভিত্তি করে নতুন করে ডিজাইন করতে হবে।

MCP সংযোগ এবং ট্রান্সপোর্টের জন্য একটি চমৎকার স্ট্যান্ডার্ড। কিন্তু স্পেসিফিকেশনে, একটি টুল হলো কেবল একটি নাম এবং স্কিমাযুক্ত একটি ফাংশন। এটি অপারেশনের ক্রম বা কোনটি বিপজ্জনক তা নির্ধারণ করে না।

এটিই 'verb gap' তৈরি করে। API এজেন্টদের বিশেষ্য (nouns) এবং CRUD অপারেশন প্রদান করে। এজেন্টদের এমন ক্রিয়া (verbs) প্রয়োজন যা উদ্দেশ্য বহন করে।

GitHub-এর দিকে তাকান। তারা এজেন্টের রিজনিং (reasoning) উন্নত করার জন্য তাদের টুলসেট সীমিত করছে। তারা শিখছে যে প্রোডাক্ট API থেকে এজেন্ট টুলের ১:১ ম্যাপিং কাজ করে না।

গবেষণা দেখায় যে একটি API কাঠামোগতভাবে সঠিক হলেও এজেন্টের জন্য অর্থগতভাবে (semantically) অকেজো হতে পারে। একটি এজেন্ট-নেটিভ API কেবল "আমি কী রিটার্ন করব" এই প্রশ্নের উত্তর দেয় না। এটি উত্তর দেয়:

  • লক্ষ্য কী?
  • আমি কোন অবস্থায় আছি?
  • পার্শ্বপ্রতিক্রিয়াগুলো কী কী?
  • আমার কি অনুমোদনের প্রয়োজন?
  • আমি কীভাবে রিকভার করব?

একটি সরাসরি রাইটের পরিবর্তে, আপনার একটি বিভাজন প্রয়োজন:

  • অ্যাকশনটি প্রিভিউ করুন।
  • সুনির্দিষ্ট অনুমোদন নিন।
  • পরিবর্তনটি কমিট করুন।
  • ব্যর্থ হলে রোলব্যাক করুন।

এটি কেবল একটি "এজেন্ট এডিশন" নয়। এটি সহজভাবে একটি উন্নত API। ডেভেলপাররাও প্রিভিউ, স্পষ্ট পারমিশন এরর এবং রোলব্যাক চান। শেষ পর্যন্ত, এজেন্ট-নেটিভ ডিজাইনটি মানুষের জন্য তৈরি ডিজাইনকে প্রতিস্থাপন করবে।

এই পরিবর্তনটি বিশাল। এটি API, CLI এবং লগ-কে প্রভাবিত করে। আমাদের মানুষের পাঠযোগ্য গদ্য (prose) থেকে মেশিন-পার্সেবল (machine-parseable) স্টেটে চলে আসতে হবে।

নিরাপত্তা এমন কোনো র‍্যাপার নয় যা আপনি পরে যোগ করবেন। নিরাপত্তা হলো এমন একটি বৈশিষ্ট্য যা আপনি অপারেশনের মধ্যেই ডিজাইন করবেন।

Source: https://dev.to/gyu07/every-api-will-be-rebuilt-for-agents-2hj4

Optional learning community: https://t.me/GyaanSetuAi