इस हफ्ते आपकी टीम को बेहतर AI मॉडल की ज़रूरत नहीं है

आपकी टीम को किसी नए AI मॉडल की ज़रूरत नहीं है। उन्हें बेहतर वर्कफ़्लो (workflows) की ज़रूरत है।

नवीनतम मॉडल की तलाश करना बंद करें। अपने निष्पादन (execution) को इंजीनियर करना शुरू करें। अधिकांश टीमें एक ही तरह की समस्याओं का सामना करती हैं। एजेंट लूप (agent loops) कार्यों के बीच में ही विफल हो जाते हैं। अप्रूवल प्रॉम्प्ट्स (approval prompts) लोगों को भ्रमित करते हैं। रिट्राइज़ (retries) के दौरान कॉन्टेक्स्ट चेन (context chains) टूट जाती हैं। इंसान गलतियों को सुधारने में घंटों बिताते हैं क्योंकि ऑटोमेशन अपना स्टेट (state) खो देता है।

समस्या अब इंटेलिजेंस (intelligence) की नहीं है। समस्या निष्पादन (execution) की है।

हम ऑर्केस्ट्रेशन टैक्स (orchestration tax) के युग में प्रवेश कर रहे हैं। यदि आप इसके लिए योजना नहीं बनाते हैं, तो आप आउटेज (outages) और साइलेंट फेलियर (silent failures) के रूप में इसकी कीमत चुकाते हैं। आप इसकी कीमत तब चुकाते हैं जब इंजीनियर देर रात तक बॉट्स की देखभाल करते हैं।

AI आउटपुट शायद ही कभी अंतिम उत्पाद होता है। यह एक बड़े सिस्टम में एक मध्यवर्ती चरण (intermediate step) है। यह टिकट ट्राइएज (ticket triage), PR ड्राफ्टिंग और टेस्ट जनरेशन में मदद करता है।

आपको इन सवालों के जवाब देने होंगे:

  • क्या टाइमआउट के बाद कार्य फिर से शुरू हो सकता है?
  • क्या हम ऑडिट कर सकते हैं कि बदलाव को किसने मंजूरी दी?
  • क्या हम डुप्लिकेट साइड इफेक्ट्स (side effects) पैदा किए बिना किसी कार्य को फिर से चला सकते हैं?
  • क्या कोई इंसान बिना दोबारा शुरू किए बीच में कार्यभार संभाल सकता है?

सीनियर इंजीनियर पहले से ही जानते हैं कि इसे कैसे हल किया जाए। हमने वर्षों पहले पेमेंट्स और बैकग्राउंड जॉब्स के लिए इन समस्याओं को हल कर लिया था। हम idempotency keys, checkpoints और transaction logs का उपयोग करते हैं। AI बस इन विफलताओं को तेज़ी से होने का कारण बनाता है।

मॉडल की गुणवत्ता समीकरण का केवल एक हिस्सा है। एक टूटे हुए वर्कफ़्लो पर एक बेहतरीन मॉडल अराजकता पैदा करता है। एक मजबूत वर्कफ़्लो पर एक ठीक-ठाक मॉडल वैल्यू (value) बनाता है।

केवल 'वाइब्स' (vibes) के पीछे भागने के बजाय एक व्यावहारिक प्लेबुक (playbook) बनाएं:

  1. AI काम को स्पष्ट चरणों में विभाजित करें। collect_context, propose_change, और run_checks जैसे चरणों का उपयोग करें। एक विशाल प्रॉम्प्ट को पूरी प्रक्रिया चलाने की अनुमति न दें।

  2. ड्यूरेबिलिटी (durability) के लिए डेटाबेस का उपयोग करें। अपने वर्कफ़्लो स्टेटस और इवेंट लॉग्स को Postgres जैसे डेटाबेस में स्टोर करें। यदि कोई वर्कर क्रैश हो जाता है, तो आप मेमोरी के बजाय स्टेट (state) से रिकवर कर सकते हैं।

  3. Idempotency लागू करें। डेटा बदलने वाले हर एक्शन के लिए एक स्थिर की (key) की आवश्यकता होती है। यदि कोई चरण दो बार चलता है, तो परिणाम वही रहना चाहिए।

  4. टियर्स (tiers) के साथ परमिशन मैनेज करें। लगातार अप्रूवल न मांगें। रीड-ओनली कार्यों, कम जोखिम वाले राइट्स (writes), और उच्च-प्रभाव वाले बदलावों के लिए टियर्स बनाएं।

  5. ऑपरेशनल मेट्रिक्स (operational metrics) को ट्रैक करें। केवल लेटेंसी (latency) और लागत को ट्रैक करना बंद करें। रिट्राइ सक्सेस रेट, ह्यूमन इंटरवेंशन पॉइंट्स और रोलबैक फ्रीक्वेंसी को ट्रैक करें।

बेहतरीन AI टीमें स्वायत्त एजेंटों (autonomous agents) के बारे में डींगें नहीं मारेंगी। वे टिकाऊ, ऑब्जर्वेबल पाइपलाइन (observable pipelines) बनाएंगी। उनकी ताकत जादुई प्रॉम्प्ट्स नहीं, बल्कि अनुशासित सिस्टम इंजीनियरिंग होगी।

मॉडल हर महीने स्मार्ट होते जा रहे हैं। आपका लाभ ऐसे वर्कफ़्लो बनाने से आता है जो चीजें गलत होने पर घबराते नहीं हैं।

Source: https://dev.to/chrisbuildsonline/your-team-doesnt-need-a-better-ai-model-this-week-2og7

Optional learning community: https://t.me/GyaanSetuAi