तुमच्या टीमला या आठवड्यात अधिक चांगल्या AI मॉडेलची गरज नाही

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial२ आठवड्यांपूर्वी2min read

तुमच्या टीमला या आठवड्यात अधिक चांगल्या AI मॉडेलची गरज नाही

तुमच्या टीमला या आठवड्यात चांगल्या AI मॉडेलची गरज नाही

नवीन AI मॉडेल्स शोधणे थांबवा. तुम्हाला ज्या खऱ्या अपग्रेडची गरज आहे, ती म्हणजे तुमचा वर्कफ्लो (workflow).

बहुतेक टीम्स कोणते मॉडेल अधिक हुशार वाटते यावर लक्ष केंद्रित करतात. ते नवीन रिलीझचे बेंचमार्क तपासतात आणि बुद्धिमत्तेबद्दल वाद घालतात. पण जर तुम्ही LLMs सोबत काम करत असाल, तर तुम्हाला खरी अडचण माहित आहे. समस्या खराब कोडची नाहीये. समस्या खराब अंमलबजावणीची (execution) आहे.

तुम्हाला या समस्या दिसून येतात:

एजंट लूप्स (Agent loops) जे कामाच्या अर्धवट टप्प्यावर थांबतात.
अप्रूव्हल प्रॉम्प्ट्स (Approval prompts) जे लोकांना गोंधळात टाकतात.
रिट्राय (retries) दरम्यान तुटणारे कॉन्टेक्स्ट चेन्स (Context chains).
ऑटोमेशनची स्थिती (state) गमावल्यामुळे मानवांना काम दुरुस्त करावे लागते.

बुद्धिमत्ता वाढत आहे, पण ऑपरेशनल कंट्रोल (operational control) मागे पडत आहे. आपण 'ऑर्केस्ट्रेशन टॅक्स'च्या (orchestration tax) युगात प्रवेश करत आहोत. जर तुम्ही यासाठी नियोजन केले नाही, तर तुम्हाला सिस्टम आउटेज (outages) आणि शांत अपयशांच्या (silent failures) स्वरूपात त्याची किंमत चुकवावी लागेल.

AI आउटपुट हे क्वचितच अंतिम उत्पादन असते. ते एका मोठ्या सिस्टममधील एक मध्यवर्ती टप्पा आहे. तुम्हाला या प्रश्नांची उत्तरे शोधणे आवश्यक आहे:

टाइमआउट (timeout) नंतर काम पुन्हा सुरू होऊ शकते का?
आपण प्रत्येक अप्रूव्हलचे ऑडिट करू शकतो का?
ड्युप्लिकेट कृतींशिवाय आपण स्टेप्स पुन्हा रन करू शकतो का?
काम सुरू असताना एखादा माणूस ते ताब्यात घेऊ शकतो का?

सिनियर इंजिनिअर्सनी पेमेंट आणि बॅकग्राउंड जॉब्समध्ये ही समस्या अनेक वर्षांपूर्वीच सोडवली होती. आम्ही आयडेम्पोटन्सी कीज (idempotency keys), चेकपॉइंट्स (checkpoints) आणि ट्रान्झॅक्शन लॉग्सचा (transaction logs) वापर केला होता. AI ने या समस्या शोधल्या नाहीत; त्याने फक्त त्या अधिक वेगाने घडवून आणल्या आहेत.

तुमच्या एक्झिक्यूशन कॉन्ट्रॅक्टची (execution contract) निवड करण्यापूर्वी मॉडेल निवडू नका. हे ब्रेक नसलेल्या कारसाठी रेसिंग इंजिन निवडण्यासारखे आहे.

या स्टेप्स वापरून एक विश्वसनीय वर्कफ्लो तयार करा:

AI चे काम लहान स्टेप्समध्ये विभागून घ्या एक मोठा प्रॉम्प्ट वापरू नका. त्याचे विभाजन करा: कॉन्टेक्स्ट गोळा करणे, बदलाचा प्रस्ताव मांडणे, तपासणी करणे, मंजुरी मागणे आणि बदल लागू करणे.
ड्युरेबल स्टोरेज (durable storage) वापरा स्टेटस, स्टेप्स आणि प्रयत्नांची संख्या ट्रॅक करण्यासाठी डेटाबेस वापरा. जर एखादा वर्कर क्रॅश झाला, तर तुम्ही मेमरीऐवजी 'स्टेट' (state) मधून रिकव्हरी करू शकता.
आयडेम्पोटन्सी (idempotency) लागू करा डेटा बदलणाऱ्या प्रत्येक कृतीसाठी एक स्थिर की (stable key) आवश्यक आहे. जर एखादी स्टेप दोनदा रन झाली, तर निकाल तोच राहिला पाहिजे.
टियर्स (tiers) वापरून परवानग्या व्यवस्थापित करा सतत मंजुरी मागणे थांबवा. खालीलप्रमाणे टियर्स तयार करा:

टियर 0: फक्त वाचण्यासाठीची कामे (स्वयंचलित मंजुरी).
टियर 1: कमी जोखमीचे राइट्स (बॅचमध्ये मंजुरी).
टियर 2: उच्च-प्रभाव असलेली कामे (मानवी चेकपॉइंट).

ऑपरेशनल मेट्रिक्स (operational metrics) ट्रॅक करा फक्त लेटन्सी (latency) आणि खर्चाकडे पाहणे थांबवा. टाइमआउट रेट्स, रिट्राय सक्सेस आणि रोलबॅक फ्रिक्वेन्सी ट्रॅक करा.

सर्वोत्तम AI टीम्स 'मॅजिक प्रॉम्प्ट्स'बद्दल बढाई मारणार नाहीत. त्या कंटाळवाणे, ड्युरेबल आणि ऑब्झर्व्हेबल (observable) पाईपलाईन्स चालवतील. त्यांचा फायदा मॉडेलमध्ये नसून शिस्तबद्ध सिस्टम्स इंजिनिअरिंगमध्ये (systems engineering) आहे.

Source: https://dev.to/chrisbuildsonline/your-team-doesnt-need-a-better-ai-model-this-week-29l4

Optional learning community: https://t.me/GyaanSetuAi

तुमच्या टीमला या आठवड्यात अधिक चांगल्या AI मॉडेलची गरज नाही

Continue reading

तुमचा AI खर्च हा मॉडेलचा प्रश्न नाही, तर तो आर्किटेक्चरचा प्रश्न आहे.

Fine Tuning AI Models Is No Longer Just for ML Engineers

तुमच्या एजंट्सना प्रॉम्प्ट करणे थांबवा. त्यांचे नेतृत्व करायला सुरुवात करा.

Your Team Doesn’t Need a Better AI Model This Week

तुमच्या दैनंदिन डेव्हलपमेंट वर्कफ्लोमध्ये AI चा वापर