మీ మోడల్‌ను ఫైన్-ట్యూన్ చేయడం ఆపండి. మీ ఆర్కిటెక్చరే సమస్య.

డెమోలు అద్భుతంగా కనిపిస్తాయి. ప్రొడక్షన్ సిస్టమ్స్ వేరుగా ఉంటాయి. ఈ రెండింటి మధ్య ఒక వ్యత్యాసం ఉంది.

ప్రజలు ఇప్పుడు ప్రతిదాన్ని ఏజెంట్ అని పిలుస్తున్నారు. మెమరీ ఉన్న చాట్‌బాట్ ఒక ఏజెంట్. లూప్ ఉన్న స్క్రిప్ట్ ఒక ఏజెంట్. ఈ పొరపాటు ఇంజనీరింగ్ లోపాలకు దారితీస్తుంది. దీనివల్ల మీరు సాధారణ పనులకు అతిగా ఇంజనీరింగ్ (over-engineering) చేస్తారు మరియు సంక్లిష్టమైన పనులకు తక్కువ ఇంజనీరింగ్ (under-engineering) చేస్తారు.

ఒక ఏజెంట్‌కు ఒక లక్ష్యం (objective) ఉండాలి. అది కేవలం ఒక సూచనను మాత్రమే అనుసరించదు. తదుపరి ఏమి చేయాలో అది నిర్ణయిస్తుంది. అది వైఫల్యాలను (failure) ఎదుర్కొంటుంది. ఎప్పుడు ఆగాలో దానికి తెలుసు.

మీ సిస్టమ్‌ను తనిఖీ చేయడానికి ఈ నియమాలను ఉపయోగించండి:

  • ఒకవేళ మనిషి ప్రతి అడుగును నడిపించాల్సి వస్తే, అది ఒక చాట్ ఇంటర్‌ఫేస్.
  • ఒకవేళ అది ఫెయిల్ అయిన టూల్ కాల్ నుండి కోలుకోగలిగితే, అది ఒక ఏజెంట్.
  • ఒకవేళ అది ఒక లక్ష్యాన్ని ఉప-పనులుగా (subtasks) విభజిస్తే, అది నిజమైన ఏజెంట్.

విజయవంతమైన బృందాలు కొత్త మోడళ్ల కోసం వెతకవు. అవి నిర్దిష్టమైన, ప్రత్యేక ప్రయోజనాల కోసం రూపొందించిన పైప్‌లైన్‌లను (pipelines) నిర్మిస్తాయి. అవి ఈ మూడు విషయాలపై దృష్టి పెడతాయి:

  • టూల్ డిజైన్: ఇంటర్‌ఫేస్ ఎంత స్పష్టంగా ఉంది?
  • ఫెయిల్యూర్ హ్యాండ్లింగ్: ఒక టూల్ ఏమీ తిరిగి ఇవ్వనప్పుడు ఏమి జరుగుతుంది?
  • అబ్జర్వబిలిటీ (Observability): మీరు ప్రతి నిర్ణయాన్ని ట్రాస్ చేయగలరా?

మీరు ఉపయోగించే ఫ్రేమ్‌వర్క్ కంటే మీ ప్యాటర్న్స్ (patterns) ముఖ్యం. నేను వివిధ ఫ్రేమ్‌వర్క్‌లలో ఆర్కిటెక్చర్‌లను మళ్ళీ నిర్మించాను, ఫలితాలు మాత్రం ఒకేలా ఉన్నాయి. ఫ్రేమ్‌వర్క్ అనేది కేవలం ఒక తాత్కాలిక మద్దతు (scaffolding) మాత్రమే. ఆర్కిటెక్చర్ అనేది అసలైన భవనం.

ఈ ప్యాటర్న్స్‌ను అనుసరించండి:

  • ముందు ప్లాన్ చేసి, ఆపై అమలు చేయండి. రీజనింగ్ (reasoning) కోసం ఒక అడుగును మరియు చర్య (action) కోసం మరొక ప్రత్యేక అడుగును ఉపయోగించండి.
  • రిట్రీవల్ (retrieval) ను రీజనింగ్ నుండి వేరు చేయండి. కాంటెక్స్ట్‌ను సేకరించడం మరియు కాంటెక్స్ట్‌ను ఉపయోగించడం అనేవి వేర్వేరు పనులు.
  • స్పష్టమైన హ్యాండ్‌ఆఫ్స్ (handoffs) ఉపయోగించండి. ఒక ఏజెంట్ మరొక ఏజెంట్‌కు పనిని అప్పగించినప్పుడు, స్ట్రక్చర్డ్ లాగ్స్ (structured logs) ఉపయోగించండి.

RAG అనేది ప్రామాణికమైనది, కానీ చంకింగ్ (chunking) తరచుగా తప్పుగా ఉంటుంది. మీరు డాక్యుమెంట్లను సరిగ్గా విభజించకపోతే, మోడల్ కాంటెక్స్ట్‌ను కోల్పోతుంది. దీనివల్ల హాలూసినేషన్స్ (hallucinations) ఏర్పడతాయి.

మీ RAG పైప్‌లైన్ ఉపయోగం లేని ఫలితాలను ఇస్తుంటే, మీ చంకింగ్ మరియు మెటాడేటాను పరిశీలించండి. ఎంబెడ్డింగ్ మోడల్‌ను నిందించకండి.

నమ్మదగిన వ్యవస్థలను నిర్మించడమే ఇంజనీరింగ్ సవాలు. గవర్నెన్స్, అబ్జర్వబిలిటీ మరియు నమ్మదగిన టూల్ వినియోగంపై దృష్టి పెట్టండి. కేవలం బెంచ్‌మార్క్‌ల వెనుక పడకండి.

ఉత్తమ ఇంజనీర్లు సిస్టమ్స్ డిజైన్‌పై దృష్టి పెడతారు. ఇతరులు నిర్వహించగలిగే మరియు నమ్మగలిగే AI వ్యవస్థలను వారు నిర్మిస్తారు.

Source: https://dev.to/aibughunter/stop-fine-tuning-your-model-your-architecture-is-the-problem-3kkg