నేను ఒంటరిగా బహుళ యాప్‌లను ఎలా నడుపుతాను: ది ఏజెంట్ హార్నెస్ (The Agent Harness)

నేను కొన్ని చిన్న యాప్‌లను స్వయంగా తయారు చేస్తాను మరియు నిర్వహిస్తాను. నాకు కో-ఫౌండర్ (cofounder), ఉద్యోగులు లేదా కాంట్రాక్టర్లు ఎవరూ లేరు. నేను ఒక వ్యక్తిని మరియు AI ఏజెంట్ల సమూహాన్ని ఉపయోగిస్తాను.

AI నాకు వేగంగా కోడింగ్ చేయడానికి సహాయపడుతుందని ప్రజలు అనుకుంటారు. కానీ రహస్యం అది కాదు.

రహస్యం ఏమిటంటే, ఆధారాలు లేకుండా ఏ పని పూర్తయిందని AIని నేను ఎప్పుడూ నమ్మను. మీరు ఒంటరిగా పనిచేస్తున్నప్పుడు, ప్రమాదం పని నెమ్మదిగా జరగడం కాదు. ప్రమాదం ఏమిటంటే, తప్పుగా ఉన్నా కూడా అది సరైనదే అని నమ్మడం (being confidently wrong).

AI పరీక్షలు (tests) అసలు రన్ చేయకపోయినా, అవి సక్సెస్ అయ్యాయని మీకు చెబుతుంది. ఒక ఫీచర్ కేవలం ఫంక్షన్ పేరును మాత్రమే రాసినప్పుడు, అది పూర్తయిందని చెబుతుంది. తప్పులను గుర్తించడానికి తోటి ఉద్యోగి లేనప్పుడు, ఒక చిన్న "looks good" అనే నిర్లక్ష్యం మీ యాప్‌ను నాశనం చేయవచ్చు.

నేను 'harness' అనే వ్యవస్థను రూపొందించాను. ఇది తప్పుడు సమాచారాన్ని ఇవ్వడం వల్ల కలిగే నష్టాన్ని పెంచుతుంది. AI నిజం చెబుతోందని నిర్ధారించుకోవడానికి ఇది ప్రత్యేక ఏజెంట్లు మరియు వెరిఫికేషన్ గేట్‌లను (verification gates) ఉపయోగిస్తుంది.

ఇది ఎలా పనిచేస్తుందో ఇక్కడ ఉంది:

• ప్రత్యేక ఏజెంట్లు (Specialized Agents): ఒక అసిస్టెంట్‌కు బదులుగా, నేను నలభై ప్రత్యేక ఏజెంట్లను ఉపయోగిస్తాను. ఒకరు Flutter కోడ్‌ను రివ్యూ చేస్తారు. ఒకరు సెక్యూరిటీని తనిఖీ చేస్తారు. ఒకరు టెస్ట్‌లను రన్ చేస్తారు. ఒకరు క్లెయిమ్‌లను వాస్తవ మార్పులతో పోల్చి చూస్తూ వాస్తవికతను తనిఖీ చేస్తారు. • ఐసోలేటెడ్ వర్క్ (Isolated Work): ఏజెంట్లు వేర్వేరు, తాత్కాలిక వాతావరణాలలో (environments) పనిచేస్తారు. వారు ఒకరిపై ఒకరు ఓవర్‌రైట్ (overwrite) చేయలేరు. • రిడండెన్సీ (Redundancy): ఒక మార్పు కోసం నేను బహుళ రివ్యూయర్లను ఉపయోగిస్తాను. ఒక రివ్యూయర్ బగ్‌ను గుర్తించకపోవచ్చు. కానీ వేర్వేరు లక్ష్యాలతో ఉన్న ముగ్గురు రివ్యూయర్లు మరియు ఒక సందేహవాది (skeptic) కలిసి దానిని కనుగొంటారు. • ఫిక్స్‌డ్ పైప్‌లైన్స్ (Fixed Pipelines): ప్రతి పని ఒక కఠినమైన మార్గాన్ని అనుసరిస్తుంది:

  • పనులను ప్లాన్ చేయడం.
  • మార్పును అమలు చేయడం.
  • కోడ్‌ను నిజంగా రన్ చేయడం. "ఇది పనిచేస్తుందని నేను అనుకుంటున్నాను" అనే మాటను నేను అంగీకరించను. నేను కేవలం వాస్తవ అవుట్‌పుట్‌ను మాత్రమే అంగీకరిస్తాను.
  • రియాలిటీ ఆడిట్ (Reality audit). కోడ్ క్లెయిమ్‌కు అనుగుణంగా ఉందో లేదో ఒక ప్రత్యేక ఏజెంట్ తనిఖీ చేస్తుంది.
  • రివ్యూ (Review). ఒక భాషా నిపుణుడు పనిని తనిఖీ చేస్తారు.
  • వెరిఫై గేట్ (Verify gate). చివరి దశలో వాస్తవ మార్పులు మరియు సెక్యూరిటీ లీక్‌ల కోసం తనిఖీ చేస్తారు. ఇది PASS లేదా REJECT అని ఫలితాన్ని ఇస్తుంది.

ఈ వ్యవస్థ నేను నాకు నేను చెప్పుకునే అబద్ధాలను ఆపుతుంది.

"ఇది పనిచేయాలి" అనేది ఎగ్జిక్యూషన్ దశలో విఫలమవుతుంది. కోడ్ కేవలం ఒక ఖాళీ షెల్ (empty shell) అయితే, "పూర్తయింది" అనేది రియాలిటీ ఆడిట్‌లో విఫలమవుతుంది. ఒక వార్నింగ్ దాచబడి ఉంటే, "అన్నీ గ్రీన్" (All green) అనేది విఫలమవుతుంది.

నేను మూడు పొరల మెమరీ సిస్టమ్‌ను కూడా ఉపయోగిస్తాను. ఇది షార్ట్ ఇండెక్స్, లాంగ్-టర్మ్ నోట్స్ మరియు ఫుల్-టెక్స్ట్ సెర్చ్‌ను ఉపయోగిస్తుంది. దీనివల్ల గతంలో నేను విషయాలను ఎలా సెటప్ చేశానో AI ఊహించాల్సిన అవసరం ఉండదు.

అత్యంత ముఖ్యమైన నియమం ఇది: నేను పనిని ఆటోమేట్ చేస్తాను, కానీ తీర్పును (judgment) ఎప్పుడూ ఆటోమేట్ చేయను.

• పబ్లిషింగ్ మాన్యువల్‌గా ఉంటుంది. బటన్‌ను నేనే నొక్కుతాను. • లైవ్ వెళ్లడానికి నా అవసరం ఉంటుంది. ప్రతి పేమెంట్ లేదా రిలీజ్ సెట్టింగ్‌ను నేనే ఆమోదిస్తాను. • వైఫల్యం జరిగితే ఏదీ మెర్జ్ (merge) కాదు. ఒక బ్రోకెన్ బిల్డ్ (broken build) అన్నింటినీ నిలిపివేస్తుంది.

పనులను ఆటోమేట్ చేయడం వల్ల AI యొక్క లీవరేజ్ (leverage) లభిస్తుంది. నిర్ణయాలను ఆటోమేట్ చేయడానికి నిరాకరించడం వల్ల భద్రత లభిస్తుంది.

మీరు ఒంటరిగా పనిచేస్తున్నప్పుడు, మీ అత్యంత విలువైన వనరు నమ్మకం. మీరు పంపినది (shipped), మీరు పంపాలనుకున్నదే అని మీరు నమ్మాలి.

చిన్నగా ప్రారంభించండి. మీరు తరచుగా చేసే తప్పును గుర్తించండి. ఆ తప్పు జరగకుండా చేసే ఒక చెక్‌ను రూపొందించండి.

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi