𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 𝗛𝗮𝘀 𝗡𝗼 𝗙𝗶𝘅𝗲𝗱 𝗔𝗱𝗱𝗿𝗲𝘀𝘀

హార్నెస్ ఇంజనీరింగ్ అనేది మీ సాఫ్ట్‌వేర్ స్టాక్‌లో ఒక నిర్దిష్ట ప్రదేశం కాదు. అది మీ కోడ్ యొక్క ఒక లక్షణం.

హార్నెస్ అనేది కేవలం ఒక AI మోడల్ చుట్టూ ఉండే ఒక 'వ్రాపర్' (wrapper) మాత్రమే అని చాలా మంది అనుకుంటారు. ఇది తప్పు. ఒక మోడల్‌ను నిజమైన వ్యాపార అవసరాలకు ఉపయోగపడేలా చేసేది హార్నెస్ మాత్రమే.

నేను ఒక సరళమైన సూత్రాన్ని ఉపయోగిస్తాను: Agent = Model × Harness.

మోడల్ అనేది ఇంజిన్ అయితే, హార్నెస్ అనేది స్టీరింగ్, బ్రేకులు మరియు సేఫ్టీ రైల్స్ (safety rails).

కానీ ఇక్కడే సమస్య ఉంది. మోడల్ నిరంతరం అభివృద్ధి చెందుతోంది. ప్రతి కొత్త మోడల్ వెర్షన్ హార్నెస్ యొక్క కొన్ని భాగాలను తనలోకి తీసుకుంటోంది.

  • రీజనింగ్ మోడల్స్ (Reasoning models) ఇప్పుడు chain-of-thought లాజిక్‌ను నిర్వహిస్తున్నాయి.
  • మెరుగైన మోడల్స్ టూల్ యూజ్ (tool use)ను నేరుగా (natively) నిర్వహించగలవు.
  • లాంగ్ కాంటెక్స్ట్ విండోస్ (Long context windows) పాత మెమరీ సిస్టమ్స్‌ను భర్తీ చేస్తున్నాయి.

ఒకవేళ మోడల్ హార్నెస్ మొత్తాన్ని మింగేస్తే, మీరు నిర్మించడానికి ఇంకా ఏమి మిగులుతుంది?

కరిగిపోయే భాగాలు మెకానిక్స్ (mechanics). లూప్స్ (loops), రీట్రైస్ (retries) మరియు మెమరీ స్టిచింగ్ (memory stitching) వంటివి సాధారణ వస్తువులలా (commodities) మారిపోతాయి. కేవలం ప్లంబింగ్ (plumbing) లాంటి పనుల మీద మీ కెరీర్‌ను పందెం వేయకండి.

మిగిలి ఉండే భాగాలు స్పెసిఫికేషన్ (specification) మరియు వెరిఫికేషన్ (verification).

  1. Specification: ఏజెంట్‌కు ఏమి చేయడానికి అనుమతి ఉందో మీరు నిర్వచించాలి. మీ నిర్దిష్ట రీఫండ్ పాలసీ లేదా మీ రిస్క్ టాలరెన్స్ గురించి మోడల్‌కు తెలియదు. అది మీ కోడ్‌లో ఉంటుంది.
  2. Verification: ఏజెంట్ మీ నియమాల పరిధిలోనే ఉందో లేదో మీరు నిరూపించాలి. ఒక మోడల్ తనను తాను నమ్మదగిన రీతిలో అంచనా వేయలేదు. పనిని తనిఖీ చేయడానికి మీకు ఒక ఎక్స్‌టర్నల్ లేయర్ (external layer) అవసరం.

ఒక రీఫండ్ ఏజెంట్ గురించి ఆలోచించండి.

మీరు రీఫండ్ పరిమితిని ప్రాంప్ట్ (prompt)లో పెడితే, వినియోగదారు మోడల్‌ను మోసం చేయవచ్చు. అదే పరిమితిని మీ కోడ్‌లోని ఒక if-statementలో పెడితే, మోడల్ దానితో వాదించలేదు.

ఆ if-statement నే హార్నెస్ ఇంజనీరింగ్ అంటారు.

హార్నెస్ ఇంజనీరింగ్ రెండు విషయాల గురించి:

  • అనుమతించబడిన ప్రవర్తన యొక్క పరిధిని (envelope of allowed behavior) నిర్వచించడం.
  • ఏజెంట్ దాని పరిధిలోనే ఉందో లేదో నిరూపించడం.

మోడల్ అనేది మీరు నియంత్రించే మొక్క వంటిది. స్పెసిఫికేషన్ అనేది మీ లక్ష్యం. హార్నెస్ అనేది కంట్రోలర్. ఎవల్యూయేషన్స్ (evaluations) అనేవి ఫీడ్‌బ్యాక్.

టూల్స్ మరియు మెకానిక్స్ ప్రతి నెలా మారుతూ ఉంటాయి. కానీ స్పెసిఫికేషన్ మరియు వెరిఫికేషన్ అనే క్రమశిక్షణ మారదు.

ప్లంబింగ్ నిర్మించడం ఆపండి. కన్స్ట్రైంట్స్ (constraints) మరియు ప్రూఫ్స్ (proofs) నిర్మించడం ప్రారంభించండి.

Source: https://dev.to/saurav_bhattacharya/harness-engineering-has-no-fixed-address-2m7a

Optional learning community: https://t.me/GyaanSetuAi