𝗧𝗵𝗲 𝗟𝗲𝘃𝗲𝗿 𝗡𝗲𝗲𝗱𝘀 𝗮 𝗛𝗮𝗿𝗻𝗲𝘀𝘀
AI వేగవంతమైనది. మనుషులు అందుకోలేని వేగంతో అది కోడ్ను రాస్తుంది. కానీ మీకు నియంత్రణ లేకపోతే, ఆ వేగం ఒక ప్రమాదమే.
ఇటీవల నేను ఒక సంక్లిష్టమైన ట్రేడింగ్ సిస్టమ్ను తిరిగి నిర్మించాల్సి వచ్చింది. ఈక్విటీస్, ఫారెక్స్ మరియు క్రిప్టోలలో ఇరవై వేల సిగ్నల్స్కు మద్దతు ఇవ్వాల్సి ఉంది. ప్రతి సిగ్నల్కు దాని స్వంత మార్కెట్ పరిధి (market scope) ఉంది. ఇది మోడల్ సమస్య కాదు. ఇది హార్నెస్ (harness) సమస్య.
ఆరు వేవ్స్గా విభజించబడిన ముప్పై టికెట్ల ప్రణాళికను రూపొందించడానికి నేను AIని ఉపయోగించాను. పనిని పూర్తి చేయడానికి నేను ఒకే సెషన్ను నమ్మలేదు. దానికి బదులుగా, నేను రెండు వేర్వేరు AI సెషన్లను ఉపయోగించాను:
• ది బిల్డర్ (The Builder): ఒక సెషన్ కోడ్ మరియు ప్రణాళికను రూపొందించింది. • ది ఆడిటర్ (The Auditor): కోడ్ రాయకముందే రెండవ సెషన్ ఆ డిజైన్ను తనిఖీ చేసింది.
మొదటి ఆడిట్ విజయవంతమైంది. నేను విజయం సాధించాననుకున్నాను. ఆ తర్వాత, మొత్తం డిజైన్ను మొదటి నుండి తనిఖీ చేయడానికి నేను మూడవ AIని ఉపయోగించాను. అది పద్నాలుగు తీవ్రమైన వైరుధ్యాలను (high-severity contradictions) కనుగొంది.
పైకి చూస్తే ఆ డిజైన్ బాగున్నట్లు అనిపించింది. దానికి ఒక నిర్మాణం మరియు శీర్షికలు ఉన్నాయి. కానీ అందులో సారం (substance) లేదు. ఒక టికెట్ ఒక కాలమ్ను సూచించింది, కానీ మరొక టికెట్ ఇప్పటికే ఆ కాలమ్ పేరును మార్చేసింది. డిజైన్ ప్రకారం ఒక ఫీల్డ్ తప్పనిసరి (required) కావాల్సి ఉండగా, మరొక టికెట్ అది ఐచ్ఛికం (optional) అని భావించింది. ఇవి కోడింగ్ బగ్స్ కాదు. ఇవి డిజైన్లో ఉన్న తార్కిక వైరుధ్యాలు.
నేను కోడింగ్ ప్రారంభించి ఉంటే, ఆ సిస్టమ్ విఫలమయ్యేది.
AIతో పనిచేయడం గురించి ఇది నాకు మూడు విషయాలను నేర్పింది:
- AI సంభాషణలను పూర్తి చేయడానికి శిక్షణ పొందింది, తప్పనిసరిగా పనులను (tasks) కాదు. అది మీకు సంతృప్తికరమైన సమాధానాన్ని ఇవ్వాలని కోరుకుంటుంది, కానీ అది ఎల్లప్పుడూ సరైనది కాకపోవచ్చు.
- AIకి పరిమితమైన కాంటెక్స్ట్ విండో (context window) ఉంటుంది. ఒక నిబంధన ఆ విండో వెలుపల ఉంటే, మోడల్ ఆ ఖాళీని ఏదో ఒక నమ్మదగిన సమాచారంతో నింపుతుంది. నమ్మదగినది (plausible) అనేది తరచుగా తప్పుగా ఉంటుంది.
- మోడల్ అనేది ఒక వస్తువు (commodity) మాత్రమే. అసలైన ఉత్పత్తి మీరు దాని చుట్టూ నిర్మించే హార్నెస్.
హార్నెస్ అనేది మీరు మోడల్ చుట్టూ ఏర్పాటు చేసుకునే ప్రక్రియ. ఇందులో ఇవి ఉంటాయి:
- డిజైన్ అలైన్మెంట్ (Design alignment): మోడల్ మరియు మీరు ఒకే సమస్యను చూస్తున్నారని నిర్ధారించుకోవడం.
- మల్టీ-సెషన్ ఆడిటింగ్ (Multi-session auditing): పనిని తనిఖీ చేయడానికి వేర్వేరు కాంటెక్స్ట్లను ఉపయోగించడం.
- హార్డెన్డ్ టెస్టింగ్ (Hardened testing): AI ఎంత నమ్మకంగా మాట్లాడుతున్నా సంబంధం లేకుండా, స్క్రిప్ట్లను ఉపయోగించి పరీక్షించడం.
మోడల్ అనేది లివర్. ఆ లివర్ మీ సిస్టమ్ను పాడు చేయకుండా కాపాడేది హార్నెస్. కేవలం ఒక మోడల్ను కొనకండి. ఒక కాక్పిట్ను (cockpit) నిర్మించుకోండి.
Source: https://dev.to/whetlan/the-lever-needs-a-harness-14e9
Optional learning community: https://t.me/GyaanSetuAi