The Confabulation Cascade (కల్పిత సమాచార ప్రవాహం)

నా AI ఏజెంట్ ఒక లూప్‌లో చిక్కుకుపోయింది.

అది ఒక తప్పు కాలమ్ పేరుతో SQL క్వెరీని రాసేది. డేటాబేస్ ఒక ఎర్రర్‌ను తిరిగి ఇచ్చేది. ఆ ఎర్రర్ మెసేజ్‌లో అసలైన కాలమ్ జాబితా ఉండేది. ఏజెంట్ ఆ సవరణను చదివేది. ఆ తర్వాత, అది మళ్ళీ అదే తప్పు కాలమ్ పేరును రాసేది.

దీనిని నేను కల్పిత సమాచార ప్రవాహం (confabulation cascade) అని పిలుస్తాను.

ఇది మోడల్ సమస్య కాదు. ఇది టూల్ డిజైన్ సమస్య.

ఈ లూప్ ఎలా పనిచేస్తుందంటే:

  • ఏజెంట్ తన శిక్షణ (training) ఆధారంగా ఒక క్వెరీని రూపొందిస్తుంది.
  • ఆ క్వెరీ విఫలమవుతుంది.
  • ఎర్రర్ మెసేజ్ నిజమైన సమాచారాన్ని అందిస్తుంది.
  • ఏజెంట్ ఆ నిజాన్ని చూసినప్పటికీ, దానికి బదులుగా తన అంతర్గత శిక్షణపైనే ఆధారపడుతుంది.
  • ఏజెంట్ అదే తప్పును మళ్ళీ చేస్తుంది.

ఏజెంట్ రెండు సంకేతాలను (signals) ఎదుర్కొంటుంది. ఒకటి ఎర్రర్ మెసేజ్, రెండోది మోడల్ యొక్క శిక్షణ. శిక్షణ తరచుగా బలంగా ఉంటుంది. ఎర్రర్ మెసేజ్ ఒక్కసారి మాత్రమే కనిపిస్తుంది. కానీ మోడల్ రాసే ప్రతి పదంతో పాటు శిక్షణ కనిపిస్తూనే ఉంటుంది.

నేను దీనిని ప్రాంప్ట్ ఇంజనీరింగ్ (prompt engineering) ద్వారా సరిచేయడానికి ప్రయత్నించాను. ఎర్రర్‌ల పట్ల శ్రద్ధ వహించాలని మోడల్‌కు చెప్పాను. కానీ అది పని చేయలేదు.

అసలు సమస్య ఏమిటంటే, నా ఏజెంట్ విఫలమవ్వడం ద్వారా మాత్రమే నేర్చుకోగలదు. అది పని చేసే ముందు టేబుల్ స్ట్రక్చర్‌ను తనిఖీ చేసే మార్గం దానికి లేదు. అది ఊహించాల్సిందే.

మీరు ఒక మనిషికి API ఇస్తే, వారితో పాటు డాక్యుమెంటేషన్‌ను కూడా ఇస్తారు. ఎర్రర్ మెసేజ్‌లు వారికి స్కీమాను (schema) నేర్పే వరకు, మీరు వారిని తప్పు రిక్వెస్ట్‌లు పంపేలా చేయరు.

నేను ఒక ప్రోయాక్టివ్ టూల్‌ను నిర్మించడం ద్వారా దీనిని పరిష్కరించాను. ఎర్రర్ కోసం వేచి ఉండటానికి బదులుగా, ఏజెంట్ ఇప్పుడు మొదట describe_table టూల్‌ను పిలుస్తుంది.

కొత్త వర్క్‌ఫ్లో (workflow):

  • ఏజెంట్ ఒక టేబుల్‌ను క్వెరీ చేయాలనుకుంటుంది.
  • అసలైన కాలమ్స్ చూడటానికి ఏజెంట్ describe_tableను పిలుస్తుంది.
  • ఏజెంట్‌కు సరైన పేర్లు మరియు రకాలు (types) లభిస్తాయి.
  • ఏజెంట్ మొదటి ప్రయత్నంలోనే సరైన క్వెరీని రాస్తుంది.

లూప్ ఆగిపోయింది. మోడల్ తెలివైనదిగా మారలేదు. ఏజెంట్ కేవలం ఊహించడం మానేసింది.

మీ ఏజెంట్లు డేటాబేస్‌లు లేదా APIలను ఉపయోగిస్తుంటే, ఇది అడగండి: అవి పని చేసే ముందు స్ట్రక్చర్‌ను ధృవీకరించగలవా? లేదా కేవలం విఫలమవ్వడం ద్వారా మాత్రమే నేర్చుకుంటాయా?

రియాక్టివ్ ఎర్రర్ హింట్స్ (Reactive error hints) మంచివే. కానీ అవి సరిపోవు. విఫలమవ్వడం ద్వారా మాత్రమే నేర్చుకునే ఏజెంట్ ఎప్పుడూ హాలూసినేషన్ (hallucination) కి ఒక అడుగు దూరంలోనే ఉంటుంది.

ఏజెంట్లు తప్పులు చేసే ముందు ప్రశ్నలు అడిగేలా టూల్స్‌ను నిర్మించండి.

Source: https://dev.to/niclydon/the-confabulation-cascade-when-your-agent-learns-nothing-from-its-own-mistakes-m08

Optional learning community: https://t.me/GyaanSetuAi