AI കോൺടെക്സ്റ്റ് എൻജിനീയറിംഗ്: പ്രോംപ്റ്റുകൾ മാത്രം മതിയാകാത്തത് എന്തുകൊണ്ട്
രണ്ട് വർഷം മുമ്പ്, എല്ലാവരും പ്രോംപ്റ്റ് എൻജിനീയറിംഗിനെക്കുറിച്ച് (prompt engineering) സംസാരിച്ചിരുന്നു.
കോഡ് എഴുതാനോ വിദഗ്ധരെപ്പോലെ പ്രവർത്തിക്കാനോ ഉള്ള പ്രോംപ്റ്റുകൾ ആളുകൾ പങ്കുവെച്ചു. ഇതിന്റെ ആശയം ലളിതമായിരുന്നു: മികച്ച പ്രോംപ്റ്റ് എന്നാൽ മികച്ച ഫലം എന്നാണ്.
എന്നാൽ യഥാർത്ഥ AI ഉൽപ്പന്നങ്ങൾ നിർമ്മിക്കുന്ന എഞ്ചിനീയർമാർ ഒരു സത്യം കണ്ടെത്തി. ഒരു പ്രോംപ്റ്റ് എന്നത് ഈ സമസ്യയുടെ ഒരു ഭാഗം മാത്രമാണ്.
Claude, Cursor അല്ലെങ്കിൽ GitHub Copilot പോലുള്ള ആധുനിക AI ടൂളുകൾ ഒരു പ്രോംപ്റ്റിനെ മാത്രം ആശ്രയിച്ചല്ല പ്രവർത്തിക്കുന്നത്. അവ കോൺടെക്സ്റ്റ് എൻജിനീയറിംഗ് (Context Engineering) ഉപയോഗിക്കുന്നു.
പ്രോംപ്റ്റ് എൻജിനീയറിംഗ് ചോദിക്കുന്നത്: "ഞാൻ മോഡലിനോട് എന്താണ് ചോദിക്കേണ്ടത്?" എന്നാണ്.
കോൺടെക്സ്റ്റ് എൻജിനീയറിംഗ് ചോദിക്കുന്നത്: "നന്നായി ഉത്തരം നൽകാൻ മോഡലിന് എന്തൊക്കെ വിവരങ്ങൾ ആവശ്യമാണ്?" എന്നാണ്.
ഒരു ഡെവലപ്പറെക്കുറിച്ച് ചിന്തിക്കുക. "ആപ്പ് പ്രവർത്തിക്കുന്നില്ല" എന്ന് നിങ്ങൾ പറഞ്ഞാൽ, അവർക്ക് നിങ്ങളെ സഹായിക്കാൻ കഴിയില്ല. അവർ ഒരുപാട് ചോദ്യങ്ങൾ ചോദിക്കും.
നിങ്ങൾ എറർ ലോഗുകൾ (error logs), സ്റ്റാക്ക് ട്രാസുകൾ (stack traces), സമീപകാല ഡെപ്ലോയ്മെന്റുകൾ (recent deployments) എന്നിവ നൽകിയാൽ, അവർ അത് വേഗത്തിൽ പരിഹരിക്കും. അവർ കൂടുതൽ ബുദ്ധിമാന്മാരായതുകൊണ്ടല്ല ഇത് സംഭവിക്കുന്നത്, മറിച്ച് നിങ്ങൾ അവർക്ക് മികച്ച കോൺടെക്സ്റ്റ് നൽകിയതുകൊണ്ടാണ്.
AI-യും ഇതേ രീതിയിലാണ് പ്രവർത്തിക്കുന്നത്.
നിങ്ങൾ ഒരു AI-യോട് ഒരു SQL ക്വറി ആവശ്യപ്പെട്ടാൽ, അത് ഊഹിച്ചേക്കാം. എന്നാൽ ടേബിൾ പേരുകൾ, കോളം തരങ്ങൾ (column types), പ്രത്യേക നിയമങ്ങൾ എന്നിവ നൽകിയാൽ ഉത്തരം കൃത്യമാകും. പ്രോംപ്റ്റ് ലളിതമായി തന്നെ ഇരുന്നു, എന്നാൽ കോൺടെക്സ്റ്റ് മാറി.
പ്രൊഡക്ഷൻ AI സിസ്റ്റങ്ങളിൽ, മോഡലിന് നിങ്ങളുടെ ടെക്സ്റ്റിനേക്കാൾ കൂടുതൽ വിവരങ്ങൾ ലഭിക്കുന്നുണ്ട്. അവയിൽ പലതും ഇവയാണ്:
- സിസ്റ്റം ഇൻസ്ട്രക്ഷനുകൾ (System instructions)
- സംഭാഷണ ചരിത്രം (Conversation history)
- ഡാറ്റാബേസ് റെക്കോർഡുകൾ (Database records)
- പ്രോജക്റ്റ് ഫയലുകൾ (Project files)
- ടൂൾ ഔട്ട്പുട്ടുകൾ (Tool outputs)
ഒരു AI കോഡിംഗ് അസിസ്റ്റന്റിന് നിങ്ങൾ എന്താണ് സംസാരിക്കുന്നതെന്ന് അറിയാം, കാരണം അത് നിങ്ങളുടെ തുറന്ന ഫയലുകളും ഫോൾഡർ ഘടനയും കാണുന്നുണ്ട്. നിങ്ങൾ നാല് വാക്കുകൾ ടൈപ്പ് ചെയ്തേക്കാം, എന്നാൽ മോഡലിന് ആയിരക്കണക്കിന് ടോക്കണുകൾ (tokens) ഡാറ്റ ലഭിക്കുന്നു.
ഒരു പ്രോംപ്റ്റിന്റെ വാക്കുകൾ മാറ്റിക്കൊണ്ട് മണിക്കൂറുകൾ ചെലവഴിക്കുന്നത് നിർത്തുക. പകരം, സ്വയം ചോദിക്കുക: "മോഡലിന് ഏത് വിവരമാണ് ലഭിക്കാത്തത്?"
ഒരു "മാന്ത്രിക" (magic) പ്രോംപ്റ്റ് കണ്ടെത്തുന്നതിനേക്കാൾ നല്ലത് മികച്ച ഡോക്യുമെന്റേഷൻ, API സ്കീമകൾ അല്ലെങ്കിൽ ബിസിനസ്സ് നിയമങ്ങൾ എന്നിവ നൽകുന്നതാണ്.
ശരിയായ സമയത്ത് ശരിയായ ഡാറ്റ മോഡലിന് നൽകുക എന്നതാണ് കോൺടെക്സ്റ്റ് എൻജിനീയറിംഗ് കൊണ്ട് അർത്ഥമാക്കുന്നത്.
രണ്ടാം ഭാഗത്തിൽ, ഞാൻ താഴെ പറയുന്നവ ഉൾപ്പെടുത്തും:
- കോൺടെക്സ്റ്റ് വിൻഡോകളും ടോക്കണുകളും (Context windows and tokens)
- കൂടുതൽ കോൺടെക്സ്റ്റ് എപ്പോഴും നല്ലതാകാത്തത് എന്തുകൊണ്ട്?
- AI-യിൽ മെമ്മറി എങ്ങനെ പ്രവർത്തിക്കുന്നു?
മികച്ച AI സിസ്റ്റങ്ങൾ നിങ്ങൾ ടൈപ്പ് ചെയ്യുന്ന വാക്കുകളെ മാത്രമല്ല, പിന്നണിയിലുള്ള ഡാറ്റയെയും ആശ്രയിച്ചിരിക്കുന്നു.
Optional learning community: https://t.me/GyaanSetuAi
