ലിവറിന് ഒരു നിയന്ത്രണം ആവശ്യമാണ്
AI വേഗതയുള്ളതാണ്. ഒരു മനുഷ്യനും എത്തിപ്പിടിക്കാൻ കഴിയാത്ത വേഗതയിൽ അത് കോഡ് എഴുതുന്നു. എന്നാൽ നിയന്ത്രണമില്ലെങ്കിൽ ആ വേഗത ഒരു അപകടമാണ്.
അടുത്തിടെ എനിക്ക് ഒരു സങ്കീർണ്ണമായ ട്രേഡിംഗ് സിസ്റ്റം പുനർനിർമ്മിക്കേണ്ടി വന്നു. ഇക്വിറ്റികൾ (equities), ഫോറെക്സ് (forex), ക്രിപ്റ്റോ (crypto) എന്നിവയിലുടനീളം ഇരുപതിനായിരം സിഗ്നലുകൾ പിന്തുണയ്ക്കേണ്ടതുണ്ടായിരുന്നു. ഓരോ സിഗ്നലിനും അതിന്റേതായ മാർക്കറ്റ് സ്കോപ്പ് ഉണ്ടായിരുന്നു. ഇതൊരു മോഡലിന്റെ പ്രശ്നമായിരുന്നില്ല. ഇതൊരു നിയന്ത്രണ സംവിധാനത്തിന്റെ (harness) പ്രശ്നമായിരുന്നു.
ആറ് ഘട്ടങ്ങളിലായി (six waves) ക്രമീകരിച്ച മുപ്പത് ടിക്കറ്റുകളുള്ള ഒരു പ്ലാൻ രൂപകൽപ്പന ചെയ്യാൻ ഞാൻ AI ഉപയോഗിച്ചു. ജോലി പൂർത്തിയാക്കാൻ ഒരു സെഷനെ മാത്രം ഞാൻ വിശ്വസിച്ചില്ല. പകരം, ഞാൻ രണ്ട് വ്യത്യസ്ത AI സെഷനുകൾ ഉപയോഗിച്ചു:
• ബിൽഡർ (The Builder): ഒരു സെഷൻ കോഡും പ്ലാനും രൂപകൽപ്പന ചെയ്തു. • ഓഡിറ്റർ (The Auditor): കോഡ് എഴുതുന്നതിന് മുമ്പ് രണ്ടാമത്തെ സെഷൻ ആ രൂപകൽപ്പന പരിശോധിച്ചു.
ആദ്യത്തെ ഓഡിറ്റ് വിജയിച്ചു. ഞാൻ വിജയിച്ചതായി കരുതി. എന്നാൽ പിന്നീട്, മുഴുവൻ രൂപകൽപ്പനയും ആദ്യം മുതൽ പരിശോധിക്കാൻ ഞാൻ മൂന്നാമതൊരു AI ഉപയോഗിച്ചു. അത് പതിനാല് ഗുരുതരമായ വൈരുദ്ധ്യങ്ങൾ (contradictions) കണ്ടെത്തി.
പുറമെ നോക്കിയാൽ രൂപകൽപ്പന മികച്ചതായി തോന്നി. അതിന് കൃത്യമായ ഘടനയും തലക്കെട്ടുകളും ഉണ്ടായിരുന്നു. എന്നാൽ അതിൽ അർത്ഥവത്തായ കാര്യങ്ങൾ കുറവായിരുന്നു. ഒരു ടിക്കറ്റ് പരാമർശിച്ച ഒരു കോളം മറ്റൊരു ടിക്കറ്റ് നേരത്തെ തന്നെ പുനർനാമകരണം (rename) ചെയ്തിരുന്നു. രൂപകൽപ്പനയിൽ നിർബന്ധമായും നൽകേണ്ട ഒന്നായി (required) നിശ്ചയിച്ചിരുന്ന ഒരു ഫീൽഡ്, മറ്റൊരു ടിക്കറ്റ് ഓപ്ഷണൽ (optional) ആണെന്ന് കരുതിയിരുന്നു. ഇവ കോഡിംഗ് ബഗുകളല്ലായിരുന്നു. രൂപകൽപ്പനയിലെ യുക്തിപരമായ വൈരുദ്ധ്യങ്ങളായിരുന്നു അവ.
ഞാൻ കോഡിംഗ് തുടങ്ങിയിരുന്നെങ്കിൽ, സിസ്റ്റം പരാജയപ്പെടുമായിരുന്നു.
AI ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നതിനെക്കുറിച്ച് ഇത് എന്നെ മൂന്ന് കാര്യങ്ങൾ പഠിപ്പിച്ചു:
- AI പരിശീലിപ്പിക്കപ്പെട്ടിരിക്കുന്നത് സംഭാഷണങ്ങൾ പൂർത്തിയാക്കാനാണ്, അല്ലാതെ നിർദ്ദിഷ്ട ജോലികൾ (tasks) ചെയ്യാനല്ല. നിങ്ങൾക്ക് തൃപ്തികരമായ ഒരു മറുപടി നൽകാനാണ് അത് ആഗ്രഹിക്കുന്നത്, എല്ലായ്പ്പോഴും ശരിയായ മറുപടി നൽകണമെന്നില്ല.
- AI-ക്ക് പരിമിതമായ ഒരു കോൺടെക്സ്റ്റ് വിൻഡോ (context window) മാത്രമേയുള്ളൂ. ഒരു നിയന്ത്രണം ആ വിൻഡോയ്ക്ക് പുറത്താണെങ്കിൽ, മോഡൽ ആ വിടവ് യുക്തിസഹമെന്ന് തോന്നുന്ന മറ്റൊന്നു കൊണ്ട് നികത്താൻ ശ്രമിക്കും. യുക്തിസഹമെന്ന് തോന്നുന്നത് പലപ്പോഴും തെറ്റായിരിക്കാം.
- മോഡൽ എന്നത് ഒരു വിപണി ഉൽപ്പന്നം (commodity) മാത്രമാണ്. അതിന് ചുറ്റും നിങ്ങൾ നിർമ്മിക്കുന്ന നിയന്ത്രണ സംവിധാനമാണ് (harness) യഥാർത്ഥ ഉൽപ്പന്നം.
ഒരു ഹാർനസ് (harness) എന്നത് നിങ്ങൾ മോഡലിന് ചുറ്റും നിർമ്മിക്കുന്ന പ്രക്രിയയാണ്. അതിൽ ഇവ ഉൾപ്പെടുന്നു:
- ഡിസൈൻ അലൈൻമെന്റ് (Design alignment): മോഡലും നിങ്ങളും ഒരേ പ്രശ്നമാണ് കാണുന്നുണ്ടെന്ന് ഉറപ്പാക്കുന്നു.
- മൾട്ടി-സെഷൻ ഓഡിറ്റിംഗ് (Multi-session auditing): ജോലി പരിശോധിക്കാൻ വ്യത്യസ്ത കോൺടെക്സ്റ്റുകൾ ഉപയോഗിക്കുന്നു.
- ഹാർഡൻഡ് ടെസ്റ്റിംഗ് (Hardened testing): AI എത്രത്തോളം ആത്മവിശ്വാസത്തോടെ സംസാരിക്കുന്നു എന്നതിനെ ആശ്രയിക്കാതെ പ്രവർത്തിക്കുന്ന സ്ക്രിപ്റ്റുകൾ ഉപയോഗിക്കുന്നു.
മോഡൽ എന്നത് ഒരു ലിവർ ആണ്. ആ ലിവർ നിങ്ങളുടെ സിസ്റ്റം തകർക്കാതിരിക്കാൻ സഹായിക്കുന്നത് ഹാർനസ് ആണ്. വെറുമൊരു മോഡൽ മാത്രം വാങ്ങരുത്. ഒരു കോക്പിറ്റ് (cockpit) നിർമ്മിക്കുക.
Source: https://dev.to/whetlan/the-lever-needs-a-harness-14e9
Optional learning community: https://t.me/GyaanSetuAi