OpenAI-യും Anthropic-ഉം എങ്ങനെയാണ് AI സിസ്റ്റങ്ങൾ രൂപകൽപ്പന ചെയ്യുന്നത്
പലരും API ഡോക്യുമെന്റുകളോ ബ്ലോഗ് പോസ്റ്റുകളോ നോക്കി AI കമ്പനികളെക്കുറിച്ച് reverse-engineer ചെയ്യാൻ ശ്രമിക്കാറുണ്ട്. അവർ മോഡലുകളിലും എൻഡ്പോയിന്റുകളിലും (endpoints) മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഇത് തെറ്റായ നിഗമനങ്ങളിലേക്ക് നയിക്കുന്നു.
ഈ സമസ്യയുടെ ഒരു ഭാഗം മാത്രമാണ് മോഡൽ.
OpenAI, Anthropic തുടങ്ങിയ കമ്പനികൾ വെറും മോഡലുകൾ മാത്രമല്ല നിർമ്മിക്കുന്നത്. അവർ വലിയൊരു ഇക്കോസിസ്റ്റം (ecosystem) ആണ് കെട്ടിപ്പടുക്കുന്നത്. അവർ വലിയ തോതിലുള്ള distributed systems ആണ് നിർമ്മിക്കുന്നത്.
അവർക്ക് മികച്ച മോഡലുകൾ മാത്രമേയുള്ളൂ എന്ന് നിങ്ങൾ കരുതുന്നുണ്ടെങ്കിൽ, യഥാർത്ഥ രഹസ്യം നിങ്ങൾ കാണാതെ പോകും. സംയോജിത ലൂപ്പുകളിലൂടെ (integrated loops) അവർ ആ മോഡലുകളെ എങ്ങനെ പരിശീലിപ്പിക്കുന്നു, വിന്യസിക്കുന്നു (deploy), മെച്ചപ്പെടുത്തുന്നു എന്നതിലാണ് അവരുടെ വിജയം അടങ്ങിയിരിക്കുന്നത്.
ഇത്രയും വലിയ തോതിലുള്ള ഒരു production AI സിസ്റ്റത്തിന് നിരവധി പാളികൾ (layers) ആവശ്യമാണ്:
• Data Pipelines: പരിശീലന ഡാറ്റ ശേഖരിക്കാനും ശുദ്ധീകരിക്കാനും. • Training Infrastructure: വൻതോതിലുള്ള കമ്പ്യൂട്ട് ചിലവുകളും പാരലലിസവും (parallelism) കൈകാര്യം ചെയ്യാൻ. • Model Layer: കൃത്യതയ്ക്കായുള്ള പ്രധാന ആർക്കിടെക്ചർ. • Inference Layer: കുറഞ്ഞ ലേറ്റൻസിയിൽ (low latency) മറുപടികൾ നൽകാൻ. • Safety Layer: ഗാർഡ്റെയിലുകളും (guardrails) അലൈൻമെന്റും ഉറപ്പാക്കാൻ. • Observability: പ്രവർത്തനക്ഷമത നിരീക്ഷിക്കാനും പിശകുകൾ പരിഹരിക്കാനും (debug). • Feedback Loops: കാലക്രമേണ മോഡൽ മെച്ചപ്പെടുത്താൻ.
ഓരോ പാളിയും മറ്റൊന്നിനെ ആശ്രയിച്ചിരിക്കുന്നു. നിങ്ങൾ ഒന്നിനെ മാറ്റിയാൽ അത് മുഴുവൻ സിസ്റ്റത്തെയും ബാധിക്കും.
പരിശീലനം എന്നത് ഒരു തുടർച്ചയായ പ്രക്രിയയുമാണ്. ഈ കമ്പനികൾ ഒരു മോഡൽ ഒരിക്കൽ പരിശീലിപ്പിച്ച് നിർത്തുന്നില്ല. അവർ ഒരു continuous training paradigm ആണ് ഉപയോഗിക്കുന്നത്. പുതിയ ഡാറ്റയുടെ നിരന്തരമായ ഒഴുക്ക് കൈകാര്യം ചെയ്യാൻ അവർ ആയിരക്കണക്കിന് GPUs ഉപയോഗിക്കുന്നു.
അലൈൻമെന്റും (alignment) സുരക്ഷയും അവരുടെ രൂപകൽപ്പനയുടെ പ്രധാന ഭാഗമാണ്. മോഡലിന്റെ പെരുമാറ്റം നിയന്ത്രിക്കുന്നതിന് അവർ വിവിധ തന്ത്രങ്ങൾ ഉപയോഗിക്കുന്നു:
• RLHF: ഉയർന്ന നിലവാരമുള്ള അലൈൻമെന്റിനായി മനുഷ്യരുടെ ഫീഡ്ബാക്ക് ഉപയോഗിക്കുന്നു. • Constitutional AI: വലിയ തോതിലുള്ള പ്രവർത്തനങ്ങൾക്കായി നിയമങ്ങൾ അടിസ്ഥാനമാക്കിയുള്ള മാർഗനിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു. • Prompt Constraints: വേഗത്തിലുള്ള സെറ്റപ്പിനായി സിസ്റ്റം നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു. • Output Filtering: മോഡറേഷനായി പോസ്റ്റ്-പ്രോസസ്സിംഗ് ഉപയോഗിക്കുന്നു.
ശക്തമായി നിലനിൽക്കാൻ അവർ ഈ രീതികളെ സംയോജിപ്പിക്കുന്നു.
മോഡൽ തയ്യാറായുകഴിഞ്ഞാൽ, അത് സേവനം നൽകേണ്ടതുണ്ട്. അവർ batching, caching, quantization തുടങ്ങിയ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുന്നു. വേഗതയും ചിലവും തമ്മിലുള്ള സന്തുലിതാവസ്ഥ നിലനിർത്താൻ ഇവ സഹായിക്കുന്നു.
ഒടുവിൽ, എല്ലാം നിരീക്ഷിക്കാൻ അവർ observability ഉപയോഗിക്കുന്നു. AI ഔട്ട്പുട്ടുകൾ എപ്പോഴും ഒരേപോലെയല്ല എന്ന