OpenAI-യും Anthropic-ഉം എങ്ങനെയാണ് AI സിസ്റ്റങ്ങൾ രൂപകൽപ്പന ചെയ്യുന്നത്

പലരും API ഡോക്യുമെന്റുകളോ ബ്ലോഗ് പോസ്റ്റുകളോ നോക്കി AI കമ്പനികളെക്കുറിച്ച് റിവേഴ്സ് എഞ്ചിനീയറിംഗ് നടത്താൻ ശ്രമിക്കാറുണ്ട്. അവർ മോഡലുകളിലോ എൻഡ്‌പോയിന്റുകളിലോ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഇത് തെറ്റായ നിഗമനങ്ങളിലേക്ക് നയിക്കുന്നു.

OpenAI-യും Anthropic-ഉം വെറും മോഡലുകൾ മാത്രമല്ല നിർമ്മിക്കുന്നത്. അവർ സമ്പൂർണ്ണ ഇക്കോസിസ്റ്റങ്ങളാണ് (ecosystems) നിർമ്മിക്കുന്നത്.

ഒരു പ്രൊഡക്ഷൻ AI സിസ്റ്റം എന്നത് വലിയ തോതിലുള്ള ഒരു ഡിസ്ട്രിബ്യൂട്ടഡ് സിസ്റ്റമാണ് (distributed system). ഓരോ ഭാഗവും മറ്റുള്ളവയെ സ്വാധീനിക്കുന്ന ഒരു ലെയർഡ് ആർക്കിടെക്ചർ (layered architecture) ആണത്.

AI എന്നത് ഒരു ഒറ്റപ്പെട്ട ഘടകമായി മാത്രം നിങ്ങൾ കാണുകയാണെങ്കിൽ, യഥാർത്ഥ പ്രവർത്തനങ്ങൾ നിങ്ങൾക്ക് നഷ്ടമാകും. ഈ ലെയറുകൾ എങ്ങനെ പരസ്പരം പ്രവർത്തിക്കുന്നു എന്നതിലാണ് യഥാർത്ഥ മാജിക് ഒളിഞ്ഞിരിക്കുന്നത്.

വലിയ തോതിലുള്ള ഒരു AI സിസ്റ്റത്തിന്റെ പ്രധാന ലെയറുകൾ ഇവയാണ്:

• Data Pipeline: ട്രെയിനിംഗ് ഡാറ്റ ശേഖരിക്കുകയും ശുദ്ധീകരിക്കുകയും ചെയ്യുന്നു. • Training Infrastructure: വൻതോതിലുള്ള കമ്പ്യൂട്ട്, GPU ക്ലസ്റ്ററുകൾ കൈകാര്യം ചെയ്യുന്നു. • Model Layer: പ്രധാനപ്പെട്ട LLM ആർക്കിടെക്ചർ. • Inference Layer: കുറഞ്ഞ ലേറ്റൻസിയിൽ (low latency) ഉപയോക്താക്കൾക്ക് മറുപടികൾ നൽകുന്നു. • Safety Layer: ഗാർഡ്‌റെയിലുകളും (guardrails) അലൈൻമെന്റും ഉറപ്പാക്കുന്നു. • Observability: പ്രകടനം നിരീക്ഷിക്കുകയും പിശകുകൾ കണ്ടെത്തുകയും ചെയ്യുന്നു. • Feedback Loop: കാലക്രമേണ മോഡൽ മെച്ചപ്പെടുത്തുന്നതിനായി പുതിയ ഡാറ്റ ഉപയോഗിക്കുന്നു.

ഈ ശൃംഖലയിലെ ഒരു ഭാഗം മാത്രമാണ് മോഡൽ.

ഉദാഹരണത്തിന്, അലൈൻമെന്റ് (alignment) എന്നത് ഒറ്റത്തവണ മാത്രം ചെയ്യേണ്ട ഒന്നല്ല. മോഡലുകൾ സുരക്ഷിതമായി നിലനിർത്താൻ കമ്പനികൾ വിവിധ തന്ത്രങ്ങൾ ഉപയോഗിക്കുന്നു:

  • RLHF: പെരുമാറ്റം നിയന്ത്രിക്കുന്നതിന് മനുഷ്യരുടെ ഫീഡ്‌ബാക്ക് ഉപയോഗിക്കുന്നു.
  • Constitutional AI: വലിയ തോതിലുള്ള പ്രവർത്തനങ്ങൾക്കായി നിയമങ്ങൾ അടിസ്ഥാനമാക്കിയുള്ള മാർഗ്ഗനിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു.
  • Output Filtering: മോശം ഉള്ളടക്കം തടയാൻ പോസ്റ്റ്-പ്രോസസ്സിംഗ് ഉപയോഗിക്കുന്നു.

മോഡൽ തയ്യാറായുകഴിഞ്ഞാൽ, വെല്ലുവിളി ഇൻഫറൻസിലേക്ക് (inference) മാറുന്നു. വേഗതയും ചിലവും തമ്മിൽ സന്തുലിതമായി നിലനിർത്തേണ്ടതുണ്ട്. സിസ്റ്റങ്ങൾ വേഗതയുള്ളതും വിശ്വസനീയവുമാക്കാൻ എൻജിനീയർമാർ batching, caching, quantization തുടങ്ങിയ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുന്നു.

ഈ സിസ്റ്റങ്ങൾ സ്കെയിൽ ചെയ്യുന്നത് പ്രയാസകരമാണ്. ഇത് വെറുതെ കൂടുതൽ ഹാർഡ്‌വെയർ ചേർക്കുന്നത് മാത്രമല്ല. സങ്കീർണ്ണതകൾ കൈകാര്യം ചെയ്യുന്നതിനെക്കുറിച്ചാണ് ഇത്. നിങ്ങൾ സ്കെയിൽ ചെയ്യുമ്പോൾ, ഏകോപനത്തിലും (coordination) വിശ്വാസ്യതയിലും പുതിയ പ്രശ്നങ്ങൾ നേരിടേണ്ടി വരും.

AI-യെ നിരന്തരം മാറിക്കൊണ്ടിരിക്കുന്ന ഒരു സിസ്റ്റമായി കാണുന്നതിലൂടെയാണ് വിജയം ഉണ്ടാകുന്നത്. ഈ കമ്പനികൾ നിശ്ചലമായ ഉൽപ്പന്നങ്ങളല്ല നിർമ്മിക്കുന്നത്. യഥാർത്ഥ ലോകത്തെ ഉപയോഗങ്ങളിൽ നിന്ന് പഠിക്കുന്ന ലൂപ്പുകളാണ് (loops) അവർ നിർമ്മിക്കുന്നത്.

മോഡലിനെ മാത്രം ഒറ്റപ്പെട്ട രീതിയിൽ കാണുന്നത് നിർത്തുക. മുഴുവൻ സിസ്റ്റത്തെയും നോക്കുക.

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537