𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Translated for your language. Read the original.

AI-assisted draft.

മിനിഞ്ഞാന്ന്2min read

OpenAI-യും Anthropic-ഉം എങ്ങനെയാണ് AI സിസ്റ്റങ്ങൾ രൂപകൽപ്പന ചെയ്യുന്നത്

പലരും API ഡോക്യുമെന്റുകളോ ബ്ലോഗ് പോസ്റ്റുകളോ നോക്കി AI കമ്പനികളെക്കുറിച്ച് റിവേഴ്സ് എഞ്ചിനീയറിംഗ് നടത്താൻ ശ്രമിക്കാറുണ്ട്. അവർ മോഡലുകളിലോ എൻഡ്‌പോയിന്റുകളിലോ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഇത് തെറ്റായ നിഗമനങ്ങളിലേക്ക് നയിക്കുന്നു.

OpenAI-യും Anthropic-ഉം വെറും മോഡലുകൾ മാത്രമല്ല നിർമ്മിക്കുന്നത്. അവർ സമ്പൂർണ്ണ ഇക്കോസിസ്റ്റങ്ങളാണ് (ecosystems) നിർമ്മിക്കുന്നത്.

ഒരു പ്രൊഡക്ഷൻ AI സിസ്റ്റം എന്നത് വലിയ തോതിലുള്ള ഒരു ഡിസ്ട്രിബ്യൂട്ടഡ് സിസ്റ്റമാണ് (distributed system). ഓരോ ഭാഗവും മറ്റുള്ളവയെ സ്വാധീനിക്കുന്ന ഒരു ലെയർഡ് ആർക്കിടെക്ചർ (layered architecture) ആണത്.

AI എന്നത് ഒരു ഒറ്റപ്പെട്ട ഘടകമായി മാത്രം നിങ്ങൾ കാണുകയാണെങ്കിൽ, യഥാർത്ഥ പ്രവർത്തനങ്ങൾ നിങ്ങൾക്ക് നഷ്ടമാകും. ഈ ലെയറുകൾ എങ്ങനെ പരസ്പരം പ്രവർത്തിക്കുന്നു എന്നതിലാണ് യഥാർത്ഥ മാജിക് ഒളിഞ്ഞിരിക്കുന്നത്.

വലിയ തോതിലുള്ള ഒരു AI സിസ്റ്റത്തിന്റെ പ്രധാന ലെയറുകൾ ഇവയാണ്:

• Data Pipeline: ട്രെയിനിംഗ് ഡാറ്റ ശേഖരിക്കുകയും ശുദ്ധീകരിക്കുകയും ചെയ്യുന്നു. • Training Infrastructure: വൻതോതിലുള്ള കമ്പ്യൂട്ട്, GPU ക്ലസ്റ്ററുകൾ കൈകാര്യം ചെയ്യുന്നു. • Model Layer: പ്രധാനപ്പെട്ട LLM ആർക്കിടെക്ചർ. • Inference Layer: കുറഞ്ഞ ലേറ്റൻസിയിൽ (low latency) ഉപയോക്താക്കൾക്ക് മറുപടികൾ നൽകുന്നു. • Safety Layer: ഗാർഡ്‌റെയിലുകളും (guardrails) അലൈൻമെന്റും ഉറപ്പാക്കുന്നു. • Observability: പ്രകടനം നിരീക്ഷിക്കുകയും പിശകുകൾ കണ്ടെത്തുകയും ചെയ്യുന്നു. • Feedback Loop: കാലക്രമേണ മോഡൽ മെച്ചപ്പെടുത്തുന്നതിനായി പുതിയ ഡാറ്റ ഉപയോഗിക്കുന്നു.

ഈ ശൃംഖലയിലെ ഒരു ഭാഗം മാത്രമാണ് മോഡൽ.

ഉദാഹരണത്തിന്, അലൈൻമെന്റ് (alignment) എന്നത് ഒറ്റത്തവണ മാത്രം ചെയ്യേണ്ട ഒന്നല്ല. മോഡലുകൾ സുരക്ഷിതമായി നിലനിർത്താൻ കമ്പനികൾ വിവിധ തന്ത്രങ്ങൾ ഉപയോഗിക്കുന്നു:

RLHF: പെരുമാറ്റം നിയന്ത്രിക്കുന്നതിന് മനുഷ്യരുടെ ഫീഡ്‌ബാക്ക് ഉപയോഗിക്കുന്നു.
Constitutional AI: വലിയ തോതിലുള്ള പ്രവർത്തനങ്ങൾക്കായി നിയമങ്ങൾ അടിസ്ഥാനമാക്കിയുള്ള മാർഗ്ഗനിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു.
Output Filtering: മോശം ഉള്ളടക്കം തടയാൻ പോസ്റ്റ്-പ്രോസസ്സിംഗ് ഉപയോഗിക്കുന്നു.

മോഡൽ തയ്യാറായുകഴിഞ്ഞാൽ, വെല്ലുവിളി ഇൻഫറൻസിലേക്ക് (inference) മാറുന്നു. വേഗതയും ചിലവും തമ്മിൽ സന്തുലിതമായി നിലനിർത്തേണ്ടതുണ്ട്. സിസ്റ്റങ്ങൾ വേഗതയുള്ളതും വിശ്വസനീയവുമാക്കാൻ എൻജിനീയർമാർ batching, caching, quantization തുടങ്ങിയ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുന്നു.

ഈ സിസ്റ്റങ്ങൾ സ്കെയിൽ ചെയ്യുന്നത് പ്രയാസകരമാണ്. ഇത് വെറുതെ കൂടുതൽ ഹാർഡ്‌വെയർ ചേർക്കുന്നത് മാത്രമല്ല. സങ്കീർണ്ണതകൾ കൈകാര്യം ചെയ്യുന്നതിനെക്കുറിച്ചാണ് ഇത്. നിങ്ങൾ സ്കെയിൽ ചെയ്യുമ്പോൾ, ഏകോപനത്തിലും (coordination) വിശ്വാസ്യതയിലും പുതിയ പ്രശ്നങ്ങൾ നേരിടേണ്ടി വരും.

AI-യെ നിരന്തരം മാറിക്കൊണ്ടിരിക്കുന്ന ഒരു സിസ്റ്റമായി കാണുന്നതിലൂടെയാണ് വിജയം ഉണ്ടാകുന്നത്. ഈ കമ്പനികൾ നിശ്ചലമായ ഉൽപ്പന്നങ്ങളല്ല നിർമ്മിക്കുന്നത്. യഥാർത്ഥ ലോകത്തെ ഉപയോഗങ്ങളിൽ നിന്ന് പഠിക്കുന്ന ലൂപ്പുകളാണ് (loops) അവർ നിർമ്മിക്കുന്നത്.

മോഡലിനെ മാത്രം ഒറ്റപ്പെട്ട രീതിയിൽ കാണുന്നത് നിർത്തുക. മുഴുവൻ സിസ്റ്റത്തെയും നോക്കുക.

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Continue reading

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

AI സിസ്റ്റങ്ങളിലെ പക്ഷപാതം

ഗുണകരമായ പരിശീലനത്തിന്റെ ചെറിയ അളവുകൾ AI സുരക്ഷ വർദ്ധിപ്പിക്കുമെന്ന് OpenAI കണ്ടെത്തി

𝗪𝗼𝗿𝗸𝗶𝗻𝗴 𝘄𝗶𝘁𝗵 𝗔𝗜 𝗠𝗲𝗮𝗻𝘀 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝗠𝗼𝗿𝗲, 𝗡𝗼𝘁 𝗟𝗲𝘀𝘀

AI സാങ്കേതികവിദ്യ പ്രൊഡക്ഷനിൽ പരാജയപ്പെടുന്നു: AI ഏകോപന വിടവ് നികത്തുക