𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Translated for your language. Read the original.

AI-assisted draft.

മിനിഞ്ഞാന്ന്2min read

OpenAI-യും Anthropic-ഉം എങ്ങനെയാണ് AI സിസ്റ്റങ്ങൾ രൂപകൽപ്പന ചെയ്യുന്നത്

പലരും API ഡോക്യുമെന്റുകളോ ബ്ലോഗ് പോസ്റ്റുകളോ നോക്കി AI കമ്പനികളെക്കുറിച്ച് reverse-engineer ചെയ്യാൻ ശ്രമിക്കാറുണ്ട്. അവർ മോഡലുകളിലും എൻഡ്‌പോയിന്റുകളിലും (endpoints) മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഇത് തെറ്റായ നിഗമനങ്ങളിലേക്ക് നയിക്കുന്നു.

ഈ സമസ്യയുടെ ഒരു ഭാഗം മാത്രമാണ് മോഡൽ.

OpenAI, Anthropic തുടങ്ങിയ കമ്പനികൾ വെറും മോഡലുകൾ മാത്രമല്ല നിർമ്മിക്കുന്നത്. അവർ വലിയൊരു ഇക്കോസിസ്റ്റം (ecosystem) ആണ് കെട്ടിപ്പടുക്കുന്നത്. അവർ വലിയ തോതിലുള്ള distributed systems ആണ് നിർമ്മിക്കുന്നത്.

അവർക്ക് മികച്ച മോഡലുകൾ മാത്രമേയുള്ളൂ എന്ന് നിങ്ങൾ കരുതുന്നുണ്ടെങ്കിൽ, യഥാർത്ഥ രഹസ്യം നിങ്ങൾ കാണാതെ പോകും. സംയോജിത ലൂപ്പുകളിലൂടെ (integrated loops) അവർ ആ മോഡലുകളെ എങ്ങനെ പരിശീലിപ്പിക്കുന്നു, വിന്യസിക്കുന്നു (deploy), മെച്ചപ്പെടുത്തുന്നു എന്നതിലാണ് അവരുടെ വിജയം അടങ്ങിയിരിക്കുന്നത്.

ഇത്രയും വലിയ തോതിലുള്ള ഒരു production AI സിസ്റ്റത്തിന് നിരവധി പാളികൾ (layers) ആവശ്യമാണ്:

• Data Pipelines: പരിശീലന ഡാറ്റ ശേഖരിക്കാനും ശുദ്ധീകരിക്കാനും. • Training Infrastructure: വൻതോതിലുള്ള കമ്പ്യൂട്ട് ചിലവുകളും പാരലലിസവും (parallelism) കൈകാര്യം ചെയ്യാൻ. • Model Layer: കൃത്യതയ്ക്കായുള്ള പ്രധാന ആർക്കിടെക്ചർ. • Inference Layer: കുറഞ്ഞ ലേറ്റൻസിയിൽ (low latency) മറുപടികൾ നൽകാൻ. • Safety Layer: ഗാർഡ്‌റെയിലുകളും (guardrails) അലൈൻമെന്റും ഉറപ്പാക്കാൻ. • Observability: പ്രവർത്തനക്ഷമത നിരീക്ഷിക്കാനും പിശകുകൾ പരിഹരിക്കാനും (debug). • Feedback Loops: കാലക്രമേണ മോഡൽ മെച്ചപ്പെടുത്താൻ.

ഓരോ പാളിയും മറ്റൊന്നിനെ ആശ്രയിച്ചിരിക്കുന്നു. നിങ്ങൾ ഒന്നിനെ മാറ്റിയാൽ അത് മുഴുവൻ സിസ്റ്റത്തെയും ബാധിക്കും.

പരിശീലനം എന്നത് ഒരു തുടർച്ചയായ പ്രക്രിയയുമാണ്. ഈ കമ്പനികൾ ഒരു മോഡൽ ഒരിക്കൽ പരിശീലിപ്പിച്ച് നിർത്തുന്നില്ല. അവർ ഒരു continuous training paradigm ആണ് ഉപയോഗിക്കുന്നത്. പുതിയ ഡാറ്റയുടെ നിരന്തരമായ ഒഴുക്ക് കൈകാര്യം ചെയ്യാൻ അവർ ആയിരക്കണക്കിന് GPUs ഉപയോഗിക്കുന്നു.

അലൈൻമെന്റും (alignment) സുരക്ഷയും അവരുടെ രൂപകൽപ്പനയുടെ പ്രധാന ഭാഗമാണ്. മോഡലിന്റെ പെരുമാറ്റം നിയന്ത്രിക്കുന്നതിന് അവർ വിവിധ തന്ത്രങ്ങൾ ഉപയോഗിക്കുന്നു:

• RLHF: ഉയർന്ന നിലവാരമുള്ള അലൈൻമെന്റിനായി മനുഷ്യരുടെ ഫീഡ്‌ബാക്ക് ഉപയോഗിക്കുന്നു. • Constitutional AI: വലിയ തോതിലുള്ള പ്രവർത്തനങ്ങൾക്കായി നിയമങ്ങൾ അടിസ്ഥാനമാക്കിയുള്ള മാർഗനിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു. • Prompt Constraints: വേഗത്തിലുള്ള സെറ്റപ്പിനായി സിസ്റ്റം നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു. • Output Filtering: മോഡറേഷനായി പോസ്റ്റ്-പ്രോസസ്സിംഗ് ഉപയോഗിക്കുന്നു.

ശക്തമായി നിലനിൽക്കാൻ അവർ ഈ രീതികളെ സംയോജിപ്പിക്കുന്നു.

മോഡൽ തയ്യാറായുകഴിഞ്ഞാൽ, അത് സേവനം നൽകേണ്ടതുണ്ട്. അവർ batching, caching, quantization തുടങ്ങിയ സാങ്കേതിക വിദ്യകൾ ഉപയോഗിക്കുന്നു. വേഗതയും ചിലവും തമ്മിലുള്ള സന്തുലിതാവസ്ഥ നിലനിർത്താൻ ഇവ സഹായിക്കുന്നു.

ഒടുവിൽ, എല്ലാം നിരീക്ഷിക്കാൻ അവർ observability ഉപയോഗിക്കുന്നു. AI ഔട്ട്‌പുട്ടുകൾ എപ്പോഴും ഒരേപോലെയല്ല എന്ന

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Continue reading

എഐ വികസനത്തെക്കുറിച്ച് നമ്മൾ സംസാരിക്കേണ്ടതുണ്ട്

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

AI സിസ്റ്റങ്ങളിലെ പക്ഷപാതം

ഗുണകരമായ പരിശീലനത്തിന്റെ ചെറിയ അളവുകൾ AI സുരക്ഷ വർദ്ധിപ്പിക്കുമെന്ന് OpenAI കണ്ടെത്തി

AI സാങ്കേതികവിദ്യ പ്രൊഡക്ഷനിൽ പരാജയപ്പെടുന്നു: AI ഏകോപന വിടവ് നികത്തുക