OpenAI மற்றும் Anthropic எவ்வாறு AI அமைப்புகளை வடிவமைக்கின்றன

Translated for your language. Read the original.

AI-assisted draft.

நேற்று முன் தினம்2min read

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

பலரும் API ஆவணங்கள் அல்லது வலைப்பதிவுகளைப் பார்த்து AI நிறுவனங்களைத் தலைகீழாகப் பகுப்பாய்வு (reverse-engineer) செய்ய முயற்சிக்கிறார்கள். அவர்கள் மாதிரிகள் (models) அல்லது எண்ட்பாயிண்ட்களில் (endpoints) மட்டுமே கவனம் செலுத்துகிறார்கள். இது தவறான முடிவுகளுக்கு வழிவகுக்கிறது.

OpenAI மற்றும் Anthropic வெறும் மாதிரிகளை மட்டும் உருவாக்குவதில்லை. அவை முழுமையான சுற்றுச்சூழல் அமைப்புகளை (ecosystems) உருவாக்குகின்றன.

ஒரு உற்பத்தி நிலை (production) AI அமைப்பு என்பது ஒரு பெரிய அளவிலான பரவலாக்கப்பட்ட அமைப்பாகும் (distributed system). இது ஒரு அடுக்குக் கட்டமைப்பைக் (layered architecture) கொண்டது, இதில் ஒவ்வொரு பகுதியும் மற்றொன்றைப் பாதிக்கிறது.

நீங்கள் AI-ஐ ஒரு தனி அங்கமாக மட்டும் கருதினால், அதன் உண்மையான செயல்பாட்டைத் தவறவிடுகிறீர்கள். இந்த அடுக்குகள் எவ்வாறு ஒன்றோடொன்று தொடர்பு கொள்கின்றன என்பதில்தான் அதன் மந்திரம் உள்ளது.

ஒரு பெரிய அளவிலான AI அமைப்பின் முக்கிய அடுக்குகள் இதோ:

• தரவுப் பாதை (Data Pipeline): பயிற்சித் தரவைச் சேகரித்துச் சுத்தப்படுத்துகிறது. • பயிற்சி உள்கட்டமைப்பு (Training Infrastructure): மிகப்பெரிய கணக்கீட்டுத் திறன் (compute) மற்றும் GPU தொகுப்புகளை நிர்வகிக்கிறது. • மாதிரி அடுக்கு (Model Layer): முக்கிய LLM கட்டமைப்பு. • அனுமான அடுக்கு (Inference Layer): குறைந்த தாமதத்துடன் (low latency) பயனர்களுக்குப் பதில்களை வழங்குகிறது. • பாதுகாப்பு அடுக்கு (Safety Layer): பாதுகாப்புத் தடுப்புகளை (guardrails) மற்றும் சீரமைப்பை (alignment) உறுதி செய்கிறது. • கண்காணிப்புத் திறன் (Observability): செயல்திறனைக் கண்காணிக்கிறது மற்றும் பிழைகளைக் கண்டறிகிறது. • பின்னூட்டச் சுழற்சி (Feedback Loop): காலப்போக்கில் மாதிரியை மேம்படுத்தப் புதிய தரவைப் பயன்படுத்துகிறது.

இந்த வலைப்பின்னலில் மாதிரி என்பது ஒரு பகுதி மட்டுமே.

உதாரணமாக, சீரமைப்பு (alignment) என்பது ஒருமுறை மட்டும் செய்யப்படும் காரியமல்ல. மாதிரிகளைப் பாதுகாப்பாக வைத்திருக்க நிறுவனங்கள் பல்வேறு உத்திகளைக் கையாளுகின்றன:

RLHF: நடத்தையை வழிநடத்த மனித பின்னூட்டத்தைப் பயன்படுத்துகிறது.
Constitutional AI: பெரிய அளவில் செயல்பட விதிமுறை அடிப்படையிலான வழிகாட்டுதலைப் பயன்படுத்துகிறது.
வெளியீடு வடிகட்டுதல் (Output Filtering): தவறான உள்ளடக்கத்தைத் தடுக்கப் பின்-செயலாக்கத்தைப் (post-processing) பயன்படுத்துகிறது.

மாதிரி தயாரானதும், சவால் அனுமானத்திற்கு (inference) மாறுகிறது. நீங்கள் வேகம் மற்றும் செலவு ஆகியவற்றுக்கு இடையே சமநிலையைப் பேண வேண்டும். அமைப்புகளை வேகமாகவும் நம்பகமானதாகவும் வைத்திருக்க பொறியாளர்கள் batching, caching மற்றும் quantization போன்ற நுட்பங்களைப் பயன்படுத்துகிறார்கள்.

இந்த அமைப்புகளை விரிவாக்குவது (scaling) கடினம். இது வெறும் கூடுதல் வன்பொருள்களை (hardware) சேர்ப்பது மட்டுமல்ல. இது சிக்கல்களை நிர்வகிப்பதைப் பற்றியது. நீங்கள் விரிவாக்கும்போது, ஒருங்கிணைப்பு மற்றும் நம்பகத்தன்மை தொடர்பான புதிய சிக்கல்களை எதிர்கொள்வீர்கள்.

AI-ஐ ஒரு பரிணாமம் அடையும் அமைப்பாகக் கருதுவதிலிருந்து வெற்றி கிடைக்கிறது. இந்த நிறுவனங்கள் நிலையான தயாரிப்புகளை உருவாக்குவதில்லை. அவை நிஜ உலகப் பயன்பாட்டிலிருந்து கற்றுக்கொள்ளும் சுழற்சிகளை உருவாக்குகின்றன.

மாதிரியைத் தனித்துப்பார்ப்பதை நிறுத்துங்கள். முழு அமைப்பையும் பாருங்கள்.

ஆதாரம்: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

OpenAI மற்றும் Anthropic எவ்வாறு AI அமைப்புகளை வடிவமைக்கின்றன

Continue reading

OpenAI மற்றும் Anthropic எவ்வாறு AI அமைப்புகளை வடிவமைக்கின்றன

AI அமைப்புகளில் உள்ள பக்கச்சார்பு

OpenAI Finds Small Doses of Beneficial Training Boost AI Safety

𝗪𝗼𝗿𝗸𝗶𝗻𝗴 𝘄𝗶𝘁𝗵 𝗔𝗜 𝗠𝗲𝗮𝗻𝘀 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝗠𝗼𝗿𝗲, 𝗡𝗼𝘁 𝗟𝗲𝘀𝘀

AI தொழில்நுட்பம் உற்பத்தியில் தோல்வியடைகிறது: AI ஒருங்கிணைப்பு இடைவெளியைக் குறையுங்கள்