OpenAI અને Anthropic AI સિસ્ટમ્સ કેવી રીતે ડિઝાઇન કરે છે

Translated for your language. Read the original.

AI-assisted draft.

ગયા પરમદિવસે2min read

OpenAI અને Anthropic AI સિસ્ટમ્સ કેવી રીતે ડિઝાઇન કરે છે

ઘણા લોકો API ડોક્યુમેન્ટ્સ અથવા બ્લોગ પોસ્ટ્સ જોઈને AI કંપનીઓને રિવર્સ-એન્જિનિયર કરવાનો પ્રયાસ કરે છે. તેઓ મોડલ્સ અને એન્ડપોઇન્ટ્સ પર ધ્યાન કેન્દ્રિત કરે છે. આનાથી ખોટા નિષ્કર્ષો નીકળે છે.

મોડલ એ આ કોયડાનો માત્ર એક ભાગ છે.

OpenAI અને Anthropic જેવી કંપનીઓ માત્ર મોડલ્સ જ નથી બનાવતી. તેઓ વિશાળ ઇકોસિસ્ટમ્સ બનાવે છે. તેઓ મોટા પાયે વિતરિત (distributed) સિસ્ટમ્સ બનાવે છે.

જો તમે એમ માનતા હોવ કે તેમની પાસે માત્ર સારા મોડલ્સ છે, તો તમે સાચું રહસ્ય ચૂકી રહ્યા છો. તેમની સફળતા એ વાત પર નિર્ભર છે કે તેઓ કેવી રીતે ઇન્ટિગ્રેટેડ લૂપ્સ દ્વારા તે મોડલ્સને ટ્રેન કરે છે, ડિપ્લોય કરે છે અને તેમાં સુધારો કરે છે.

આ સ્કેલ પરના પ્રોડક્શન AI સિસ્ટમ માટે અનેક સ્તરો (layers) ની જરૂર પડે છે:

• Data Pipelines: ટ્રેનિંગ ડેટા એકત્રિત કરવા અને તેને ક્લીન કરવા માટે. • Training Infrastructure: વિશાળ કમ્પ્યુટ ખર્ચ અને પેરેલલિઝમ (parallelism) મેનેજ કરવા માટે. • Model Layer: ચોકસાઈ માટેનું મુખ્ય આર્કિટેક્ચર. • Inference Layer: ઓછા લેટન્સી (latency) સાથે પ્રતિસાદ આપવા માટે. • Safety Layer: ગાર્ડરેલ્સ (guardrails) અને અલાઈનમેન્ટ (alignment) લાગુ કરવા માટે. • Observability: પર્ફોર્મન્સ મોનિટર કરવા અને ભૂલો (errors) ડિબગ કરવા માટે. • Feedback Loops: સમય જતાં મોડલમાં સુધારો કરવા માટે.

દરેક સ્તર બીજા પર નિર્ભર છે. જો તમે એકમાં ફેરફાર કરો છો, તો તેની અસર સમગ્ર સિસ્ટમ પર પડે છે.

ટ્રેનિંગ એ પણ એક સતત ચાલતી પ્રક્રિયા છે. આ કંપનીઓ એકવાર મોડલ ટ્રેન કરીને અટકી નથી જતી. તેઓ કન્ટીન્યુઅસ ટ્રેનિંગ પેરાડાઇમનો ઉપયોગ કરે છે. તેઓ નવા ડેટાના સતત પ્રવાહને હેન્ડલ કરવા માટે હજારો GPUs નો ઉપયોગ કરે છે.

અલાઈનમેન્ટ અને સેફ્ટી પણ તેમના ડિઝાઇનના મુખ્ય ભાગ છે. તેઓ મોડલના વર્તનને માર્ગદર્શન આપવા માટે વિવિધ વ્યૂહરચનાઓનો ઉપયોગ કરે છે:

• RLHF: ઉચ્ચ ગુણવત્તાવાળા અલાઈનમેન્ટ માટે માનવ પ્રતિસાદનો ઉપયોગ કરે છે. • Constitutional AI: મોટા પાયે કામ કરવા માટે નિયમ-આધારિત માર્ગદર્શનનો ઉપયોગ કરે છે. • Prompt Constraints: ઝડપી સેટઅપ માટે સિસ્ટમ ઇન્સ્ટ્રક્શનનો ઉપયોગ કરે છે. • Output Filtering: મોડરેશન માટે પોસ્ટ-પ્રોસેસિંગનો ઉપયોગ કરે છે.

મજબૂત રહેવા માટે તેઓ આ પદ્ધતિઓને જોડે છે.

એકવાર મોડલ તૈયાર થઈ જાય પછી, તેમણે તેને સર્વ કરવું પડે છે. તેઓ બેચિંગ (batching), કેશિંગ (caching) અને ક્વોન્ટાઇઝેશન (quantization) જેવી તકનીકોનો ઉપયોગ કરે છે. આ પદ્ધતિઓ ઝડપ અને ખર્ચ વચ્ચેનું સંતુલન જાળવવામાં મદદ કરે છે.

અંતે, તેઓ બધું જોવા માટે observability નો ઉપયોગ કરે છે. કારણ કે AI ના આઉટપુટ હંમેશા સમાન હોતા નથી, તેથી ડિબગિંગ કરવું મુશ્કેલ છે. તમે ફક્ત એક ભૂલ જોઈને કામ ચલાવી શકતા નથી. તમારે સમગ્ર સિસ્ટમમાં પેટર્ન (patterns) જોવી પડે છે.

AI માં સફળતા આ જટિલ આંતરક્રિયાઓને મેનેજ કરવાથી મળે છે. તેઓ AI ને સ્થિર પ્રોડક્ટ તરીકે નહીં, પરંતુ એક વિકસતી સિસ્ટમ તરીકે જુએ છે.

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

Optional learning community: https://t.me/GyaanSetuAi

OpenAI અને Anthropic AI સિસ્ટમ્સ કેવી રીતે ડિઝાઇન કરે છે

Continue reading

આપણે AI ડેવલપમેન્ટ વિશે વાત કરવાની જરૂર છે

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗕𝗶𝗮𝘀 𝗜𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

OpenAI Finds Small Doses of Beneficial Training Boost AI Safety

AI ટેકનોલોજી પ્રોડક્શનમાં નિષ્ફળ જાય છે: AI કોઓર્ડિનેશન ગેપને દૂર કરો