GPT तुमच्या कल्पनेपेक्षाही जास्त करू शकते

Translated for your language. Read the original.

AI-assisted draft.

काल2min read

𝗚𝗣𝗧 तुम्ही विचार करता त्यापेक्षाही अधिक करू शकते

GPT मॉडेल्स मजकुरासोबत (text) काम करण्याची आपली पद्धत बदलत आहेत.

ही यात्रा GPT-1 पासून सुरू झाली. त्यातून हे सिद्ध झाले की मशीन सुसंगत वाक्ये लिहू शकतात. त्यानंतर GPT-2 आले आणि या मॉडेल्समध्ये किती क्षमता आहे हे दिसून आले. मग GPT-3 आले. 175 billion पॅरामीटर्ससह, याने हे सिद्ध केले की मॉडेल्स केवळ वाक्य पूर्ण करण्यापेक्षाही अधिक काही करू शकतात.

याचे रहस्य Transformer आर्किटेक्चरमध्ये आहे. ते प्रचंड प्रमाणात डेटा मधून पॅटर्न शिकते. तुम्हाला प्रत्येक नियम प्रोग्राम करण्याची गरज नाही. तुम्ही विशिष्ट कामांसाठी ते fine-tune करू शकता किंवा त्याला मार्गदर्शन करण्यासाठी नैसर्गिक भाषेचा (natural language) वापर करू शकता.

परंतु, ही मॉडेल्स प्रोडक्शनमध्ये चालवणे कठीण आहे.

उच्च लॅटन्सीमुळे (High latency) वापरकर्त्याचा अनुभव खराब होऊ शकतो. आम्ही 64 Nvidia H100 GPUs वर मोठी मॉडेल्स चालवली. त्यातील विलंब (delay) 120ms होता. आमच्या गरजांसाठी हे खूप संथ होते. आम्ही LoRA वापरून 6-billion-parameter च्या लहान मॉडेलकडे वळलो. यामुळे लॅटन्सी 38ms पर्यंत खाली आली. यामुळे आमचे दरमहा $30,000 देखील वाचले. आम्ही कोडिंगची अचूकता थोडी गमावली, पण वेग आणि खर्चाचा विचार करता ते फायदेशीर ठरले.

तुम्हाला पूर्वग्रहांकडेही (biases) लक्ष दिले पाहिजे. GPT इंटरनेटवरून पॅटर्न शिकते. याचा अर्थ असा की ते रूढीवादी विचार (stereotypes) किंवा तथ्यात्मक चुकांची पुनरावृत्ती करू शकते. ते चुकीचे असतानाही आत्मविश्वासाने बोलते.

आम्ही या चुका पकडण्यासाठी एक डेटा पाइपलाइन तयार केली. पूर्वग्रहदूषित भाषा ओळखण्यासाठी आम्ही एक rule engine वापरला. सुरुवातीला, आमचे 4% फ्लॅग्स चुकीचे होते. आम्ही एक लहान validation मॉडेल जोडून ही समस्या सोडवली. यामुळे चुका 1% पेक्षा कमी झाल्या.

खर्च आणि ऊर्जा हे देखील मोठे अडथळे आहेत.

मोठी मॉडेल्स प्रशिक्षित करण्यासाठी लाखो डॉलर्स खर्च होतात. खर्च कमी करण्यासाठी आम्ही quantization वापरतो. 4-bit quantization वापरून, आम्ही प्रति टोकन खर्च $0.00015 वरून $0.00004 पर्यंत कमी केला. एका मोठ्या SaaS प्रॉडक्टसाठी, यामुळे वर्षाला $3 million वाचतात.

भविष्य कार्यक्षमतेकडे (efficiency) झुकत आहे. मॉडेल्स फक्त मोठे करण्याऐवजी, डेव्हलपर्स त्यांना अधिक स्मार्ट आणि लहान बनवत आहेत. आपल्याला अशी मॉडेल्स हवी आहेत जी वेगवान, स्वस्त आणि त्यांना काय माहित नाही याबद्दल प्रामाणिक असतील.

ही साधने शहाणपणाने वापरा. त्यांच्या मर्यादा समजून घ्या. ती उपयुक्त ठेवण्यासाठी guardrails तयार करा.

Source: https://dev.to/lavkeshdwivedi/gpt-does-more-than-you-think-fll

Optional learning community: https://t.me/GyaanSetuAi

GPT तुमच्या कल्पनेपेक्षाही जास्त करू शकते

Continue reading

एआय (AI) म्हणजे केवळ प्रॉम्प्ट्स नव्हे

पायथनच्या नवशिक्यांसाठी Gen AI ची ओळख

𝗣𝗿𝗲𝗽𝗮𝗿𝗶𝗻𝗴 𝗳𝗼𝗿 𝗚𝗣𝗧 𝟱 𝗜𝗻𝘁𝗲𝗴𝗿𝗮𝘁𝗶𝗼𝗻

𝗧𝗵𝗲 𝗔𝗹𝗺𝗼𝘀𝘁 𝗦𝗮𝗶𝗱

ChatGPT 4 प्रत्यक्ष वापरात