𝗟𝗟𝗠𝘀 𝘃𝘀 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝘃𝗲 𝗔𝗜
Generative AI एक व्यापक शब्द है। LLMs उसी समूह के भीतर एक विशिष्ट प्रकार के मॉडल हैं। बेहतर सिस्टम बनाने के लिए आपको तकनीकी अंतरों को समझने की आवश्यकता है।
LLMs अगले टोकन (token) का अनुमान लगाने के लिए Transformers का उपयोग करते हैं। वे autoregressive प्रक्रियाओं के माध्यम से काम करते हैं।
एक LLM कैसे काम करता है:
- मॉडल एक प्रॉम्प्ट (prompt) लेता है।
- यह टेक्स्ट को टोकन (tokens) में बदल देता है।
- यह अगले टोकन की संभावना (probability) की गणना करता है।
- वाक्य बनाने के लिए यह इस लूप को दोहराता है।
Diffusion models अलग तरह से काम करते हैं। वे नॉइज़ (noise) को रिवर्स करके इमेज बनाते हैं।
एक Diffusion model कैसे काम करता है:
- सिस्टम रैंडम नॉइज़ (random noise) के साथ शुरू होता है।
- यह चरण दर चरण नॉइज़ को हटाता है।
- यह इमेज को प्रकट करने के लिए एक पैटर्न का पालन करता है।
- यह डैनोइज़िंग (denoising) को निर्देशित करने के लिए प्रॉम्प्ट का उपयोग करता है।
एक त्वरित तुलना: • LLM: autoregressive Transformers का उपयोग करता है। आउटपुट टेक्स्ट टोकन होते हैं। • Diffusion: iterative denoising का उपयोग करता है। आउटपुट पिक्सेल (pixels) होते हैं। • GAN: adversarial training का उपयोग करता है। आउटपुट सिंथेटिक डेटा (synthetic data) होता है।
इन मॉडलों के बीच की सीमा बदल रही है। अधिकांश आधुनिक सिस्टम अब Transformer backbones का उपयोग करते हैं। आर्किटेक्चर कंपोजिशनल (compositional) होता जा रहा है। इसका अर्थ है कि विभिन्न प्रकार के मॉडल एक ही सिस्टम में मिलकर काम करेंगे।
