𝗛𝗼𝗴𝘄𝗶𝗹𝗱! 𝗜𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲: 𝗣𝗮𝗿𝗮𝗹𝗹𝗲𝗹 𝗟𝗟𝗠 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻

Machine-translated. Read the original.

📅3 hours ago⏱1 min read

𝗛𝗼𝗴𝘄𝗶𝗹𝗱! 𝗜𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲: 𝗣𝗮𝗿𝗮𝗹𝗹𝗲𝗹 𝗟𝗟𝗠 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻

Large Language Models (LLMs) अक्सर धीमे चलते हैं। वे एक बार में एक शब्द करके टेक्स्ट जनरेट करते हैं। यह प्रक्रिया एक बाधा (bottleneck) पैदा करती है।

Hogwild! Inference इसे बदल देता है। यह जनरेशन की गति बढ़ाने के लिए concurrent attention का उपयोग करता है।

यह कैसे काम करता है:

यह serial generation से हटकर काम करता है।
यह attention mechanisms को संभालने के लिए parallel processes का उपयोग करता है।
यह प्रत्येक token के लिए प्रतीक्षा में लगने वाले समय को कम करता है।

इसका लक्ष्य गुणवत्ता खोए बिना तेज़ inference प्रदान करना है। यह तरीका वास्तविक दुनिया के उपयोग के लिए LLM प्रदर्शन को स्केल करने में मदद करता है।

पूरा विवरण यहाँ पढ़ें: https://dev.to/paperium/hogwild-inference-parallel-llm-generation-via-concurrent-attention-55n4

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

उच्च प्रदर्शन वाले AI एजेंट वितरित प्रणालियाँ हैं

उच्च प्रदर्शन वाले AI एजेंट वितरित प्रणालियाँ हैं। LLMs धीमे हैं। आप बस लोडिंग स्पिनर को देखते रह जाते हैं। दस मिनट का इंतज़ार किसी क्रैश जैसा महसूस होता है। AI...

AI 2 weeks ago · 1 min read

ट्रांसफॉर्मर कैसे काम करते हैं

ट्रांसफॉर्मर कैसे काम करते हैं। ट्रांसफॉर्मर्स ने AI को बदल दिया। उन्होंने टेक्स्ट को एक-एक शब्द करके पढ़ना बंद कर दिया। RNNs जैसे पुराने मॉडल कदम-दर-कदम आगे बढ़ते थे। ट्रांसफॉर्मर्स सभी शब्दों की तुलना करते हैं...

AI 3 days ago · 2 min read

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴 Large language models require massive resources to run. Running these models efficiently is a major challenge for developer…

AI 2 days ago · 1 min read

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮 𝟮𝟲𝗕: 𝗣𝗮𝗿𝗮𝗹𝗹𝗲𝗹 𝗧𝗲𝘅𝘁 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮 𝟮𝟲𝗕: 𝗣𝗮𝗿𝗮𝗹𝗹𝗲𝗹 𝗧𝗲𝘅𝘁 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 Google DeepMind released DiffusionGemma 26B. This model uses discrete diffusion instead of the…

AI 55 minutes ago · 1 min read

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮: 𝟭,𝟬𝟬𝟬 𝗧𝗼𝗸𝗲𝗻𝘀 𝗣𝗲𝗿 𝗦𝗲𝗰𝗼𝗻𝗱

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮: 𝟭,𝟬𝟬𝟬 𝗧𝗼𝗸𝗲𝗻𝘀 𝗣𝗲𝗿 𝗦𝗲𝗰𝗼𝗻𝗱 Most language models work one word at a time. They go from left to right. This creates a speed limit becau…

AI 55 minutes ago · 2 min read