مدلهای هوش مصنوعی واقعاً چگونه کار میکنند
شما از هوش مصنوعی برای نوشتن ایمیل یا اصلاح کد استفاده میکنید. بیشتر مردم آن را یک الگوریتم مینامند. آنها نمیدانند که چگونه کار میکند. فرآیند، حتی اگر ریاضیات آن پیچیده باشد، برای درک کردن ساده است.
ایده اصلی، پیشبینی است.
اگر تایپ کنید "The cat sat on the"، مدل کلمه بعدی را پیشبینی میکند. مدل کلمه "mat" را انتخاب میکند زیرا این کلمه احتمال بالایی دارد. این چرخه را کلمه به کلمه تکرار میکند تا یک جمله کامل بسازد. برای پیشبینی درست کلمات، مدل دستور زبان، حقایق و منطق را یاد میگیرد.
در اینجا چهار مرحله وجود دارد:
توکنها (Tokens) مدلها کلمات را نمیخوانند. آنها اعداد را میخوانند. آنها متن را به قطعات کوچکی به نام توکن تقسیم میکنند. هر توکن به لیستی از اعداد تبدیل میشود. در پسزمینه هر گفتگو، محاسبات ریاضی در مقیاسی عظیم انجام میشود.
آموزش (Training) آموزش روشی است که مدل از طریق آن یاد میگیرد. شما میلیاردها صفحه از کتابها و وبسایتها را به آن نشان میدهید. مدل یک توکن را پیشبینی کرده و پاسخ را بررسی میکند. اگر اشتباه باشد، سیستم تنظیمات داخلی خود را اصلاح میکند. این کار را تریلیونها بار انجام میدهد. هیچ انسانی برای آن قوانینی نمینویسد. مدل خودش الگوها را پیدا میکند.
توجه (Attention) این بخش به مدل کمک میکند تا زمینه (context) را درک کند. در جمله "The trophy did not fit in the suitcase because it was too big"، کلمه "it" به جام اشاره دارد. مکانیزم توجه به مدل میگوید کدام کلمات قبلی بیشترین اهمیت را دارند. این امر به مدل اجازه میدهد تا معنا را در طول پاراگرافهای طولانی دنبال کند.
تنظیم دقیق (Fine-tuning) مدلهای خام صرفاً موتورهای پیشبینی هستند. تنظیم دقیق به آنها میآموزد که دستیار باشند. انسانها به پاسخها امتیاز میدهند. مدل یاد میگیرد که بر اساس این امتیازها، پاسخهای مفید و ایمن ارائه دهد.
وقتی دکمه ارسال را میزنید چه اتفاقی میافتد؟
متن شما به اعداد تبدیل میشود. آن اعداد از لایههای مختلف ریاضی عبور میکنند. مدل احتمال توکن بعدی را محاسبه میکند. یک توکن را انتخاب کرده و این فرآیند را تا پایان پاسخ تکرار میکند. این اتفاق در عرض چند ثانیه رخ میدهد.
هوش مصنوعی جادو نیست. بلکه پیشبینی در مقیاسی عظیم است. دانستن این موضوع شما را به کاربر بهتری از این ابزار تبدیل میکند.
منبع: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm
انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi