مدل‌های هوش مصنوعی واقعاً چگونه کار می‌کنند

شما از هوش مصنوعی برای نوشتن ایمیل یا اصلاح کد استفاده می‌کنید. بیشتر مردم آن را یک الگوریتم می‌نامند. آن‌ها نمی‌دانند که چگونه کار می‌کند. فرآیند، حتی اگر ریاضیات آن پیچیده باشد، برای درک کردن ساده است.

ایده اصلی، پیش‌بینی است.

اگر تایپ کنید "The cat sat on the"، مدل کلمه بعدی را پیش‌بینی می‌کند. مدل کلمه "mat" را انتخاب می‌کند زیرا این کلمه احتمال بالایی دارد. این چرخه را کلمه به کلمه تکرار می‌کند تا یک جمله کامل بسازد. برای پیش‌بینی درست کلمات، مدل دستور زبان، حقایق و منطق را یاد می‌گیرد.

در اینجا چهار مرحله وجود دارد:

  1. توکن‌ها (Tokens) مدل‌ها کلمات را نمی‌خوانند. آن‌ها اعداد را می‌خوانند. آن‌ها متن را به قطعات کوچکی به نام توکن تقسیم می‌کنند. هر توکن به لیستی از اعداد تبدیل می‌شود. در پس‌زمینه هر گفتگو، محاسبات ریاضی در مقیاسی عظیم انجام می‌شود.

  2. آموزش (Training) آموزش روشی است که مدل از طریق آن یاد می‌گیرد. شما میلیاردها صفحه از کتاب‌ها و وب‌سایت‌ها را به آن نشان می‌دهید. مدل یک توکن را پیش‌بینی کرده و پاسخ را بررسی می‌کند. اگر اشتباه باشد، سیستم تنظیمات داخلی خود را اصلاح می‌کند. این کار را تریلیون‌ها بار انجام می‌دهد. هیچ انسانی برای آن قوانینی نمی‌نویسد. مدل خودش الگوها را پیدا می‌کند.

  3. توجه (Attention) این بخش به مدل کمک می‌کند تا زمینه (context) را درک کند. در جمله "The trophy did not fit in the suitcase because it was too big"، کلمه "it" به جام اشاره دارد. مکانیزم توجه به مدل می‌گوید کدام کلمات قبلی بیشترین اهمیت را دارند. این امر به مدل اجازه می‌دهد تا معنا را در طول پاراگراف‌های طولانی دنبال کند.

  4. تنظیم دقیق (Fine-tuning) مدل‌های خام صرفاً موتورهای پیش‌بینی هستند. تنظیم دقیق به آن‌ها می‌آموزد که دستیار باشند. انسان‌ها به پاسخ‌ها امتیاز می‌دهند. مدل یاد می‌گیرد که بر اساس این امتیازها، پاسخ‌های مفید و ایمن ارائه دهد.

وقتی دکمه ارسال را می‌زنید چه اتفاقی می‌افتد؟

متن شما به اعداد تبدیل می‌شود. آن اعداد از لایه‌های مختلف ریاضی عبور می‌کنند. مدل احتمال توکن بعدی را محاسبه می‌کند. یک توکن را انتخاب کرده و این فرآیند را تا پایان پاسخ تکرار می‌کند. این اتفاق در عرض چند ثانیه رخ می‌دهد.

هوش مصنوعی جادو نیست. بلکه پیش‌بینی در مقیاسی عظیم است. دانستن این موضوع شما را به کاربر بهتری از این ابزار تبدیل می‌کند.

منبع: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi