ما اعتماد به مدلها را متوقف کردیم. سپس اعتماد به اعداد و ارقام خودمان را متوقف کردیم.
من از دنبال کردن مدلهای هوش مصنوعی بهتر دست کشیدم. فکر میکردم یک مدل قویتر سیستم من را اصلاح خواهد کرد. اما اینطور نشد. مشکل از مدل نبود؛ مشکل از سیستم بود.
سپس متوجه چیز بدتری شدم. من حتی نمیتوانستم به اندازهگیریهای خودم هم اعتماد کنم.
سه نوع شکست متفاوت را مشاهده کردم:
- مجموعهای از تستها که در حال اندازهگیری محیطی اشتباه بودند، اما با موفقیت پاس میشدند.
- یک دروازه (gate) که مانع کار میشد اما آمارهای اشتباهی ارائه میداد.
- یک عامل (agent) که تعداد اشتباهی را گزارش میکرد.
هر شکست تا زمانی که دقیقتر نگاه نمیکردم، شبیه به موفقیت به نظر میرسید. ابزارهای من برای تأیید (verification)، داشتند به من دروغ میگفتند.
اولین غریزهام این بود که تمام عدمقطعیتها را ممنوع کنم. میخواستم هر عنصر احتمالی را حذف کنم. میخواستم همه چیز قطعی (deterministic) باشد.
این یک اشتباه بود.
اگر تمام عدمقطعیت را حذف کنید، ارزش هوش مصنوعی را از بین بردهاید. هدف هوش مصنوعی پیشنهاد ایدهها و بررسی راهحلهاست. شما نمیتوانید این را از یک قانون سختگیرانه به دست آورید.
راه حل، ممنوع کردن عدمقطعیت نیست؛ راه حل، قرار دادن درست آن است.
یک سیستم به دو جایگاه متفاوت نیاز دارد:
۱. جایگاه پیشنهاددهنده این جایگاه به کاوش و پیشنهاد میپردازد. این جایگاه به عدمقطعیت (nondeterminism) نیاز دارد. اگر مدلی یک اصلاح اشتباه پیشنهاد دهد، هزینه آن کم است، زیرا هنوز هیچ تصمیمی نگرفته است.
۲. جایگاه قضاوتگر این جایگاه تصمیم میگیرد که آیا یک تست پاس میشود یا یک قانون رعایت شده است یا خیر. این جایگاه باید قطعی (deterministic) باشد. باید بازتولیدپذیر و قابل بررسی باشد.
شکستها در سیستم من به این دلیل رخ داد که چیزهای اشتباهی را در جایگاه قضاوتگر قرار دادم. من اجازه دادم فرآیندهای نامطمئن، تصمیمات نهایی را بگیرند.
قانون ساده است:
- اجازه دهید بخشهای نامطمئن کاوش کنند.
- اجازه دهید بخشهای قطعی قضاوت کنند.
سعی نکنید کل سیستم را قطعی کنید. در عوض، مطمئن شوید که قاضیان شما استوار هستند. یک قاضی قطعی که اشتباه میکند، خطرناکتر از یک قاضی احتمالی است. یک قاضی اشتباه، خطایی مداوم ایجاد میکند که در نهایت دیگر به آن شک نمیکنید.
هر لایهای که به شما اعتماد میدهد، ابتدا باید اندازهگیری شود. آن اندازهگیری باید بر چیزی قطعی استوار باشد که خودتان بتوانید شاهد آن باشید.
شما در سیستمهای هوش مصنوعی خود، مرز بین پیشنهاد دادن و قضاوت کردن را چگونه تعیین میکنید؟ در کجا بر قطعی بودن پافشاری میکنید؟
Source: https://dev.to/josephyeo/we-stopped-trusting-models-then-we-stopped-trusting-our-own-numbers-1611
Optional learning community: https://t.me/GyaanSetuAi
