هوش مداری: چگونه مدل‌های زبانی دیداری (VLMs) در حال متحول کردن خودمختاری ماهواره‌ها هستند

Translated for your language. Read the original.

AI-assisted draft.

In this article

هوش مداری: چگونه مدل‌های بینایی-زبانی (VLMs) در حال متحول کردن خودمختاری ماهواره‌ها هستند

عصر مشاهده غیرفعال زمین در حال پایان است، زیرا ماهواره‌ها از حسگرهای صرف به عوامل هوشمند تبدیل می‌شوند. در یک نقطه عطف پیشگامانه، یک فضاپیما با موفقیت از یک مدل بینایی-زبانی (VLM) در مدار برای شناسایی اشیاء و محیط‌های پیچیده بدون دخالت انسان استفاده کرده است.

طلوع مدل‌های بینایی-زبانی در مدار

از نظر تاریخی، عملیات ماهواره‌ای از یک گردش کار خطی و سنگین از نظر داده پیروی می‌کرد: فضاپیما مقادیر عظیمی از تصاویر خام را ثبت می‌کرد، آن‌ها را به زمین ارسال می‌کرد و منتظر تحلیلگران انسانی یا الگوریتم‌های تخصصی می‌ماند تا یافته‌ها را تفسیر کنند. این فرآیند با گلوگاه‌های پهنای باند و تأخیر قابل توجهی دست و پنجه نرم می‌کند.

این پارادایم با فضاپیمای Yam-9، ساخته شده توسط ارائه‌دهنده زیرساخت‌های فضایی Loft Orbital، تغییر کرد. این ماهواره که با یک بسته نرم‌افزاری به نام NAVI-Orbital (توسعه‌یافته توسط آزمایشگاه پیشرانش جت ناسا یا JPL) کار می‌کند، با موفقیت مدل Gemma 3 VLM از Google DeepMind را مستقر کرد. برخلاف مدل‌های سنتی، Gemma 3 به‌طور اختصاصی برای کاربردهای «لبه‌ای» (edge) ساخته شده است، به این معنی که برای اجرا روی سخت‌افزارهای محدود موجود در فضا بهینه‌سازی شده است، نه مراکز داده عظیم زمینی.

با ترکیب استدلال زمینه‌ای مدل‌های زبانی بزرگ (LLMs) با پردازش بصری، Yam-9 توانست به پرس‌وجوهای زبان طبیعی پاسخ دهد. محققان با موفقیت وظایف طبقه‌بندی پیچیده‌ای را به مدل محول کردند، مانند شناسایی تلاقی محیط‌های طبیعی و توسعه انسانی یا مکان‌یابی زیرساخت‌های خاص در اطراف قطب‌های ریلی.

محاسبات لبه‌ای در محیط خشن فضا

اجرای هوش مصنوعی پیشرفته در مدار نیازمند سخت‌افزار تخصصی است که قادر به بقا در شرایط سخت باشد و در عین حال محدودیت‌های شدید توان و حافظه را مدیریت کند. Yam-9 به عنوان پیشگامی برای این واقعیت جدید عمل می‌کند که مجهز به یک پردازنده گرافیکی Nvidia Jetson Orin AGX است؛ یکی از تراشه‌های پیشرو در صنعت برای محاسبات مبتنی بر فضا.

چالش فنی فراتر از سخت‌افزار است. خوان دلفا ویکتوریا، مدیر فنی NASA JPL، خاطرنشان کرد که اگرچه Gemma 3 یک مدل «آماده استفاده» (off-the-shelf) است، اما مهندسان مجبور بودند چارچوب نرم‌افزاری NAVI-Orbital را به شدت ساده‌سازی کنند تا ردپای حافظه و وابستگی‌های کتابخانه‌ای را کاهش دهند. این بهینه‌سازی برای «هوش مصنوعی لبه‌ای» (edge AI) حیاتی است، جایی که هر بایت از رم و هر میلی‌وات توان اهمیت دارد.

پیامدهای این موضوع برای صنعت بسیار گسترده است. شرکت‌هایی مانند Planet Labs در حال حاضر از پردازنده‌های Jetson Orin برای تشخیص ساده‌تر اشیاء استفاده می‌کنند، در حالی که Kepler Communications بزرگ‌ترین گروه GPUها را در فضا مدیریت می‌کند. موفقیت Yam-9 ثابت می‌کند که «مسیر حرکت» کل این بخش به سمت منظومه‌های هوشمند و خودگردان است.

از غربالگری داده‌ها تا دستیاران دیجیتال برای فضانوردان

ارزش فوری VLMهای مداری در غربالگری و اولویت‌بندی داده‌ها نهفته است. ماهواره‌ها با انجام تحلیل‌های اولیه در مدار، می‌توانند داده‌های نامرتبط را فیلتر کرده و تنها «مناطق مورد نظر» را ارسال کنند، که این امر حجم عظیم داده‌های خام را که تحلیلگران باید پردازش کنند، به شدت کاهش می‌دهد. این قابلیت، لایه‌های گشت‌زنی «همیشه‌فعال» را ممکن می‌سازد، به‌طوری که کاربر می‌تواند به سادگی به یک ماهواره فرمان دهد: «این مرز را زیر نظر بگیر و اگر مورد مشکوکی مشاهده شد، به من هشدار بده.»

فراتر از مشاهده زمین، این فناوری پیامدهای عمیقی برای اکتشافات در فضای دوردست دارد. مفهوم NAVI-Space از نیاز به دستیاران دیجیتال تعاملی برای فضانوردان در ماه یا مریخ نشأت گرفته است. در محیط‌هایی که فضانوردان در لباس‌های تحت فشار هستند و نمی‌توانند از صفحه‌کلید استفاده کنند، یک دستیار مجهز به VLM می‌تواند به عنوان یک رابط تعاملی و کنترل‌شونده با صدا برای انجام وظایف پیچیده مأموریت عمل کند.

نکات کلیدی

استدلال خودگردان: استقرار Gemma 3 از Google DeepMind بر روی Yam-9، اولین باری است که یک مدل بینایی-زبانی (vision-language model) از زبان طبیعی برای طبقه‌بندی خودگردان تصاویر مداری استفاده می‌کند.
کارایی هوش مصنوعی لبه (Edge AI): موفقیت به سخت‌افزارهای تخصصی مانند Nvidia Jetson Orin AGX و بسترهای نرم‌افزاری بسیار بهینه‌سازی‌شده (NAVI-Orbital) برای مدیریت توان و حافظه محدود بستگی دارد.
تغییر در مدل‌های کسب‌وکار: شرکت‌های فضایی در حال گذار از تأمین‌کنندگان ساده داده به «زیرساخت به عنوان خدمت» (infrastructure-as-a-service) هستند که پایش هوشمند و بی‌درنگ زمین و فراتر از آن را امکان‌پذیر می‌سازد.