استضافة الذكاء الاصطناعي ذاتياً باستخدام Jetson Orin Nano و Ollama

خوادم الذكاء الاصطناعي السحابية باهظة الثمن.

إن ربط الخدمات السحابية بالوكلاء المحليين (local agents) يسبب بعض العقبات. لقد واجهت هذه المشكلة أثناء بناء تطبيقاتي، Govend و Flippy.

أردت استخدام Ollama لتشغيل واجهات الدردشة وإنشاء البطاقات التعليمية (flashcards). لم أرغب في دفع رسوم شهرية للخوادم السحابية، بل كنت أبحث عن حل محلي.

اخترت Nvidia Jetson Orin Nano؛ فهو يتعامل مع نماذج الذكاء الاصطناعي الصغيرة بكفاءة، كما أنه يمثل تكلفة تُدفع لمرة واحدة بدلاً من الفواتير المتكررة.

لم يكن الإعداد سهلاً، وقد تعلمت عدة دروس قاسية:

• تجنب بطاقات SD، واستخدم قرص NVMe بدلاً منها. • انتبه لتوقيت الشاشة؛ فقد دخلت شاشتي في وضع السكون أثناء عملية الإقلاع، مما جعلني أفقد مطالبات الإدخال (input prompts) الحاسمة لأن الشاشة دخلت في وضع الخمول بسرعة كبيرة. • استعد لمشاكل العتاد (hardware friction)؛ فقد اضطررت لمزامنة زر الطاقة وإقلاع Nano بدقة تامة للحصول على إشارة.

بمجرد أن عمل العتاد، بدأ العمل الحقيقي. انتقلت بعيداً عن خدمات مثل Heroku و Render، وقم بإنشاء مركز خادم مركزي لاستضافة تطبيقاتي محلياً.

علمني هذا الانتقال الكثير عن الأمن السيبراني؛ فاستخدام الذكاء الاصطناعي يفرض مخاطر جديدة، وكان عليّ تعلم كيفية حماية إعداداتي.

ما قمت بتنفيذه لتأمين مركزي:

  • تحديد معدل الطلبات (Rate limiting) لمنع الإساءة.
  • الإغلاق التدريجي للحسابات.
  • رؤوس الأمان (Security headers) وسياسات أمان المحتوى (Content Security Policies) الصارمة.
  • جدار حماية للخادم لإغلاق المنافذ غير المستخدمة.
  • ملف security.txt للإفصاح المسؤول عن الثغرات.

استخدمت Claude Code للمساعدة في بناء صفحة مركز الخادم الخاص بي، وقد ساعدني في تحديد الثغرات الأمنية قبل إطلاق المشروع للعلن.

كان بناء هذه البنية التحتية المحلية للذكاء الاصطناعي تجربة تعليمية هائلة؛ فقد حولت عملية التطوير لدي من الاعتماد على السحب الخارجية إلى امتلاك كامل بنيتي التقنية (stack).

اطلع على مركزي الجديد هنا: annavillarreal.com

المصدر: https://dev.to/annavi11arrea1/self-hosting-experience-with-jetson-orin-nano-and-ollama-5a9c

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi