من القفزات المفاجئة إلى التوفير: تحسين تكاليف Kubernetes

قفزت فاتورة AWS الخاصة بنا بنسبة 34% في ربع سنوي واحد. لم تظهر خارطة طريق المنتج أي تغييرات. كان السبب بسيطاً: كانت مجموعات (clusters) Kubernetes الخاصة بنا تهدر الأموال.

غالباً ما يخمن المهندسون مقدار ما تحتاجه الخدمة من وحدة المعالجة المركزية (CPU) والذاكرة. يقومون بتقريب الأرقام للأعلى لضمان الأمان. يؤدي هذا إلى خلق سعة وهمية. أنت تدفع مقابل موارد لا تستخدمها تطبيقاتك أبداً.

إليكم كيف قمنا بإصلاح ذلك ووفرنا 34% من التكاليف الشهرية.

المشكلة الأساسية: الطلبات (Requests) مقابل الحدود (Limits)

الطلبات (Requests) هي ما تضمنه. يستخدم Kubernetes هذا الرقم لتحديد مكان الـ pod الخاص بك على عقدة (node). هذا الرقم هو ما يحدد قيمة فاتورتك.

الحدود (Limits) هي السقف. إذا وصل الـ pod إلى حد الـ CPU، فسيتباطأ. إذا وصل إلى حد الذاكرة، فسيتوقف عن العمل.

تضع العديد من الفرق الطلبات مساوية للحدود. وهذا يعني أنك تدفع مقابل ذروة السعة على مدار الساعة طوال أيام الأسبوع، حتى عندما تكون خدمتك في حالة خمول.

استراتيجيتنا للتوفير

  • القياس قبل اتخاذ إجراء: استخدم Prometheus و Grafana لرؤية الاستخدام الفعلي.
  • استخدم المئينات (percentiles): انظر إلى استخدام p95 على مدار 4 أسابيع. لا تستخدم المتوسطات، فالمتوسطات تخفي القفزات المفاجئة.
  • ضبط حجم الطلبات (Right-size): اضبط الطلبات عند مستوى استخدام p95 بالإضافة إلى هامش أمان بنسبة 20%.
  • إدارة حدود الـ CPU: تجنب وضع حدود CPU ضيقة للخدمات الحساسة لمنع الاختناق (throttling).
  • أتمتة التوسع (scaling): استخدم HPA للتعامل مع قفزات حركة المرور، و VPA لضبط الـ pods الفردية.

النتائج

قمنا بتقليل عدد العقد (nodes) من 40 إلى 26. ارتفع متوسط استهلاك الـ CPU من 14% إلى 52%. انخفضت تكاليف الحوسبة الشهرية من 48,200 دولار إلى 31,900 دولار. في الواقع، تحسن زمن الاستجابة (latency) بنسبة 35%.

التحسين ليس مشروعاً يتم لمرة واحدة، بل هو عادة. إذا كتبت طلباً للموارد بناءً على تخمين، فأنت تهدر الأموال.

قائمة مراجعة لمجموعتك (cluster):

• قم ببناء لوحة بيانات (dashboard) تعرض الطلبات مقابل الاستخدام الفعلي. • اضبط الطلبات بناءً على بيانات 4 أسابيع. • قم بتشغيل VPA في وضع التوصية (recommendation mode) قبل السماح له بإجراء التغييرات. • راجع مواصفات الموارد كل ربع سنة. • امنح الفرق الهندسية رؤية واضحة لتكاليفهم الخاصة.

Source: https://dev.to/samarth_05/from-spikes-to-savings-practical-k8s-cost-optimization-for-2026-75k

Optional learning community: https://t.me/GyaanSetuAi