משיא לחיסכון: אופטימיזציה של עלויות Kubernetes

Translated for your language. Read the original.

AI-assisted draft.

משיא לחיסכון: אופטימיזציה של עלויות Kubernetes

מזינוקים לחיסכון: אופטימיזציה של עלויות Kubernetes

חשבון ה-AWS שלנו קפץ ב-34% ברבעון אחד. מפת הדרכים של המוצר לא הראתה שינויים. הסיבה הייתה פשוטה: אשכולות ה-Kubernetes שלנו בזבזו כסף.

מהנדסים מנחשים לעיתים קרובות כמה CPU וזיכרון שירות צריך. הם מעגלים כלפי מעלה כדי להיות בטוחים. זה יוצר קיבולת רפאים. אתם משלמים על משאבים שהאפליקציות שלכם לעולם לא משתמשות בהם.

הנה איך תיקנו את זה וחסכנו 34% מהעלויות החודשיות.

הבעיה המרכזית: Requests לעומת Limits

Requests הם מה שאתם מבטיחים. Kubernetes משתמש במספר הזה כדי למקם את ה-pod שלכם על node. המספר הזה הוא שמניע את החשבון שלכם.

Limits הם התקרה. אם pod מגיע למגבלת CPU, הוא מאט. אם הוא מגיע למגבלת זיכרון, הוא קורס.

צוותים רבים מגדירים requests שווים ל-limits. זה אומר שאתם משלמים על קיבולת שיא 24/7, גם כשהשירות שלכם במצב idle.

האסטרטגיה שלנו לחיסכון

למדו לפני שאתם פועלים: השתמשו ב-Prometheus וב-Grafana כדי לראות שימוש בפועל.
השתמשו באחוזונים (percentiles): הסתכלו על שימוש p95 לאורך 4 שבועות. אל תשתמשו בממוצעים. ממוצעים מסתירים זינוקים.
התאימו את ה-requests לגודל הנכון: הגדירו requests לפי שימוש p95 בתוספת buffer של 20%.
נהלו CPU limits: הימנעו מ-CPU limits צפופים בשירותים רגישים כדי למנוע throttling.
אוטומציה של scaling: השתמשו ב-HPA עבור זינוקי תעבורה וב-VPA כדי לכוונן pods בודדים.

התוצאות

הפחתנו את מספר ה-nodes שלנו מ-40 ל-26. ממוצע ניצול ה-CPU עלה מ-14% ל-52%. עלויות המחשוב החודשיות ירדו מ-$48,200 ל-$31,900. ה-latency למעשה השתפר ב-35%.

אופטימיזציה היא לא פרויקט חד-פעמי. זו הרגל. אם אתם כותבים resource request המבוסס על ניחוש, אתם מבזבזים כסף.

צ'קליסט עבור ה-cluster שלכם:

• בנו דאשבורד שמציג שימוש ב-requested לעומת שימוש בפועל

משיא לחיסכון: אופטימיזציה של עלויות Kubernetes

Continue reading

𝗖𝗼𝘀𝘁 𝗢𝗽𝘁𝗶𝗺𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗢𝘂𝗿 𝗔𝗜 𝗔𝗣𝗜 𝗕𝗶𝗹𝗹 𝗶𝗻 𝗛𝗮𝗹𝗳 𝗪𝗵𝗶𝗹𝗲 𝗛𝗶𝘁𝘁𝗶𝗻𝗴 𝗽𝟵𝟵 𝗦𝗟𝗔𝘀

𝟳 𝗪𝗮𝘆𝘀 𝘁𝗼 𝗥𝗲𝗱𝘂𝗰𝗲 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗕𝗶𝗹𝗹

אובר כלה את כל תקציב קידוד ה-AI שלה ב-4 חודשים