Coinbase Shifts to Chinese AI Models to Slash API Costs

Translated for your language. Read the original.

AI-assisted draft.

Coinbase Shifts to Chinese AI Models to Slash API Costs

In this article

Coinbase עוברת למודלי AI סיניים כדי לקצץ בעלויות ה-API

בעוד מעבדות AI מערביות נאבקות לאזן בין עלויות מחשוב עצומות לבין רווחיות, מובילות בתעשייה מתחילות להביט מזרחה כדי למצוא יעילות. Coinbase הצטרפה רשמית לקבוצה גדלה והולכת של ענקיות טכנולוגיה המבצעות מעבר למודלי AI סיניים כדי לייעל את הוצאות התפעול שלהן.

המעבר למודלים סיניים: GLM ו-Kimi

מנכ"ל Coinbase, בריאן ארמסטרונג, חשף לאחרונה כי החברה הטמיעה בתשתית שלה מודלים שפותחו בסין, כגון GLM 5.2 ו-Kimi 2.7. שינוי אסטרטגי זה אפשר ל-Coinbase לטפל בכמויות טוקנים (tokens) גבוהות משמעותית, ובו בזמן לקצץ את הוצאות ה-AI שלה בחצי.

המהלך הזה אינו מוגבל למגזר הקריפטו בלבד. הסטארט-אפ Lindy עבר לשימוש ב-DeepSeek v4, וענקית הנתונים Snowflake בוחנת כעת מודלים סיניים כחלופות משתלמות לעומת ההצעות היקרות של OpenAI ו-Anthropic. שינוי זה מסמן מעבר מאסיבי באופן שבו ארגונים תופסים את ה-"frontier" של ה-AI, תוך מתן עדיפות ליחס של מחיר-ביצועים על פני היכרות עם המותג.

ניתוב חכם והנדסת הקשר (Context Engineering)

כדי למקסם את החיסכון הזה, Coinbase הטמיעה מערכת ניתוב אוטומטית. במקום להסתמך על LLM יחיד, המערכת מעריכה כל בקשה על בסיס שלושה מדדים קריטיים: מורכבות המשימה, עלות ופוטנציאל זיכרון מטמון (caching).

הביצוע הטכני של אסטרטגיה זו נשען רבות על "context engineering". על ידי עידוד מפתחים לשמור על הקשר (context) רזה ועל פתיחת סשנים חדשים למשימות חדשות, Coinbase הצליחה להעלות את שיעור ה-caching hit rate שלה מ-5% בלבד ל-60%. יעילות זו מאפשרת לחברה למנף מודלים זולים יותר למשימות שגרתיות, תוך שמירה על מודלים בעלי יכולת הסקה (reasoning) גבוהה למשימות מורכבות – טכניקה שהופכת לתוכנית עבודה (blueprint) להרחבת תהליכי עבודה מבוססי סוכנים (agentic workflows).

Tokenmaxxing פוגש אחריותיות ביצועים

עלייתם של מודלים בעלי "agentic reasoning" — כמו סדרת GPT-5.x המצופה — הובילה לזינוק בצריכת טוקנים. בעוד שחברות כמו Amazon ו-Meta ראו מגמה של "tokenmaxxing", שבה עובדים צורכים כמויות עצומות של טוקנים ללא פיקוח הדוק, Coinbase מיישמת פילוסופיה שונה.

ארמסטרונג הציג מודל של שקיפות ללא הגבלה: למפתחים אין מכסה על השימוש, אך ההוצאות שלהם שקופות. העיקרון המנחה הוא "אחריותיות מבוססת אימפקט" (impact-based accountability) — ככל שמפתח מוציא יותר על טוקנים של AI, כך התוצר הצפוי והאימפקט העסקי חייבים להיות גבוהים יותר. גישה זו מאזנת בין הצורך בכוח מחשוב רב לבין הצורך בהחזר השקעה (ROI).

מבחן עמידות במחיר עבור מעבדות מערביות

הנטישה לעבר חלופות סיניות זולות יותר מפעילה לחץ עצום על מעבדות AI מערביות, במיוחד כאשר חברות כמו OpenAI ו-Anthropic שואפות לצאת להנפקה (IPO) וצריכות להוכיח צמיחה בת-קיימא. מלחמת מחירים מתגבשת כבר כעת; על פי הדיווחים, OpenAI משיבה לתחרות על ידי הצעת גרסאות יעילות יותר מבחינת טוקנים, כגון GPT-5.6-Sol, ומודלים קלים יותר במחיר נמוך יותר. עבור ספקים מערביים, האתגר אינו רק עניין של אינטליגנציה, אלא שמירה על נקודת מחיר שתמנע מלקוחות ארגוניים לעבור למתחרים גלובליים חסכוניים יותר.

נקודות מרכזיות

אופטימיזציה של עלויות: Coinbase קיצצה את הוצאות ה-AI שלה בחצי על ידי שילוב מודלים סיניים כמו GLM 5.2 ו-Kimi 2.7, תוך הגדלת השימוש הכולל בטוקנים.
יעילות טכנית: הטמעת ניתוב אוטומטי והנדסת הקשר (context engineering) אפשרה ל-Coinbase להעלות את שיעורי ה-caching hit rate מ-5% ל-60%.
לחץ שוק: המעבר למודלים זולים יותר מאלץ מעבדות מערביות להיכנס למלחמת מחירים כדי להצדיק את השווי הגבוה שלהן ואת סיכויי ההנפקה (IPO) הקרובים.

Coinbase Shifts to Chinese AI Models to Slash API Costs

Coinbase עוברת למודלי AI סיניים כדי לקצץ בעלויות ה-API

המעבר למודלים סיניים: GLM ו-Kimi

ניתוב חכם והנדסת הקשר (Context Engineering)

Tokenmaxxing פוגש אחריותיות ביצועים

מבחן עמידות במחיר עבור מעבדות מערביות

נקודות מרכזיות

Continue reading

Snowflake CEO: GLM 5.2 Rivals Claude Opus 4.7 at a Fraction of the Cost

מ-Tokenmaxxing ועד הקצבה: משבר עלויות ה-AI בתאגידים

פריצת הדרך של סין בתחום ה-AI: כלי אבטחת סייבר חדשים המתחרים בטכנולוגיה האמריקאית