API ವೆಚ್ಚವನ್ನು ಕಡಿಮೆ ಮಾಡಲು Coinbase ಚೀನೀ AI ಮಾದರಿಗಳತ್ತ ಬದಲಾವಣೆ

ಪಾಶ್ಚಿಮಾತ್ಯ AI ಪ್ರಯೋಗಾಲಯಗಳು ಬೃಹತ್ ಕಂಪ್ಯೂಟ್ ವೆಚ್ಚ ಮತ್ತು ಲಾಭದಾಯಕತೆಯ ನಡುವೆ ಸಮತೋಲನವನ್ನು ಕಾಯ್ದುಕೊಳ್ಳಲು ಹೆಣಗಾಡುತ್ತಿರುವಾಗ, ಉದ್ಯಮದ ಮುಂಚೂಣಿಯಲ್ಲಿರುವವರು ದಕ್ಷತೆಗಾಗಿ ಪೂರ್ವದ ದೇಶಗಳತ್ತ ನೋಡಲು ಪ್ರಾರಂಭಿಸಿದ್ದಾರೆ. ತಮ್ಮ ಕಾರ್ಯಾಚರಣೆಯ ವೆಚ್ಚಗಳನ್ನು ಉತ್ತಮಗೊಳಿಸಲು ಚೀನೀ AI ಮಾದರಿಗಳತ್ತ ತಿರುಗುತ್ತಿರುವ ತಂತ್ರಜ್ಞಾನದ ದೈತ್ಯ ಕಂಪನಿಗಳ ಗುಂಪನ್ನು Coinbase ಅಧಿಕೃತವಾಗಿ ಸೇರಿಕೊಂಡಿದೆ.

ಚೀನೀ ಮಾದರಿಗಳತ್ತ ಬದಲಾವಣೆ: GLM ಮತ್ತು Kimi

Coinbase CEO Brian Armstrong ಅವರು ಇತ್ತೀಚೆಗೆ ಕಂಪನಿಯು ತನ್ನ ಮೂಲಸೌಕರ್ಯದಲ್ಲಿ GLM 5.2 ಮತ್ತು Kimi 2.7 ನಂತಹ ಚೀನಾ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ಮಾದರಿಗಳನ್ನು ಸಂಯೋಜಿಸಿದೆ ಎಂದು ಬಹಿರಂಗಪಡಿಸಿದ್ದಾರೆ. ಈ ಕಾರ್ಯತಂತ್ರದ ಬದಲಾವಣೆಯು Coinbase ಗೆ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಟೋಕನ್ ವಾಲ್ಯೂಮ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತಲೇ, ಅದರ AI ವೆಚ್ಚವನ್ನು ಅರ್ಧದಷ್ಟು ಕಡಿಮೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡಿದೆ.

ಈ ಕ್ರಮವು ಕೇವಲ ಕ್ರಿಪ್ಟೋ ವಲಯಕ್ಕೆ ಸೀಮಿತವಾಗಿಲ್ಲ. Lindy ಎಂಬ ಸ್ಟಾರ್ಟ್‌ಅಪ್ DeepSeek v4 ಗೆ ಬದಲಾಗಿದೆ ಮತ್ತು ದತ್ತಾಂಶ ದೈತ್ಯ Snowflake ಪ್ರಸ್ತುತ OpenAI ಮತ್ತು Anthropic ನ ಹೆಚ್ಚಿನ ಬೆಲೆಯ ಸೇವೆಗಳಿಗೆ ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿ ಪರ್ಯಾಯಗಳಾಗಿ ಚೀನೀ ಮಾದರಿಗಳನ್ನು ಪರೀಕ್ಷಿಸುತ್ತಿದೆ. ಈ ಬದಲಾವಣೆಯು ಉದ್ಯಮಗಳು AI ನ "frontier" ಅನ್ನು ಹೇಗೆ ನೋಡುತ್ತವೆ ಎಂಬುದರಲ್ಲಿ ದೊಡ್ಡ ಬದಲಾವಣೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ; ಅಂದರೆ ಬ್ರ್ಯಾಂಡ್ ಪರಿಚಯಕ್ಕಿಂತ ಬೆಲೆ ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆಯ ಅನುಪಾತಕ್ಕೆ (price-to-performance ratio) ಹೆಚ್ಚಿನ ಆದ್ಯತೆ ನೀಡಲಾಗುತ್ತಿದೆ.

Intelligent Routing ಮತ್ತು Context Engineering

ಈ ಉಳಿತಾಯವನ್ನು ಗರಿಷ್ಠಗೊಳಿಸಲು, Coinbase ಸ್ವಯಂಚಾಲಿತ ರೂಟಿಂಗ್ ವ್ಯವಸ್ಥೆಯನ್ನು ಜಾರಿಗೆ ತಂದಿದೆ. ಒಂದೇ LLM ಮೇಲೆ ಅವಲಂಬಿತವಾಗುವ ಬದಲು, ಈ ವ್ಯವಸ್ಥೆಯು ಪ್ರತಿಯೊಂದು ವಿನಂತಿಯನ್ನು ಮೂರು ಪ್ರಮುಖ ಮಾನದಂಡಗಳ ಆಧಾರದ ಮೇಲೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ: ಕಾರ್ಯದ ಸಂಕೀರ್ಣತೆ, ವೆಚ್ಚ ಮತ್ತು caching ಸಾಮರ್ಥ್ಯ.

ಈ ಕಾರ್ಯತಂತ್ರದ ತಾಂತ್ರಿಕ ಅನುಷ್ಠಾನವು "context engineering" ಮೇಲೆ ಹೆಚ್ಚು ಅವಲಂಬಿತವಾಗಿದೆ. ಡೆವಲಪರ್‌ಗಳು context ಅನ್ನು ಕಡಿಮೆ ಇರಿಸಲು ಮತ್ತು ಹೊಸ ಕಾರ್ಯಗಳಿಗಾಗಿ ಹೊಸ ಸೆಷನ್‌ಗಳನ್ನು ಪ್ರಾರಂಭಿಸಲು ಪ್ರೋತ್ಸಾಹಿಸುವ ಮೂಲಕ, Coinbase ತನ್ನ caching hit rate ಅನ್ನು ಕೇವಲ 5% ರಿಂದ 60% ಕ್ಕೆ ಯಶಸ್ವಿಯಾಗಿ ಹೆಚ್ಚಿಸಿದೆ. ಈ ದಕ್ಷತೆಯು ಕಂಪನಿಯು ದೈನಂದಿನ ಕಾರ್ಯಗಳಿಗಾಗಿ ಅಗ್ಗದ ಮಾದರಿಗಳನ್ನು ಬಳಸಲು ಮತ್ತು ಸಂಕೀರ್ಣ ಕಾರ್ಯಾಚರಣೆಗಳಿಗಾಗಿ ಹೆಚ್ಚಿನ reasoning ಮಾದರಿಗಳನ್ನು ಮೀಸಲಿಡಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ; ಈ ತಂತ್ರವು agentic workflows ವಿಸ್ತರಿಸಲು ಒಂದು ನೀಲನಕ್ಷೆಯಾಗುತ್ತಿದೆ.

Tokenmaxxing ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆಯ ಹೊಣೆಗಾರಿಕೆ

"agentic reasoning" ಮಾದರಿಗಳ ಉದಯವು—ಉದಾಹರಣೆಗೆ ನಿರೀಕ್ಷಿತ GPT-5.x ಸರಣಿ—ಟೋಕನ್ ಬಳಕೆಯಲ್ಲಿ ಭಾರಿ ಏರಿಕೆಗೆ ಕಾರಣವಾಗಿದೆ. Amazon ಮತ್ತು Meta ನಂತಹ ಕಂಪನಿಗಳಲ್ಲಿ "tokenmaxxing" ಎಂಬ ಪ್ರವೃತ್ತಿ ಕಂಡುಬಂದಿದೆ, ಅಂದರೆ ಉದ್ಯೋಗಿಗಳು ಕಟ್ಟುನಿಟ್ಟಿನ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದೆ ಅಪಾರ ಪ್ರಮಾಣದ ಟೋಕನ್‌ಗಳನ್ನು ಬಳಸುತ್ತಾರೆ. ಆದರೆ Coinbase ವಿಭಿನ್ನ ತತ್ವಶಾಸ್ತ್ರವನ್ನು ಜಾರಿಗೆ ತರುತ್ತಿದೆ.

Armstrong ಅವರು ನಿರ್ಬಂಧವಿಲ್ಲದ ದೃಶ್ಯೀಕರಣದ (visibility without restriction) ಮಾದರಿಯನ್ನು ಪರಿಚಯಿಸಿದ್ದಾರೆ: ಡೆವಲಪರ್‌ಗಳ ಬಳಕೆಗೆ ಮಿತಿ ಇಲ್ಲ, ಆದರೆ ಅವರ ವೆಚ್ಚವು ಪಾರದರ್ಶಕವಾಗಿರುತ್ತದೆ. ಇದರ ಮಾರ್ಗದರ್ಶಿ ತತ್ವವೆಂದರೆ "impact-based accountability"—ಒಬ್ಬ ಡೆವಲಪರ್ AI ಟೋಕನ್‌ಗಳ ಮೇಲೆ ಎಷ್ಟು ಹೆಚ್ಚು ಖರ್ಚು ಮಾಡುತ್ತಾರೋ, ಅಷ್ಟೇ ಹೆಚ್ಚಿನ ನಿರೀಕ್ಷಿತ ಔಟ್‌ಪುಟ್ ಮತ್ತು ವ್ಯವಹಾರದ ಪ್ರಭಾವ ಇರಬೇಕು. ಈ ವಿಧಾನವು ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟ್ ಅಗತ್ಯತೆ ಮತ್ತು ROI ನಡುವೆ ಸಮತೋಲನವನ್ನು ಕಾಯ್ದುಕೊಳ್ಳುತ್ತದೆ.

ಪಾಶ್ಚಿಮಾತ್ಯ ಪ್ರಯೋಗಾಲಯಗಳಿಗೆ ಬೆಲೆ ಪರೀಕ್ಷೆ

ಅಗ್ಗದ ಚೀನೀ ಪರ್ಯಾಯಗಳತ್ತ ವಲಸೆ ಹೋಗುತ್ತಿರುವುದು ಪಾಶ್ಚಿಮಾತ್ಯ AI ಪ್ರಯೋಗಾಲಯಗಳ ಮೇಲೆ ಭಾರಿ ಒತ್ತಡವನ್ನು ಹೇರುತ್ತಿದೆ, ವಿಶೇಷವಾಗಿ OpenAI ಮತ್ತು Anthropic ನಂತಹ ಕಂಪನಿಗಳು IPO ಗಳತ್ತ ಕಣ್ಣಿಟ್ಟಿದ್ದು, ಸುಸ್ಥಿರ ಬೆಳವಣಿಗೆಯನ್ನು ಸಾಬೀತುಪಡಿಸಬೇಕಾದ ಅಗತ್ಯವಿರುವಾಗ ಇದು ಸಂಭವಿಸಿದೆ. ಬೆಲೆ ಯುದ್ಧವು ಈಗಾಗಲೇ ಸ್ಪಷ್ಟವಾಗಿ ಕಾಣಿಸುತ್ತಿದೆ; OpenAI ತನ್ನ ಸ್ಪರ್ಧೆಯನ್ನು ಎದುರಿಸಲು GPT-5.6-Sol ನಂತಹ ಹೆಚ್ಚು token-efficient ರೂಪಾಂತರಗಳು ಮತ್ತು ಕಡಿಮೆ ಬೆಲೆಯ, ಹಗುರವಾದ ಮಾದರಿಗಳನ್ನು ನೀಡುತ್ತಿದೆ ಎಂದು ವರದಿಯಾಗಿದೆ. ಪಾಶ್ಚಿಮಾತ್ಯ ಪೂರೈಕೆದಾರರಿಗೆ ಸವಾಲು ಈಗ ಕೇವಲ ಬುದ್ಧಿವಂತಿಕೆಯ ಬಗ್ಗೆ ಮಾತ್ರವಲ್ಲ, ಬದಲಾಗಿ ಉದ್ಯಮದ ಗ್ರಾಹಕರು ಹೆಚ್ಚು ಆರ್ಥಿಕವಾಗಿರುವ ಜಾಗತಿಕ ಸ್ಪರ್ಧಿಗಳತ್ತ ವಲಸೆ ಹೋಗದಂತೆ ತಡೆಯಲು ಬೆಲೆಯನ್ನು ನಿರ್ವಹಿಸುವುದರ ಮೇಲೂ ಇದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

  • ವೆಚ್ಚದ ಆಪ್ಟಿಮೈಸೇಶನ್: Coinbase ತನ್ನ ಒಟ್ಟು ಟೋಕನ್ ಬಳಕೆಯನ್ನು ಹೆಚ್ಚಿಸುವ ಜೊತೆಗೆ GLM 5.2 ಮತ್ತು Kimi 2.7 ನಂತಹ ಚೀನೀ ಮಾದರಿಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಮೂಲಕ ತನ್ನ AI ವೆಚ್ಚವನ್ನು ಅರ್ಧದಷ್ಟು ಕಡಿಮೆ ಮಾಡಿದೆ.
  • ತಾಂತ್ರಿಕ ದಕ್ಷತೆ: ಸ್ವಯಂಚಾಲಿತ ರೂಟಿಂಗ್ ಮತ್ತು context engineering ಅನ್ನು ಜಾರಿಗೆ ತರುವ ಮೂಲಕ Coinbase ತನ್ನ caching hit rate ಅನ್ನು 5% ರಿಂದ 60% ಕ್ಕೆ ಹೆಚ್ಚಿಸಲು ಸಾಧ್ಯವಾಗಿದೆ.
  • ಮಾರುಕಟ್ಟೆ ಒತ್ತಡ: ಅಗ್ಗದ ಮಾದರಿಗಳತ್ತ ಬದಲಾಗುತ್ತಿರುವುದು ಪಾಶ್ಚಿಮಾತ್ಯ ಪ್ರಯೋಗಾಲಯಗಳನ್ನು ತಮ್ಮ ಹೆಚ್ಚಿನ ಮೌಲ್ಯಮಾಪನ ಮತ್ತು ಮುಂಬರುವ IPO ಸಾಧ್ಯತೆಗಳನ್ನು ಸಮರ್ಥಿಸಿಕೊಳ್ಳಲು ಬೆಲೆ ಯುದ್ಧಕ್ಕೆ ತಳ್ಳುತ್ತಿದೆ.