Lindy thay thế Claude bằng DeepSeek để tiết kiệm hàng triệu USD chi phí AI

Khi kỷ nguyên của các hệ thống AI tác nhân (agentic AI) bắt đầu tiêu tốn một lượng token khổng lồ, các startup đang phải đối mặt với một thực tế tàn khốc: chi phí cho trí tuệ có thể nhanh chóng vượt xa doanh thu. Startup AI Lindy đã có một bước đi quyết đoán để tồn tại trước áp lực kinh tế này bằng cách từ bỏ hoàn toàn Claude của Anthropic để chuyển sang sử dụng DeepSeek.

Chi phí không thể duy trì của các mô hình tiên phong

Đối với nhiều startup AI đang tăng trưởng nhanh, chi phí vận hành các mô hình ngôn ngữ lớn (LLM) đã trở thành mối đe dọa chính đối với khả năng thanh toán. Lindy, một đội ngũ tinh gọn chỉ với 25 nhân viên, đã rơi vào tình cảnh mà chi phí tính toán AI thực tế còn vượt quá cả chi phí nhân sự. CEO Flo Crivello gần đây đã tiết lộ với CNBC rằng những chi phí này đã trở nên "không thể duy trì," đe dọa đến sự sống còn của doanh nghiệp.

Để đối phó với điều này, Lindy đã thực hiện một bước chuyển hướng (pivot) lớn, từ bỏ hoàn toàn hệ sinh thái Claude. Bằng cách chuyển sang DeepSeek—vốn được lưu trữ bởi một công ty có trụ sở tại Mỹ trên đất Mỹ để giảm thiểu các lo ngại về địa chính trị—startup này đã thấy đường cong chi phí của mình "lao dốc không phanh," giúp tiết kiệm hàng triệu đô la.

Sự trỗi dậy của hiệu quả giữa giá thành và hiệu suất

Bước đi của Lindy phản ánh một sự chuyển dịch rộng lớn hơn trong ngành hướng tới việc tối ưu hóa "giá thành trên hiệu suất" (price-performance) thay vì chỉ tập trung vào khả năng thuần túy của mô hình. Mặc dù các mô hình tiên phong như Claude và GPT-4 đại diện cho tiêu chuẩn vàng về khả năng lập luận, chúng đi kèm với mức giá cao ngất ngưởng mà các startup đang trong giai đoạn mở rộng quy mô khó có thể duy trì.

Các chuyên gia trong ngành đang bắt đầu xác nhận sự chuyển dịch này. Một phân tích gần đây của CTO tại Snowflake lưu ý rằng mặc dù một số mô hình Trung Quốc, chẳng hạn như GLM-5.2, có thể không vượt trội hoàn toàn so với Claude trong mọi bài kiểm tra (benchmark), nhưng chúng có tính cạnh tranh rất cao và thường chiến thắng về tỷ lệ giá thành trên hiệu suất cho các tác vụ cụ thể. Khi các công ty tiến tới các quy trình làm việc dạng tác nhân (agentic workflows)—nơi các tác nhân AI thực hiện các nhiệm vụ đa bước một cách tự chủ—lượng token khổng lồ cần thiết sẽ biến các mô hình chi phí cao thành một gánh nặng thay vì là một tài sản.

Tác động đối với bối cảnh AI và Anthropic

Sự phát triển này đóng vai trò như một hồi chuông cảnh báo cho các nhà cung cấp mô hình như Anthropic. Như Sam Altman của OpenAI đã thừa nhận, việc chuyển đổi sang các hệ thống tác nhân đang khiến chi phí AI trở thành một "vấn đề lớn" đối với các doanh nghiệp. Nếu các nhà cung cấp mô hình tiên phong không giải quyết cấu trúc giá của họ, họ có nguy cơ mất thị phần đáng kể vào tay các lựa chọn thay thế hiệu quả hơn, chuyên biệt hơn hoặc có giá cả phải chăng hơn.

Crivello lưu ý rằng quyết định sử dụng DeepSeek không nhất thiết là vĩnh viễn; ông cho biết sẽ quay lại với Anthropic nếu công ty này giảm giá đáng kể. Hiện tại, ưu tiên của Lindy và các startup tương tự là sự sống còn trong vận hành tại một thị trường nơi chi phí cho trí tuệ đang trở thành trụ cột trung tâm của chiến lược kinh doanh.

Các điểm chính cần lưu ý

  • Di cư do áp lực chi phí: Các startup AI như Lindy đang chuyển dịch từ các mô hình cao cấp như Claude sang các lựa chọn thay thế hợp túi tiền hơn như DeepSeek để ngăn chặn chi phí tính toán vượt quá chi phí nhân sự.
  • Sự khan hiếm token trong kỷ nguyên tác nhân: Sự trỗi dậy của các hệ thống AI tác nhân, vốn đòi hỏi mức tiêu thụ token khổng lồ, đang thúc đẩy nhu cầu tăng vọt về hiệu quả giữa giá thành và hiệu suất.
  • Áp lực thị trường lên các nhà cung cấp: Các công ty mô hình tiên phong đang đối mặt với áp lực ngày càng tăng trong việc hạ giá thành khi các nhà phát triển ưu tiên tính kinh tế trên mỗi đơn vị (unit economics) bền vững hơn là hiệu suất đỉnh cao tuyệt đối.