Từ Tokenmaxxing đến Định mức: Cuộc khủng hoảng chi phí AI trong doanh nghiệp
Cơn sốt "tokenmaxxing" ban đầu — giai đoạn mà các doanh nghiệp khuyến khích sử dụng AI không giới hạn để thúc đẩy việc áp dụng — đang nhanh chóng va chạm với thực tế khắc nghiệt về chi phí vận hành. Khi các công ty chuyển từ giai đoạn thử nghiệm sang mở rộng quy mô, một cuộc đấu tranh mới đang nảy sinh: làm thế nào để ngăn chặn các ngân sách AI khổng lồ bị tiêu tốn vào những tác vụ vụn vặt, giá trị thấp.
Sự trỗi dậy của việc định mức token
Đầu năm nay, câu chuyện trong thế giới doanh nghiệp tập trung vào việc tối đa hóa sự tích hợp AI. Một số tổ chức thậm chí còn triển khai các bảng xếp hạng nội bộ để "trò chơi hóa" và khen thưởng nhân viên dựa trên mức độ sử dụng AI của họ. Tuy nhiên, sự nhiệt huyết không kiểm soát này đã dẫn đến một hiện tượng mà ở đó, việc chi tiêu không thể dự đoán trước đang bào mòn biên lợi nhuận.
Giờ đây, chúng ta đang chứng kiến kỷ nguyên của "định mức token" (token rationing). Thay vì khuyến khích nhân viên sử dụng các Mô hình Ngôn ngữ Lớn (LLMs) cho mọi tác vụ có thể, ban lãnh đạo đang bắt đầu triển khai các biện pháp kiểm soát nghiêm ngặt. Mục tiêu là chuyển đổi từ việc sử dụng rộng rãi, thiếu kiểm soát sang một mô hình kỷ luật, nơi AI chỉ được áp dụng cho các quy trình làm việc có tác động cao và giá trị lớn.
Trường hợp của Accenture: Rủi ro lớn và những tác vụ nhỏ
Một ví dụ điển hình cho sự chuyển dịch này được thấy tại gã khổng lồ tư vấn toàn cầu Accenture. Theo đoạn âm thanh bị rò rỉ từ một cuộc họp nội bộ do Justice Kwak, trưởng bộ phận chiến lược agentic AI của Accenture, dẫn dắt, công ty đang tích cực làm việc để ngăn nhân viên làm cạn kiệt nguồn dự trữ token vào các tác vụ hành chính cơ bản.
Báo cáo làm nổi bật một sự mâu thuẫn đáng kinh ngạc: trong khi trước đây Accenture từng ra tín hiệu rằng nhân viên có thể "đối mặt với rủi ro mất cơ hội thăng tiến" nếu không áp dụng AI, thì hiện tại họ đang chuyển hướng sang việc hạn chế sử dụng. Cụ thể, công ty đang cố gắng ngăn nhân viên sử dụng năng lực tính toán AI đắt đỏ cho các tác vụ nhỏ, chẳng hạn như chuyển đổi tệp PDF thành các trang trình chiếu.
Kwak lưu ý rằng AI đang chạm đến một "điểm uốn" (inflection point), nơi nó trở thành một thành phần trọng yếu trong cấu trúc chi phí của doanh nghiệp. Khi chi tiêu ngày càng trở nên khó dự đoán, các CFO, COO và CIO đang yêu cầu bằng chứng rõ ràng về Tỷ suất hoàn vốn (ROI) trước khi phê duyệt thêm các khoản chi tiêu tiếp theo.
Chứng minh giá trị trong kỷ nguyên hậu kỳ vọng ảo
Sự chuyển dịch này phản ánh một xu hướng rộng lớn hơn trong ngành AI, thường được gọi là "làn sóng bán tháo AI" (AI selloff). Thị trường không còn hài lòng với sự mới lạ của các khả năng tạo sinh; thay vào đó, thị trường đang đòi hỏi những cải thiện năng suất hữu hình, đủ để bù đắp cho chi phí khổng lồ về tính toán và tiêu thụ token.
Áp lực kinh tế này đang tác động đặc biệt đến các lĩnh vực phụ thuộc vào AI, bao gồm cả các nhà sản xuất chip nhớ, khi ngành công nghiệp này chuyển dịch từ việc chỉ dựa vào sự thổi phồng sang trách nhiệm giải trình về tài chính. Để mô hình kinh doanh AI có thể duy trì tính bền vững, trọng tâm phải chuyển từ việc sử dụng AI bao nhiêu sang việc các token đó được triển khai hiệu quả như thế nào để giải quyết các vấn đề phức tạp.
Các điểm chính cần lưu ý
- Thay đổi chiến lược: Các công ty đang chuyển từ "tokenmaxxing" (sử dụng không giới hạn) sang "định mức token" để quản lý các chi phí vận hành không thể dự đoán.
- Yêu cầu về ROI: Các đội ngũ lãnh đạo, bao gồm cả CFO và CIO, đang yêu cầu chứng minh giá trị, vượt qua sự hào hứng ban đầu của việc áp dụng AI.
- Chi phí so với Tiện ích: Một điểm xung đột lớn đang nảy sinh khi các token LLM đắt đỏ đang bị lãng phí vào các tác vụ giá trị thấp như định dạng PDF, thay vì các quy trình làm việc dạng tác nhân (agentic workflows) có tác động cao.
