Od tokenmaxxing do racjonowania: Kryzys kosztów AI w korporacjach

Początkowe szaleństwo „tokenmaxxing” – kiedy przedsiębiorstwa zachęcały do nieograniczonego korzystania z AI, aby stymulować jej adopcję – szybko zderza się z brutalną rzeczywistością kosztów operacyjnych. W miarę jak firmy przechodzą od eksperymentowania do skalowania, pojawia się nowy problem: jak zapobiec wyczerpywaniu ogromnych budżetów na AI przez mało wartościowe, błahe zadania.

Wzrost znaczenia racjonowania tokenów

Na początku tego roku narracja w świecie korporacyjnym koncentrowała się na maksymalizacji integracji AI. Niektóre organizacje wprowadzały nawet wewnętrzne rankingi, aby grywalizować i nagradzać pracowników za korzystanie ze sztucznej inteligencji. Jednak ten niepohamowany entuzjazm doprowadził do zjawiska, w którym nieprzewidywalne wydatki erodują marże zysku.

Jesteśmy teraz świadkami ery „racjonowania tokenów”. Zamiast zachęcać pracowników do używania dużych modeli językowych (LLM) do każdego możliwego zadania, kierownictwo zaczyna wprowadzać surowe kontrole. Celem jest przejście od szerokiego, niekontrolowanego użytkowania do zdyscyplinowanego modelu, w którym AI jest stosowana wyłącznie w procesach o wysokiej wartości i znaczeniu.

Przypadek Accenture: Wysoka stawka i drobne zadania

Wyrazistym przykładem tej zmiany jest globalny gigant doradczy Accenture. Według wycieku nagrania z wewnętrznego spotkania prowadzonego przez Justice Kwaka, lidera strategii agentycznej AI w Accenture, firma aktywnie pracuje nad tym, aby pracownicy nie wyczerpywali rezerw tokenów na podstawowe zadania administracyjne.

Raport podkreśla uderzającą sprzeczność: podczas gdy Accenture sygnalizowało wcześniej, że pracownicy mogą „ryzykować utratę szans na awans”, jeśli nie zaadoptują AI, obecnie zmienia kurs, aby ograniczyć jej zużycie. Konkretnie, firma próbuje powstrzymać pracowników przed wykorzystywaniem kosztownych zasobów obliczeniowych AI do drobnych zadań, takich jak konwertowanie plików PDF na slajdy prezentacji.

Kwak zauważył, że AI osiąga „punkt zwrotny”, w którym staje się istotnym elementem struktury kosztów korporacyjnych. Ponieważ wydatki stają się coraz bardziej nieprzewidywalne, dyrektorzy finansowi (CFO), operacyjni (COO) i informatyczni (CIO) domagają się jasnych dowodów na zwrot z inwestycji (ROI) przed zatwierdzeniem dalszych nakładów.

Dowodzenie wartości w erze post-hype

Ta zmiana odzwierciedla szerszy trend w branży AI, często określany jako „wyprzedaż AI” (AI selloff). Rynek nie jest już zadowolony z samej nowości możliwości generatywnych; domaga się namacalnych zysków z produktywności, które zrównoważą ogromne koszty obliczeń i zużycia tokenów.

Presja ekonomiczna uderza szczególnie w sektory zależne od AI, w tym producentów układów pamięci, w miarę jak branża odchodzi od czystego hype'u w stronę odpowiedzialności fiskalnej. Aby model biznesowy AI pozostał zrównoważony, uwaga musi przesunąć się z tego, ile AI jest używane, na to, jak efektywnie te tokeny są wykorzystywane do rozwiązywania złożonych problemów.

Kluczowe wnioski

  • Zmiana strategii: Firmy odchodzą od „tokenmaxxing” (nieograniczonego użytkowania) na rzecz „racjonowania tokenów”, aby zarządzać nieprzewidywalnymi kosztami operacyjnymi.
  • Mandat ROI: Zespoły zarządzające, w tym CFO i CIO, wymagają dowodów wartości, wykraczając poza początkową ekscytację adopcją AI.
  • Koszt a użyteczność: Pojawia się główny punkt tarcia, w którym drogie tokeny LLM są marnowane na mało wartościowe zadania, takie jak formatowanie PDF, zamiast na wysokowartościowe procesy agentyczne.