𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Translated for your language. Original lesen.

AI-assisted draft.

vor 3 Wochen1Min. Lesezeit

Stoppen Sie LLM-Kostenanstiege vor der Abrechnung

Sie nutzen OTel und OpenInference. Sie sehen die Token-Anzahl. Sie sehen jedoch nicht, welches Team Geld ausgibt.

Nutzen Sie diese drei Attribute.

team.id: Taggen Sie Spans am Gateway. Dies zeigt die Kosten pro Team.
feature.id: Taggen Sie das Feature. Dies zeigt, welches Feature die Kosten in die Höhe treibt.
llm.model: Trennen Sie günstige Modelle von teuren Modellen.

Führen Sie eine tägliche Abfrage in Grafana aus. Betrachten Sie das 95. Perzentil der Output-Token. Gruppieren Sie nach Team, Feature und Modell.

Richten Sie einen Alert für einen 2-fachen Anstieg des 7-Tage-Durchschnitts ein. Dies hat im letzten Quartal eine Retry-Schleife erkannt. Das Haupt-Dashboard hat sie übersehen. Die Gesamtausgaben blieben unter dem Budget. Ein Team hat das Doppelte ausgegeben.

Lassen Sie user.id aus Datenschutzgründen weg. Lassen Sie request.id weg, um die Datenmenge gering zu halten.

Quelle: https://dev.to/jasmine_park_dev/span-attributes-that-catch-llm-cost-regressions-before-billing-does-472n Optionale Lern-Community: https://t.me/GyaanSetuAi

𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Weiterlesen

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

Kostenoptimierung für LLM-Systeme

Warum KI-Kosten außer Kontrolle geraten und wie man sie bändigt

Wie ich unsere KI-API-Kosten halbiert habe und dabei p99-SLAs einhielt

𝟳 𝗪𝗮𝘆𝘀 𝘁𝗼 𝗥𝗲𝗱𝘂𝗰𝗲 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗕𝗶𝗹𝗹