𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Translated for your language. Leggi l'originale.

AI-assisted draft.

3 settimane fa1min di lettura

Stop i picchi di costo degli LLM prima della fatturazione

Usi OTel e OpenInference. Vedi il conteggio dei token. Non vedi quale team sta spendendo denaro.

Usa questi tre attributi.

team.id: Tagga gli span al gateway. Questo mostra il costo per team.
feature.id: Tagga la feature. Questo mostra quale feature causa i picchi.
llm.model: Separa i modelli economici da quelli costosi.

Esegui una query giornaliera in Grafana. Controlla il 95° percentile dei token di output. Raggruppa per team, feature e modello.

Imposta un alert per un salto di 2x nella media a 7 giorni. Questo ha permesso di individuare un loop di retry lo scorso trimestre. La dashboard principale non l'aveva rilevato. La spesa totale è rimasta sotto budget. Un singolo team ha speso il doppio.

Salta user.id per motivi di privacy. Salta request.id per mantenere i dati leggeri.

Fonte: https://dev.to/jasmine_park_dev/span-attributes-that-catch-llm-cost-regressions-before-billing-does-472n Community di apprendimento opzionale: https://t.me/GyaanSetuAi

𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Continua a leggere

Perché i tuoi agenti stanno bruciando token

Ottimizzazione dei costi per i sistemi LLM

𝗪𝗵𝘆 𝗔𝗜 𝗖𝗼𝘀𝘁𝘀 𝗦𝗽𝗶𝗿𝗮𝗹 𝗔𝗻𝗱 𝗛𝗼𝘄 𝗧𝗼 𝗖𝗼𝗻𝘁𝗿𝗼𝗹 𝗧𝗵𝗲𝗺

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗢𝘂𝗿 𝗔𝗜 𝗔𝗣𝗜 𝗕𝗶𝗹𝗹 𝗶𝗻 𝗛𝗮𝗹𝗳 𝗪𝗵𝗶𝗹𝗲 𝗛𝗶𝘁𝘁𝗶𝗻𝗴 𝗽𝟵𝟵 𝗦𝗟𝗔𝘀

𝟳 𝗪𝗮𝘆𝘀 𝘁𝗼 𝗥𝗲𝗱𝘂𝗰𝗲 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗕𝗶𝗹𝗹