𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Translated for your language. Read the original.

AI-assisted draft.

3 வாரங்களுக்கு முன்1min read

பில்லிங் செய்வதற்கு முன்பே LLM செலவு அதிகரிப்பதைத் தடுத்தல்

நீங்கள் OTel மற்றும் OpenInference பயன்படுத்துகிறீர்கள். நீங்கள் டோக்கன் எண்ணிக்கையைப் பார்க்கிறீர்கள். ஆனால் எந்தக் குழு பணத்தைச் செலவிடுகிறது என்பதைப் பார்க்க முடிவதில்லை.

இந்த மூன்று பண்புகளைப் (attributes) பயன்படுத்துங்கள்.

team.id: கேட்வேயில் (gateway) spans-களைக் குறியிடுங்கள் (Tag). இது குழு வாரியான செலவைக் காட்டும்.
feature.id: அம்சத்தைக் (feature) குறியிடுங்கள். எந்த அம்சம் செலவை அதிகரிக்கிறது என்பதைக் காட்டும்.
llm.model: மலிவான மாடல்களையும் விலையுயர்ந்த மாடல்களையும் தனித்தனியாகப் பிரிக்கலாம்.

Grafana-வில் தினமும் ஒரு வினவலை (query) இயக்கவும். அவுட்புட் டோக்கன்களின் (output tokens) 95வது சதவீதத்தைப் (95th percentile) பார்க்கவும். குழு, அம்சம் மற்றும் மாடல் வாரியாகப் பிரிக்கவும் (Group).

7 நாள் சராசரியில் 2 மடங்கு உயர்வு ஏற்பட்டால் ஒரு எச்சரிக்கையை (alert) அமைக்கவும். கடந்த காலாண்டில் ஒரு 'retry loop' சிக்கலை இது கண்டறிந்தது. முக்கிய டேஷ்போர்டு (dashboard) அதைத் தவறவிட்டது. மொத்தச் செலவு பட்ஜெட்டிற்குள் இருந்தது, ஆனால் ஒரு குழு மட்டும் இரண்டு மடங்கு அதிகமாகச் செலவிட்டது.

தனியுரிமைக்காக (privacy) user.id-ஐத் தவிர்க்கவும். தரவின் அளவைக் குறைக்க request.id-ஐத் தவிர்க்கவும்.

Source: https://dev.to/jasmine_park_dev/span-attributes-that-catch-llm-cost-regressions-before-billing-does-472n Optional learning community: https://t.me/GyaanSetuAi

𝗦𝘁𝗼𝗽 𝗟𝗟𝗠 𝗖𝗼𝘀𝘁 𝗦𝗽𝗶𝗸𝗲𝘀 𝗕𝗲𝗳𝗼𝗿𝗲 𝗕𝗶𝗹𝗹𝗶𝗻𝗴

Continue reading

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

𝗖𝗼𝘀𝘁 𝗢𝗽𝘁𝗶𝗺𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

AI செலவுகள் ஏன் கட்டுப்பாடின்றி அதிகரிக்கின்றன மற்றும் அவற்றை எவ்வாறு கட்டுப்படுத்துவது?

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗢𝘂𝗿 𝗔𝗜 𝗔𝗣𝗜 𝗕𝗶𝗹𝗹 𝗶𝗻 𝗛𝗮𝗹𝗳 𝗪𝗵𝗶𝗹𝗲 𝗛𝗶𝘁𝘁𝗶𝗻𝗴 𝗽𝟵𝟵 𝗦𝗟𝗔𝘀

உங்கள் AI கட்டணத்தைக் குறைக்க 7 வழிகள்