AI API-களின் உண்மையான செலவு
ஒரு இணையதளத்தில் உள்ள API விலை என்பது உங்கள் உண்மையான உற்பத்தி பட்ஜெட் (production budget) அல்ல.
விலை பக்கங்கள் (Pricing pages) அலகு விலைகளைக் காட்டுகின்றன. அவை ஒரு மில்லியன் டோக்கன்களுக்கான செலவு அல்லது ஒரு படத்திற்கான செலவைக் காட்டுகின்றன. இந்த எண்கள் பயனுள்ளவை, ஆனால் முழுமையானவை அல்ல.
ஒரு உண்மையான தயாரிப்பு என்பது ஒரே ஒரு கோரிக்கையை (request) மட்டும் பயன்படுத்துவதில்லை. நீங்கள் பின்வருவனவற்றைக் கணக்கில் கொள்ள வேண்டும்:
- மீண்டும் மீண்டும் வரும் சூழல் (Repeated context)
- கருவி முடிவுகள் (Tool results)
- கேச் எழுதுதல் (Cache writes)
- மறுமுயற்சிகள் (Retries)
- நகல் சமர்ப்பிப்புகள் (Duplicate submissions)
- தோல்வியடைந்த ஊடகப் பணிகள் (Failed media jobs)
- பயனர்கள் நிராகரிக்கும் வெளியீடுகள் (Outputs users reject)
இந்தக் காரணிகள் கணக்கீட்டை எவ்வளவு மாற்றுகின்றன என்பதைப் பார்க்க, மூன்று பணிச்சுமைகளுக்காக (workloads) நான் ஒரு பட்ஜெட் மாதிரியை உருவாக்கினேன்.
நிலையான LLM பயன்பாடுகள் (Standard LLM Applications) ஒரு எளிய கணக்கீடு 6,000 கோரிக்கைகளுக்கு $81 எனக் காட்டலாம். ஆனால் நீங்கள் 3% மறுமுயற்சி விகிதம் (retry rate) மற்றும் 15% திட்டமிடல் இடைவெளியைச் (planning buffer) சேர்த்தால், உங்கள் செலவு $95.94 ஆக உயரும். நீங்கள் அளவை அதிகரிக்கும்போது (scale) இந்த வித்தியாசம் வளரும்.
கோடிங் ஏஜென்ட் பணிப்பாய்வுகள் (Coding Agent Workflows) கோடிங் ஏஜென்ட்களைச் செய்திகளின் (messages) அடிப்படையில் அளவிடாதீர்கள். முடிக்கப்பட்ட பணியின் (completed task) அடிப்படையில் அவற்றை அளவிடுங்கள். ஒரு பணியில் இவை இருக்கலாம்:
- மூலக் கோப்புகளைப் படித்தல் (Reading source files)
- சார்புகளை ஆய்வு செய்தல் (Inspecting dependencies)
- ஷெல் கட்டளைகளை இயக்குதல் (Running shell commands)
- கட்டளை வெளியீட்டைச் செயலாக்குதல் (Processing command output)
- தோல்வியடைந்த படிகளை மீண்டும் முயற்சித்தல் (Retrying failed steps)
ஒரே மாதிரியான குறுகிய பதிலைக் கொண்ட இரண்டு பணிகளுக்கு வெவ்வேறு செலவுகள் இருக்கலாம்; உதாரணமாக, ஒரு பணி முழுமையான களஞ்சியத்தையும் (repository) படிக்கத் தேவைப்படலாம், மற்றொன்று ஒரு கோப்பை மட்டுமே படிக்கலாம்.
- பட உருவாக்கம் (Image Generation) ஏற்றுக்கொள்ளப்பட்ட ஒரு படத்தின் செலவு என்பது ஒரு API அழைப்பின் (API call) செலவு அல்ல. ஒரு பயனர் தனக்குப் பிடித்த ஒரு படத்தைப்பெற 2.4 முயற்சிகள் தேவைப்பட்டால், உங்கள் செலவு இரண்டு மடங்குக்கும் அதிகமாகும்.
இந்தச் செலவுகளை நிர்வகிக்க, உங்களுக்கு விரிவான பதிவுகள் தேவை. உரைக்கு (text), கோரிக்கை ஐடிகள் (request IDs), டோக்கன்கள் மற்றும் மறுமுயற்சிகளைக் கண்காணிக்கவும். ஊடகங்களுக்கு (media), பணி ஐடிகள் (job IDs) மற்றும் தோல்வி நிலைகளைக் கண்காணிக்கவும்.
நான் செலவுத் திட்டமிடலை நான்கு அடுக்குகளாகப் பிரிக்கிறேன்:
- வழங்குநர் விலை (Provider pricing - unit rates)
- தயாரிப்பு பயன்பாடு (Product usage - users and requests)
- செயல்பாட்டு யதார்த்தம் (Operational reality - retries and rejections)
- பட்ஜெட் இடைவெளிகள் (Budget buffers - safety margins)
ஒரு கால்குலேட்டர் என்பது ஒரு திட்டமிடல் கருவி மட்டுமே. அது மாதிரியின் தரம் (model quality) அல்லது எதிர்கால விலை மாற்றங்களைக் கணிக்க முடியாது. ஒரு அடிப்படைத் தரவை (baseline) உருவாக்க இதைப் பயன்படுத்தவும், பின்னர் அதை உங்கள் உண்மையான பில்லிங் டேஷ்போர்டுடன் (billing dashboard) ஒப்பிட்டுப் பார்க்கவும்.
ஆதாரம்: https://dev.to/cleandatadev/i-compared-the-real-cost-of-claude-code-openrouter-and-image-apis-1cip
விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi