𝗧𝗵𝗲 𝗥𝗲𝗮𝗹 𝗖𝗼𝘀𝘁 𝗼𝗳 𝗔𝗜 𝗔𝗣𝗜𝘀

📅3 hours ago⏱2 min read

AI API-களின் உண்மையான செலவு

ஒரு இணையதளத்தில் உள்ள API விலை என்பது உங்கள் உண்மையான உற்பத்தி பட்ஜெட் (production budget) அல்ல.

விலை பக்கங்கள் (Pricing pages) அலகு விலைகளைக் காட்டுகின்றன. அவை ஒரு மில்லியன் டோக்கன்களுக்கான செலவு அல்லது ஒரு படத்திற்கான செலவைக் காட்டுகின்றன. இந்த எண்கள் பயனுள்ளவை, ஆனால் முழுமையானவை அல்ல.

ஒரு உண்மையான தயாரிப்பு என்பது ஒரே ஒரு கோரிக்கையை (request) மட்டும் பயன்படுத்துவதில்லை. நீங்கள் பின்வருவனவற்றைக் கணக்கில் கொள்ள வேண்டும்:

மீண்டும் மீண்டும் வரும் சூழல் (Repeated context)
கருவி முடிவுகள் (Tool results)
கேச் எழுதுதல் (Cache writes)
மறுமுயற்சிகள் (Retries)
நகல் சமர்ப்பிப்புகள் (Duplicate submissions)
தோல்வியடைந்த ஊடகப் பணிகள் (Failed media jobs)
பயனர்கள் நிராகரிக்கும் வெளியீடுகள் (Outputs users reject)

இந்தக் காரணிகள் கணக்கீட்டை எவ்வளவு மாற்றுகின்றன என்பதைப் பார்க்க, மூன்று பணிச்சுமைகளுக்காக (workloads) நான் ஒரு பட்ஜெட் மாதிரியை உருவாக்கினேன்.

நிலையான LLM பயன்பாடுகள் (Standard LLM Applications) ஒரு எளிய கணக்கீடு 6,000 கோரிக்கைகளுக்கு $81 எனக் காட்டலாம். ஆனால் நீங்கள் 3% மறுமுயற்சி விகிதம் (retry rate) மற்றும் 15% திட்டமிடல் இடைவெளியைச் (planning buffer) சேர்த்தால், உங்கள் செலவு $95.94 ஆக உயரும். நீங்கள் அளவை அதிகரிக்கும்போது (scale) இந்த வித்தியாசம் வளரும்.
கோடிங் ஏஜென்ட் பணிப்பாய்வுகள் (Coding Agent Workflows) கோடிங் ஏஜென்ட்களைச் செய்திகளின் (messages) அடிப்படையில் அளவிடாதீர்கள். முடிக்கப்பட்ட பணியின் (completed task) அடிப்படையில் அவற்றை அளவிடுங்கள். ஒரு பணியில் இவை இருக்கலாம்:

மூலக் கோப்புகளைப் படித்தல் (Reading source files)
சார்புகளை ஆய்வு செய்தல் (Inspecting dependencies)
ஷெல் கட்டளைகளை இயக்குதல் (Running shell commands)
கட்டளை வெளியீட்டைச் செயலாக்குதல் (Processing command output)
தோல்வியடைந்த படிகளை மீண்டும் முயற்சித்தல் (Retrying failed steps)

ஒரே மாதிரியான குறுகிய பதிலைக் கொண்ட இரண்டு பணிகளுக்கு வெவ்வேறு செலவுகள் இருக்கலாம்; உதாரணமாக, ஒரு பணி முழுமையான களஞ்சியத்தையும் (repository) படிக்கத் தேவைப்படலாம், மற்றொன்று ஒரு கோப்பை மட்டுமே படிக்கலாம்.

பட உருவாக்கம் (Image Generation) ஏற்றுக்கொள்ளப்பட்ட ஒரு படத்தின் செலவு என்பது ஒரு API அழைப்பின் (API call) செலவு அல்ல. ஒரு பயனர் தனக்குப் பிடித்த ஒரு படத்தைப்பெற 2.4 முயற்சிகள் தேவைப்பட்டால், உங்கள் செலவு இரண்டு மடங்குக்கும் அதிகமாகும்.

இந்தச் செலவுகளை நிர்வகிக்க, உங்களுக்கு விரிவான பதிவுகள் தேவை. உரைக்கு (text), கோரிக்கை ஐடிகள் (request IDs), டோக்கன்கள் மற்றும் மறுமுயற்சிகளைக் கண்காணிக்கவும். ஊடகங்களுக்கு (media), பணி ஐடிகள் (job IDs) மற்றும் தோல்வி நிலைகளைக் கண்காணிக்கவும்.

நான் செலவுத் திட்டமிடலை நான்கு அடுக்குகளாகப் பிரிக்கிறேன்:

வழங்குநர் விலை (Provider pricing - unit rates)
தயாரிப்பு பயன்பாடு (Product usage - users and requests)
செயல்பாட்டு யதார்த்தம் (Operational reality - retries and rejections)
பட்ஜெட் இடைவெளிகள் (Budget buffers - safety margins)

ஒரு கால்குலேட்டர் என்பது ஒரு திட்டமிடல் கருவி மட்டுமே. அது மாதிரியின் தரம் (model quality) அல்லது எதிர்கால விலை மாற்றங்களைக் கணிக்க முடியாது. ஒரு அடிப்படைத் தரவை (baseline) உருவாக்க இதைப் பயன்படுத்தவும், பின்னர் அதை உங்கள் உண்மையான பில்லிங் டேஷ்போர்டுடன் (billing dashboard) ஒப்பிட்டுப் பார்க்கவும்.

ஆதாரம்: https://dev.to/cleandatadev/i-compared-the-real-cost-of-claude-code-openrouter-and-image-apis-1cip

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗥𝗲𝗮𝗹 𝗖𝗼𝘀𝘁 𝗼𝗳 𝗔𝗜 𝗔𝗣𝗜𝘀

Continue reading

𝗦𝘁𝗼𝗽 𝗪𝗮𝘀𝘁𝗶𝗻𝗴 𝗠𝗼𝗻𝗲𝘆 𝗼𝗻 𝗔𝗜 𝗔𝗣𝗜𝘀

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗖𝗼𝘀𝘁 𝗜𝘀 𝗮 𝗥𝘂𝗻𝘁𝗶𝗺𝗲 𝗦𝗶𝗴𝗻𝗮𝗹

எனது AI தினசரி செலவுகளை நான் கண்காணிக்கிறேன்

𝗧𝗵𝗲 𝗔𝗜 𝗖𝗼𝗱𝗶𝗻𝗴 𝗪𝗮𝗿: 𝗖𝗼𝗽𝗶𝗹𝗼𝘁, 𝗖𝗹𝗮𝘂𝗱𝗲, 𝗮𝗻𝗱 𝗖𝗼𝗱𝗲𝘅