నా స్టార్టప్‌ను కాపాడిన AI API స్టాక్

ఆరు నెలల క్రితం, ఒక LLM ప్రొవైడర్ నుండి నాకు నెలకు $50,000 బిల్లు వచ్చింది. నా స్టార్టప్ ఇబ్బందుల్లో పడింది. మేము ఒకే వెండర్‌పై అతిగా ఆధారపడి ఉన్నాము.

AI ఇన్‌ఫ్రాస్ట్రక్చర్‌ను నిజమైన ఇన్‌ఫ్రాస్ట్రక్చర్‌లా చూడాలని నేను గ్రహించాను. AIని ఒక బొమ్మలా చూడటం మానేసి, దానిని ఒక ప్రధాన వ్యాపార ఖర్చుగా పరిగణించడం ప్రారంభించాను.

చాలా AI గైడ్‌లు స్కేల్‌ను (scale) విస్మరిస్తాయి. అవి మీకు డెమోలను చూపిస్తాయి కానీ అసలు బిల్లులను పట్టించుకోవు. నేను రెండు సంవత్సరాలుగా AI ఫీచర్లను నడుపుతున్నాను. వందల వేల మంది వినియోగదారులకు స్కేల్ చేసినప్పుడు ఏం జరుగుతుందో నేను చూశాను.

మీరు మొదటి రోజే తప్పుడు ప్రొవైడర్‌ను ఎంచుకుంటే, వైరల్ లాంచ్ (viral launch) సమయంలో మీరు మనుగడ సాగించలేకపోవచ్చు.

లక్ష్యం సరళమైనది. మీకు మూడు విషయాలు అవసరం:

  • ప్రతి టోకెన్‌కు ఊహించదగిన ఖర్చులు.
  • మోడల్‌లను తక్షణమే మార్చుకునే సామర్థ్యం.
  • గడువు ముగిసిపోని క్రెడిట్ సిస్టమ్స్.

నేను ప్రారంభంలో ఒక తప్పు చేశాను. నేను నేరుగా బహుళ ప్రొవైడర్లతో ఇంటిగ్రేట్ అయ్యాను. ప్రతి ఒక్కటి వేర్వేరు SDK మరియు వేర్వేరు auth ఫ్లోలను కలిగి ఉన్నాయి. నేను కొత్త మోడల్‌ను పరీక్షించాలనుకుంటే, మళ్ళీ సైన్ అప్ అవ్వాల్సి వచ్చేది. నేను మారాలనుకుంటే, నా కోడ్‌ను మళ్ళీ రాయాల్సి వచ్చేది.

ఇప్పుడు, నేను ఒక యూనిఫైడ్ గేట్‌వేని (unified gateway) ఉపయోగిస్తున్నాను. ఇది అన్నింటినీ మార్చేస్తుంది.

వ్యూహాల పోలిక:

Direct Integration vs. Unified Gateway

  • ప్రొవైడర్ మార్పు: కోడ్‌ను మళ్ళీ రాయడం vs. ఒక స్ట్రింగ్‌ను మార్చడం
  • పేమెంట్: ప్రాంతీయ ఇబ్బందులు vs. స్టాండర్డ్ కార్డ్‌లు
  • టెస్టింగ్: పూర్తి ఆన్‌బోర్డింగ్ vs. ఒక కీ ద్వారా యాక్సెస్
  • అప్‌టైమ్: సింగిల్ పాయింట్ ఆఫ్ ఫెయిల్యూర్ vs. ఆటోమేటిక్ ఫెయిల్‌ఓవర్

యూనిఫైడ్ గేట్‌వే అవసరాన్ని బట్టి పనులను రూట్ (route) చేయడానికి అనుమతిస్తుంది. ప్రతిదానికీ మీకు GPT-4o అవసరం లేదు.

నా ప్రస్తుత రూటింగ్ లాజిక్:

  • Summarization మరియు extraction: అత్యంత తక్కువ ధర ఉన్న మోడల్‌ను ఉపయోగించండి.
  • Simple chat: మిడ్-టియర్ మోడల్‌ను ఉపయోగించండి.
  • Complex reasoning: ప్రీమియం మోడల్‌ను ఉపయోగించండి.

మా ట్రాఫిక్‌లో ఎక్కువ భాగం అత్యంత తక్కువ ధర ఉన్న టియర్‌లో నడుస్తుంది. ఇది నాణ్యతను కాపాడుతూనే మా ఖర్చులను తక్కువగా ఉంచుతుంది. మేము మా పనులలో కేవలం 5% కోసం మాత్రమే ప్రీమియం మోడల్‌లను కేటాయిస్తాము.

మా వృద్ధి దశలో, ఈ రూటింగ్ మా వార్షిక రన్‌వేలో (annual runway) సుమారు $500,000 ఆదా చేస్తుంది. ఇది కేవలం ఒక టూల్ ఎంపిక మాత్రమే కాదు. ఇది మనుగడ కోసం తీసుకున్న నిర్ణయం.

ఎంటర్‌ప్రైజ్ ఫీచర్లను చాలా త్వరగా కొనడం ఆపండి. మీకు ఇంకా ఎంటర్‌ప్రైజ్ కస్టమర్లు లేకపోతే, SLAలు లేదా డెడికేటెడ్ కెపాసిటీ కోసం డబ్బు చెల్లించకండి. ఆ నగదును ఆదా చేయండి. మొదట ఫ్లెక్సిబిలిటీ (flexibility) కోసం నిర్మించండి.

మీరు స్కేల్ చేసినప్పుడు కూడా, గేట్‌వే ప్యాటర్న్ పని చేస్తుంది. మీరు కేవలం మీ API కీ మరియు మీ కమర్షియల్ టర్మ్స్‌ను మార్చుకుంటే సరిపోతుంది. మీ కోడ్ అలాగే ఉంటుంది.

మొదటి రోజే మీ రూటర్‌ను నిర్మించండి. మీ బేస్ URLను స్టాండర్డ్ చేయండి. మోడల్ పేర్లను మీ కోడ్‌లో కాకుండా, మీ కాన్ఫిగరేషన్‌లో భాగంగా ఉంచండి.

Source: https://dev.to/truelane/the-ai-api-stack-that-saved-my-startup-from-vendor-lock-in-50l6

Optional learning community: https://t.me/GyaanSetuAi