𝗧𝗵𝗲 𝗛𝗶𝗱𝗱𝗲𝗻 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗕𝗲𝗵𝗶𝗻𝗱 𝗔𝗜 𝗦𝗮𝗮𝗦
ਇੱਕ AI SaaS ਪਲੇਟਫਾਰਮ ਬਣਾਉਣ ਨੇ ਮੈਨੂੰ ਇੱਕ ਚੀਜ਼ ਸਿਖਾਈ ਹੈ।
ਮੁਸ਼ਕਲ ਕੰਮ LLM ਨੂੰ ਕਾਲ ਕਰਨਾ ਨਹੀਂ ਹੈ। ਮੁਸ਼ਕਲ ਕੰਮ AI ਨੂੰ ਇੱਕ ਅਸਲ ਕਾਰੋਬਾਰ ਵਿੱਚ ਕੰਮ ਕਰਵਾਉਣਾ ਹੈ।
ਸ਼ੁਰੂ ਵਿੱਚ, ਸਭ ਕੁਝ ਸਧਾਰਨ ਲੱਗਦਾ ਹੈ। ਤੁਸੀਂ ਸੋਚਦੇ ਹੋ:
- API keys ਸਿਰਫ਼ ਗੁਪਤ ਜਾਣਕਾਰੀ (secrets) ਹਨ।
- SSO ਸਿਰਫ਼ ਇੱਕ ਕਨੈਕਸ਼ਨ ਹੈ।
- ਬਿਲਿੰਗ ਸਿਰਫ਼ Stripe ਹੈ।
- ਡਿਪਲਾਈਮੈਂਟ ਸਿਰਫ਼ Docker ਹੈ।
- AI ਸਿਰਫ਼ ਇੱਕ OpenAI ਕਾਲ ਹੈ।
ਫਿਰ ਪਲੇਟਫਾਰਮ ਅਸਲੀ ਬਣ ਜਾਂਦਾ ਹੈ। ਹਰ ਸਧਾਰਨ ਵਿਸ਼ਾ ਇੱਕ ਗੁੰਝਲਦਾਰ ਸਿਸਟਮ ਵਿੱਚ ਬਦਲ ਜਾਂਦਾ ਹੈ।
API Keys ਇੱਕ API key ਸਿਰਫ਼ ਇੱਕ ਸਟ੍ਰਿੰਗ ਨਹੀਂ ਹੈ। ਐਂਟਰਪ੍ਰਾਈਜ਼ SaaS ਵਿੱਚ, ਇੱਕ ਕੀ (key) ਨੂੰ ਇਹ ਸੰਭਾਲਣਾ ਚਾਹੀਦਾ ਹੈ:
- ਸਕੋਪਸ (Scopes) ਅਤੇ ਮਿਆਦ (expiration)।
- ਰਿਵੋਕੇਸ਼ਨ (Revocation) ਅਤੇ ਆਡਿਟ ਲੌਗਸ।
- ਟੈਨੈਂਟ ਦੀਆਂ ਸੀਮਾਵਾਂ (Tenant boundaries) ਅਤੇ ਰੇਟ ਲਿਮਿਟਸ।
- ਪਲਾਨ-ਅਧਾਰਤ ਪਹੁੰਚ (Plan-based access)।
ਇੱਕ ਕੀ ਨੂੰ ਇਹ ਦੱਸਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਇਸਦਾ ਮਾਲਕ ਕੌਣ ਹੈ, ਇਹ ਕਿਸ ਟੈਨੈਂਟ ਨਾਲ ਸਬੰਧਤ ਹੈ, ਅਤੇ ਇਹ ਕਿਸ ਚੀਜ਼ ਤੱਕ ਪਹੁੰਚ ਸਕਦਾ ਹੈ।
SSO ਅਤੇ Identity ਇੱਕ ਪ੍ਰੋਵਾਈਡਰ ਨੂੰ ਜੋੜਨਾ ਆਸਾਨ ਹੈ। ਮੁਸ਼ਕਲ ਕੰਮ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਹੈ ਕਿ ਕਿਸ 'ਤੇ ਭਰੋਸਾ ਕੀਤਾ ਜਾਵੇ।
- ਕੀ ਤੁਸੀਂ ਈਮੇਲ ਡੋਮੇਨ 'ਤੇ ਭਰੋਸਾ ਕਰਦੇ ਹੋ ਜਾਂ ਗਰੁੱਪਾਂ 'ਤੇ?
- ਕੀ ਇੱਕ ਟੈਨੈਂਟ ਐਡਮਿਨ ਇੱਕ ਪਲੇਟਫਾਰਮ ਐਡਮਿਨ ਬਣਾ ਸਕਦਾ ਹੈ?
- ਕੀ ਹੁੰਦਾ ਹੈ ਜੇਕਰ ਕੋਈ ਯੂਜ਼ਰ ਕਈ ਟੈਨੈਂਟਾਂ ਨਾਲ ਸਬੰਧਤ ਹੋਵੇ?
ਅਸਲੀ SSO ਲਈ ਇਸ਼ੂਅਰ ਵੈਲੀਡੇਸ਼ਨ (issuer validation), ਰੋਲ ਮੈਪਿੰਗ (role mapping), ਅਤੇ ਸੈਸ਼ਨ ਆਇਸੋਲੇਸ਼ਨ (session isolation) ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
Operating AI ਇੱਕ ਮਾਡਲ ਨੂੰ ਕਾਲ ਕਰਨਾ ਆਸਾਨ ਹੈ। AI ਨੂੰ ਚਲਾਉਣਾ (Operating) ਮੁਸ਼ਕਲ ਹੈ। ਤੁਹਾਨੂੰ ਇਹ ਟ੍ਰੈਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ:
- ਟੋਕਨ ਦੀ ਖਪਤ ਅਤੇ ਲਾਗਤ।
- ਪ੍ਰੋਵਾਈਡਰ ਦੀ ਵਰਤੋਂ ਅਤੇ ਲੈਟੈਂਸੀ (latency)।
- ਰੀਟ੍ਰਾਈਜ਼ (Retries), ਟਾਈਮਆਊਟਸ, ਅਤੇ ਫਾਲਬੈਕਸ।
- ਪ੍ਰੋਂਪਟ ਗਵਰਨੈਂਸ (Prompt governance) ਅਤੇ ਡੇਟਾ ਦੀਆਂ ਸੀਮਾਵਾਂ।
ਇੱਕ ਡੈਮੋ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਜਵਾਬ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਕਾਰੋਬਾਰੀ ਪਲੇਟਫਾਰਮ ਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਕਿ ਕਿਸ ਟੈਨੈਂਟ ਨੇ ਕਿਹੜਾ ਮਾਡਲ ਵਰਤਿਆ ਅਤੇ ਇਸਦੀ ਲਗਭਗ ਕਿੰਨੀ ਲਾਗਤ ਆਈ।
Billing and Governance Stripe ਭੁਗਤਾਨਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਦਾ ਹੈ, ਪਰ ਇਹ ਤੁਹਾਡੇ ਉਤਪਾਦ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਨਹੀਂ ਕਰਦਾ। ਗੰਭੀਰ SaaS ਬਿਲਿੰਗ ਨੂੰ ਇਹਨਾਂ ਨਾਲ ਜੋੜਦਾ ਹੈ:
- ਕੋਟਾ (Quotas) ਅਤੇ ਫੀਚਰ ਗੇਟਸ।
- ਟੈਨੈਂਟ ਦੀਆਂ ਸੀਮਾਵਾਂ ਅਤੇ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਸਟੇਟਸ।
- ਡਿਪਲਾਈਮੈਂਟ ਮੋਡ ਜਿਵੇਂ ਕਿ on-prem ਜਾਂ ਕਸਟਮਰ ਕਲਾਉਡ।
ਬਿਲਿੰਗ ਵਪਾਰਕ ਗਵਰਨੈਂਸ ਬਣ ਜਾਂਦੀ ਹੈ। ਇਹ ਕੰਟਰੋਲ ਕਰਦੀ ਹੈ ਕਿ ਗਾਹਕ ਨੂੰ ਕੀ ਵਰਤਣ ਦੀ ਇਜਾਜ਼ਤ ਹੈ।
Execution and Scaling Kubernetes ਤੁਹਾਨੂੰ ਸਕੈਲੇਬਲ (scalable) ਨਹੀਂ ਬਣਾਉਂਦਾ। ਤੁਹਾਨੂੰ ਇਹਨਾਂ ਨੂੰ ਵੱਖ ਕਰਕੇ ਵਰਕਲੋਡਸ (workloads) ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ:
- ਕਿਊਜ਼ (Queues) ਅਤੇ ਵਰਕਰਜ਼ (workers)।
- ਸਰੋਤਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ (Resource limits) ਅਤੇ ਆਟੋਸਕੇਲਿੰਗ।
- ਨੈੱਟਵਰਕ ਪਾਲਿਸੀਆਂ ਅਤੇ ਆਬਜ਼ਰਵੇਬਿਲਟੀ (observability)।
ਤੁਹਾਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕਿਹੜਾ ਵਰਕਰ ਫੇਲ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਕਿਹੜਾ ਟੈਨੈਂਟ ਸਭ ਤੋਂ ਵੱਧ ਲੋਡ ਪੈਦਾ ਕਰ ਰਿਹਾ ਹੈ।
Observability ਮਾਨੀਟਰਿੰਗ ਕੋਈ ਬੋਨਸ ਨਹੀਂ ਹੈ। ਇਹ ਉਤਪਾਦ ਦਾ ਹਿੱਸਾ ਹੈ।
- ਇੰਜੀਨੀਅਰਾਂ ਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕੀ ਖਰਾਬ ਹੋਇਆ ਹੈ।
- ਲੀਡਰਾਂ ਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕਿੱਥੇ ਮੁੱਲ (value) ਪੈਦਾ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਕਿੱਥੇ ਲਾਗਤ ਵਧ ਰਹੀ ਹੈ।
ਸਭ ਤੋਂ ਵੱਡਾ ਸਬਕ: ਇਹ ਸਿਸਟਮ ਆਪਸ ਵਿੱਚ ਜੁੜੇ ਹੋਏ ਹਨ। ਜੇਕਰ AI ਵਿੱਚ ਮੀਟਰਿੰਗ ਦੀ ਕਮੀ ਹੈ, ਤਾਂ ਇਹ ਮਹਿੰਗਾ ਹੋ ਜਾਂਦਾ ਹੈ। ਜੇਕਰ SSO ਵਿੱਚ ਆਇਸੋਲੇਸ਼ਨ ਦੀ ਕਮੀ ਹੈ, ਤਾਂ ਇਹ ਖ਼ਤਰਨਾਕ ਹੋ ਜਾਂਦਾ ਹੈ। ਜੇਕਰ ਬਿਲਿੰਗ ਵਿੱਚ ਲਾਗੂ ਕਰਨ (enforcement) ਦੀ ਕਮੀ ਹੈ, ਤਾਂ ਇਹ ਸਿਰਫ਼ ਦਿਖਾਵਾ ਬਣ ਕੇ ਰਹਿ ਜਾਂਦਾ ਹੈ।
AI SaaS ਬਣਾਉਣ ਦਾ ਸਭ ਤੋਂ ਮੁਸ਼ਕਲ ਹਿੱਸਾ ਪ੍ਰੋਂਪਟ ਨਹੀਂ ਹੈ। ਇਹ ਪਛਾਣ (identity), ਡੇਟਾ, ਲਾਗਤ ਅਤੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ (infrastructure) ਨੂੰ ਇਕੱਠੇ ਚਲਾਉਣਾ ਹੈ।
ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi
