𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀

📅2 hours ago⏱1 min read

AI Gateway: ಎಂಟರ್‌ಪ್ರೈಸ್ LLMಗಳಿಗಾಗಿ ಕೇಂದ್ರ ನರಮಂಡಲ

ಆರಂಭಿಕ AI ಅಭಿವೃದ್ಧಿಯು ಸರಳವಾಗಿತ್ತು. ಡೆವಲಪರ್‌ಗಳು ಒಂದು ಆಪ್ ಅನ್ನು ಒಂದು ಮಾಡೆಲ್‌ಗೆ ಸಂಪರ್ಕಿಸುತ್ತಿದ್ದರು. ಅವರು API ಕೀಗಳನ್ನು ಹಾರ್ಡ್‌ಕೋಡ್ ಮಾಡುತ್ತಿದ್ದರು ಮತ್ತು ಎಲ್ಲವೂ ಚೆನ್ನಾಗಿ ನಡೆಯುತ್ತದೆ ಎಂದು ಭಾವಿಸುತ್ತಿದ್ದರು.

ಅಂತಹ ವಿಧಾನವು ಎಂಟರ್‌ಪ್ರೈಸ್ ಮಟ್ಟದಲ್ಲಿ ವಿಫಲವಾಗುತ್ತದೆ.

ಆಧುನಿಕ ಕಂಪನಿಗಳು ಡಜನ್‌ಗಟ್ಟಲೆ ಮಾಡೆಲ್‌ಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತವೆ. ಅವು Kubernetes ನಲ್ಲಿ ಓಪನ್-ಸೋರ್ಸ್ ಮಾಡೆಲ್‌ಗಳನ್ನು ಮತ್ತು ಕ್ಲೌಡ್ ಪ್ರೊವೈಡರ್‌ಗಳಿಂದ ಪ್ರೀಮಿಯಂ APIಗಳನ್ನು ಬಳಸುತ್ತವೆ. ಅವು AI ಏಜೆಂಟ್‌ಗಳು ಮತ್ತು ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ಸಹ ಬಳಸುತ್ತವೆ. ಈ ಸಂಕೀರ್ಣತೆಯು ಅಡೆತಡೆಗಳನ್ನು (bottlenecks) ಸೃಷ್ಟಿಸುತ್ತದೆ.

ಕೇಂದ್ರ ನಿಯಂತ್ರಣವಿಲ್ಲದೆ, ನೀವು ಎದುರಿಸುವ ಸಮಸ್ಯೆಗಳು:

ಚದುರಿದ ಭದ್ರತಾ ನೀತಿಗಳು (Fragmented security policies)
ಅನಿಶ್ಚಿತ ವೆಚ್ಚಗಳು
ಪ್ರೊವೈಡರ್ ಸೇವೆಯು ಸ್ಥಗಿತಗೊಂಡಾಗ ಚೇತರಿಸಿಕೊಳ್ಳುವ ಸಾಮರ್ಥ್ಯದ ಕೊರತೆ

AI Gateway ಇದನ್ನು ಪರಿಹರಿಸುತ್ತದೆ. ಇದು ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು ಮತ್ತು ನಿಮ್ಮ ಮಾಡೆಲ್‌ಗಳ ನಡುವೆ ಇರುತ್ತದೆ. ಇದು ನಿಮ್ಮ AI ಮೂಲಸೌಕರ್ಯಕ್ಕೆ ಟ್ರಾಫಿಕ್ ಕಂಟ್ರೋಲರ್ ಆಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ:

The Ingress Layer: ಸಂಪರ್ಕಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು rate limiting ಮೂಲಕ ದಾಳಿಗಳನ್ನು ತಡೆಯುತ್ತದೆ.
The Policy Engine: ಇದು ವ್ಯವಸ್ಥೆಯ ಮೆದುಳು. ಇದು ಅಥೆಂಟಿಕೇಶನ್ ಅನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು PII ನಂತಹ ಸೂಕ್ಷ್ಮ ಡೇಟಾವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತದೆ.
The Routing Engine: ಯಾವ ಮಾಡೆಲ್ ವಿನಂತಿಯನ್ನು ನಿರ್ವಹಿಸಬೇಕು ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸುತ್ತದೆ. ನೀವು ವೆಚ್ಚ, ವೇಗ ಅಥವಾ ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಆಧಾರದ ಮೇಲೆ ರೂಟ್ ಮಾಡಬಹುದು.
The Caching Layer: ಹಣ ಉಳಿಸಲು ಮತ್ತು ವಿಳಂಬವನ್ನು (latency) ಕಡಿಮೆ ಮಾಡಲು ಹಿಂದಿನ ಉತ್ತರಗಳನ್ನು ಸಂಗ್ರಹಿಸುತ್ತದೆ.
The Observability Module: ವಿಳಂಬ ಮತ್ತು ವೆಚ್ಚವನ್ನು ನೈಜ ಸಮಯದಲ್ಲಿ (real time) ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ.

ನಿಮಗೆ ಇದು ಏಕೆ ಬೇಕು:

ವೆಚ್ಚ ನಿಯಂತ್ರಣ (Cost Control): ಸರಳ ಕಾರ್ಯಗಳನ್ನು ಅಗ್ಗದ ಮಾಡೆಲ್‌ಗಳಿಗೆ ಮತ್ತು ಸಂಕೀರ್ಣ ಕಾರ್ಯಗಳನ್ನು ದುಬಾರಿ ಮಾಡೆಲ್‌ಗಳಿಗೆ ಕಳುಹಿಸಲು ಸ್ಮಾರ್ಟ್ ರೂಟಿಂಗ್ ಬಳಸಿ. ಇದು ವೆಚ್ಚವನ್ನು 40% ರಿಂದ 60% ರಷ್ಟು ಕಡಿಮೆ ಮಾಡಬಹುದು.
ಭದ್ರತೆ (Security): ನಿಮ್ಮ ನೆಟ್‌ವರ್ಕ್‌ನಿಂದ ಹೊರಹೋಗುವ ಮೊದಲು ಸೂಕ್ಷ್ಮ ಡೇಟಾವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಮರೆಮಾಚುತ್ತದೆ (mask). Prompt injection ವಿರುದ್ಧ ರಕ್ಷಣೆ ನೀಡುತ್ತದೆ.
ವೆಂಡರ್ ಸ್ವಾತಂತ್ರ್ಯ (Vendor Independence): ನಿಮ್ಮ ಕೋಡ್ ಅನ್ನು ಮತ್ತೆ ಬರೆಯುವ ಬದಲು ಕೇವಲ ಒಂದು ಕಾನ್ಫಿಗರೇಶನ್ ಫೈಲ್ ಅನ್ನು ಬದಲಾಯಿಸುವ ಮೂಲಕ ಮಾಡೆಲ್ ಪ್ರೊವೈಡರ್‌ಗಳನ್ನು ಬದಲಾಯಿಸಬಹುದು.
ಕಾರ್ಯಾಚರಣೆಯ ದಕ್ಷತೆ (Operational Efficiency): ಡೆವಲಪರ್‌ಗಳು ಮೂಲಸೌಕರ್ಯ ನಿರ್ವಹಣೆಯ ಬದಲು ಫೀಚರ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವುದರ ಮೇಲೆ ಗಮನ ಹರಿಸಬಹುದು.

AI ಅನ್ನು ಪ್ರತ್ಯೇಕ ಸಂಪರ್ಕಗಳ ಸರಣಿಯಾಗಿ ಪರಿಗಣಿಸುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ಜವಾಬ್ದಾರಿಯುತವಾಗಿ ವಿಸ್ತರಿಸಲು (scale) ಒಂದು ಕೇಂದ್ರ ನಿಯಂತ್ರಣ ಬಿಂದುವನ್ನು ನಿರ್ಮಿಸಿ.

Source: https://dev.to/chatscopeai/ai-gateway-the-central-nervous-system-for-enterprise-llms-542f

Optional learning community: https://t.me/GyaanSetuAi

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀

Continue reading

𝗟𝗟𝗠 𝗚𝗔𝗧𝗘𝗪𝗔𝗬𝗦 𝗙𝗢𝗥 𝗔𝗜 𝗦𝗔𝗔𝗦

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗗𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗚𝘂𝗶𝗱𝗲 (𝟮𝟬𝟮𝟲)

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗗𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗚𝘂𝗶𝗱𝗲 (𝟮𝟬𝟮𝟲)

𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗟𝗲𝗮𝘃𝗶𝗻𝗴 𝘁𝗵𝗲 𝗦𝗲𝗿𝘃𝗲𝗿

𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀