The AI Help Desk: How to Stop Wasting Money on Repeative AI Questions

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 години тому2min read

The AI Help Desk: How to Stop Wasting Money on Repeative AI Questions

AI Help Desk: як перестати витрачати гроші на повторні запитання до ШІ

Користувачі повторно ставлять одним і тим самим ШІ-додаткам одні й ті самі запитання. Ставити запитання ШІ щоразу — це повільно. Це також коштує вам грошей.

Ви можете вирішити це за допомогою системи, яка запам'ятовує відповіді. Уявіть це як службу підтримки (help desk).

Ось як працює ця служба підтримки:

Експерт (LLM) Це модель ШІ, така як GPT або Claude. Вона розумна, але повільна та дорога. Мета полягає в тому, щоб звертатися до експерта лише з новими запитаннями.
Блокнот (Cache) Служба записує відповіді сюди. Читання блокнота відбувається миттєво та безкоштовно. • Послівний блокнот (Exact Cache): знаходить відповіді, які збігаються ідеально. • Блокнот за змістом (Semantic Cache): знаходить відповіді, навіть якщо формулювання змінюється.
Читач смислів (Embedding Model) Цей інструмент перетворює запитання на «відбиток змісту». Якщо два запитання мають схожі відбитки, вони означають одне й те саме.
Зміст (Vector Store) Розумний індекс, який допомагає службі миттєво знайти потрібну сторінку. Без цього пошук серед мільйонів відповідей був би занадто повільним.
Адміністратор (Router) Ця людина першою отримує запитання. Вона перевіряє блокноти, перш ніж вирішити, чи варто турбувати експерта.
Мітки (Scope/Tenant Tags) Кожна відповідь отримує мітку. «Anyone» означає, що відповідь є публічною. «Private» означає, що її може бачити лише один конкретний користувач. Це забезпечує безпеку персональних даних.

Як запитання проходить через службу підтримки:

Надходить запитання.
Адміністратор перевіряє швидкий послівний блокнот.
Якщо збігів немає, адміністратор перевіряє блокнот за змістом за допомогою відбитків.
Якщо збігів усе ще немає, викликають експерта (LLM), щоб він написав нову відповідь.
Служба зберігає цю відповідь у блокноті на наступний раз.

Результат: Якщо ваш додаток обробляє 100 000 запитань, а кеш перехоплює половину з них:

Ви економите 50% на рахунках за ШІ.
Час очікування скорочується з секунд до мілісекунд.
Ваші витрати зростають набагато повільніше, ніж кількість користувачів.

Source: https://dev.to/abhiram_paidi/the-ai-help-desk-how-to-stop-your-ai-app-from-re-answering-the-same-question-4650

Optional learning community: https://t.me/GyaanSetuAi

The AI Help Desk: How to Stop Wasting Money on Repeative AI Questions

Continue reading

Припиніть використовувати ШІ як пошукову систему

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗳𝗲𝗲𝗹𝘀 𝘀𝗹𝗼𝘄? 𝗠𝗮𝘆𝗯𝗲 𝗶𝘁'𝘀 𝗻𝗼𝘁 𝗱𝘂𝗺𝗯.