𝗠𝘆 𝗔𝗜 𝗜𝗻𝘁𝗲𝗴𝗿𝗮𝘁𝗶𝗼𝗻 𝗖𝗼𝘀𝘁 𝗧𝗼𝗼 𝗠𝘂𝗰𝗵 𝗨𝗻𝘁𝗶𝗹 𝗜 𝗖𝗵𝗮𝗻𝗴𝗲𝗱 𝗠𝘆 𝗔𝗽𝗽𝗿𝗼𝗮𝗰𝗵

Translated for your language. Read the original.

AI-assisted draft.

Я створив інструмент для резюмування довгих статей. Я використовував GPT-4, щоб він працював. Резюме були чудовими. Рахунок за один місяць склав $1,200.

Ця вартість була занадто високою для мого проєкту. У мене було три варіанти. Знизити витрати або припинити роботу функції.

Я спробував перейти на GPT-3.5. Ціна впала. Якість також знизилася. Резюме стали розпливчастими та втрачали важливі факти.

Я спробував зменшити обсяг вхідного тексту. Я використовував локальні бібліотеки, щоб спочатку вибрати найважливіші речення. Це допомогло, але витрати залишилися високими. Малі моделі все одно припускалися помилок у довгих текстах.

Потім я знайшов кращий спосіб. Я перестав використовувати одну велику модель для всього. Я почав використовувати двоступеневий пайплайн.

Крок 1: Екстрактивна фаза. Використовуйте дешевий і швидкий інструмент, щоб вибрати 5–10 найкращих речень зі статті. Це видаляє 90% тексту.

Крок 2: Абстрактивна фаза. Відправляйте лише ці кілька речень у невеликий дешевий API. Попросіть його об'єднати ці речення в чітке резюме.

Ця зміна скоротила мої витрати на 80%. Якість залишилася на рівні, близькій до GPT-4. Виклики API стали значно меншими та дешевшими.

Я також засвоїв два важливі уроки:

Використовуйте кешування. Якщо багато користувачів читають одну й ту саму статтю, не запускайте процес двічі. Зберігайте результат.
Використовуйте рівні. Вам не завжди потрібна важка модель. Розбивайте складні завдання на маленькі дешеві кроки.

Як ви балансуєте між якістю ШІ та вартістю у своїх проєктах? Чи використовуєте ви різні моделі для різних етапів?

Джерело: https://dev.to/__c1b9e06dc90a7e0a676b/my-ai-integration-had-terrible-costs-until-i-changed-my-approach-pml

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi

𝗠𝘆 𝗔𝗜 𝗜𝗻𝘁𝗲𝗴𝗿𝗮𝘁𝗶𝗼𝗻 𝗖𝗼𝘀𝘁 𝗧𝗼𝗼 𝗠𝘂𝗰𝗵 𝗨𝗻𝘁𝗶𝗹 𝗜 𝗖𝗵𝗮𝗻𝗴𝗲𝗱 𝗠𝘆 𝗔𝗽𝗽𝗿𝗼𝗮𝗰𝗵

Continue reading

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

Як я скоротив наші витрати на AI API вдвічі, дотримуючись 99 SLA

𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁'𝘀 𝗧𝗼𝗸𝗲𝗻 𝗕𝗶𝗹𝗹 𝗯𝘆 𝟲𝟮% 𝗶𝗻 𝗢𝗻𝗲 𝗪𝗲𝗲𝗸𝗲𝗻𝗱

𝟳 𝗪𝗮𝘆𝘀 𝘁𝗼 𝗥𝗲𝗱𝘂𝗰𝗲 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗕𝗶𝗹𝗹

Інтеграція ШІ коштувала занадто дорого, поки я не змінив свій підхід