Інтеграція ШІ коштувала занадто дорого, поки я не змінив свій підхід

Translated for your language. Read the original.

AI-assisted draft.

Моя інтеграція ШІ коштувала занадто багато, поки я не змінив підхід

Мені дуже подобалася моя функція ШІ-сумаризації, поки не прийшов рахунок.

Минулого місяця я створив інструмент для резюмування довгих статей. Я використовував GPT-4 із простим промптом. Це працювало ідеально. Користувачам подобалася якість.

Потім прийшов рахунок. Один місяць використання коштував мені понад 1200 доларів. Мені довелося або виправити це, або припинити роботу функції.

Я спробував кілька варіантів, щоб це виправити:

Я перейшов на GPT-3.5-turbo. Вартість знизилася, але якість впала. Резюме стали розпливчастими.
Я спробував промпт-інжиніринг. Додавання фрази «будь конкретним» не допомогло достатньо.
Я спробував зменшити обсяг вхідних даних за допомогою екстрактивних бібліотек. Це допомогло, але витрати залишилися високими.

Я зрозумів, що намагаюся забити маленький цвях кувалдою.

Рішенням є двоетапний пайплайн. Ви поєднуєте два різні методи, щоб отримати найкращі результати.

Step 1: Екстрактивна фаза Використовуйте дешевий і швидкий інструмент, наприклад TextRank, щоб вибрати від 5 до 10 найважливіших речень зі статті. Це видаляє 90% зайвого тексту.

Step 2: Абстрактивна фаза Відправляйте лише ці кілька речень у невелику та дешеву модель, таку як GPT-3.5-turbo. Попросіть її переписати ці речення у чітке резюме з 3 пунктів.

Цей підхід скоротив мої витрати на 80%. Якість залишилася близькою до GPT-4, оскільки модель обробляла лише найважливіші дані.

Інші поради для ваших ШІ-проєктів:

Використовуйте кешування. Зберігайте результати за хешем статті, щоб не платити за одне й те саме резюме двічі.
Використовуйте рівні. Розбивайте складні завдання на менші та дешевші підзавдання.
Налаштуйте резервний варіант (fallback). Якщо стаття занадто складна, використовуйте високоякісну модель, наприклад GPT-4, лише для таких конкретних випадків.

Припиніть надсилати величезні блоки тексту дорогим моделям. Спочатку стискайте дані.

Як ви балансуєте між якістю ШІ та вартістю у своїх продуктах? Чи використовуєте ви різні моделі для різних завдань?

Джерело: https://dev.to/__c1b9e06dc90a7e0a676b/my-ai-integration-had-terrible-costs-until-i-changed-my-approach-pml

Інтеграція ШІ коштувала занадто дорого, поки я не змінив свій підхід

Continue reading

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

Як я скоротив наші витрати на AI API вдвічі, дотримуючись 99 SLA

𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁'𝘀 𝗧𝗼𝗸𝗲𝗻 𝗕𝗶𝗹𝗹 𝗯𝘆 𝟲𝟮% 𝗶𝗻 𝗢𝗻𝗲 𝗪𝗲𝗲𝗸𝗲𝗻𝗱

𝟳 𝗪𝗮𝘆𝘀 𝘁𝗼 𝗥𝗲𝗱𝘂𝗰𝗲 𝗬𝗼𝘂𝗿 𝗔𝗜 𝗕𝗶𝗹𝗹