Я автоматизировал процесс создания превью с помощью ИИ. Вот что из этого вышло.

Я бэкенд-разработчик. Также я веду технический YouTube-канал. На прошлой неделе я потратил четыре часа на одно превью. Его CTR (показатель кликабельности) составил всего 2,4%.

Я решил проверить одну теорию. Может ли ИИ заменить мой процесс ручного дизайна? Может ли рабочий процесс «текст-в-превью» работать в реальном контент-пайплайне?

Я ошибался, думая, что это будет легко.

Самая большая проблема — это типографика. В дизайне превью текст должен считываться менее чем за полсекунды. Если зритель не может прочитать ваш заголовок на маленьком экране телефона, изображение проваливается.

Я перепробовал несколько промптов. Большинство результатов были катастрофическими.

  • ИИ отрисовал «FIX IT» расплывчатым, нечитаемым шрифтом.
  • Он допускал ошибки в словах, например, «FIXX IT».
  • Он размещал текст там, где его перекроет таймкод YouTube.

Как разработчик, я ожидаю, что инструменты будут выдавать ошибки с четкими сообщениями. ИИ ошибается иначе. Он ошибается тихо и хаотично. Здесь нет логов ошибок. Вы просто каждый раз получаете новый неверный ответ.

Проблема носит архитектурный характер. Модели изображений — это не движки верстки. Они не понимают, что такое ограничивающие рамки (bounding boxes) или читаемость текста. Они создают пиксели, которые выглядят правильно, но не работают эффективно.

Я протестировал Thumbs.ai, чтобы проверить, исправляют ли это специализированные инструменты. Это был шаг вперед, так как сервис отделяет фон от текста, что позволяет работать со слоями. Однако автоматические предложения шрифтов всё равно казались не соответствующими визуальному настроению.

Мне пришлось изменить свое восприятие.

Инструменты «текст-в-превью» — это не конвейер сборки. Это генератор каркаса (scaffolding). Они полезны для старта, но не могут выдать готовый к публикации результат без проверки человеком.

Рабочий процесс, который действительно эффективен, выглядит так:

  • Используйте ИИ для генерации высококачественных фоновых изображений без текста.
  • Импортируйте эти фоны в свой собственный редактор.
  • Добавляйте свой текст, шрифты и тени вручную.

Этот метод занял у меня четыре минуты. Это гораздо быстрее, чем искать стоковые фото или вырезать сложные фоны.

Мои выводы для авторов:

  • ИИ — это не замена дизайну. Это способ создания исходного материала.
  • Рендеринг текста сейчас ненадежен. Занимайтесь типографикой самостоятельно.
  • Реальная ценность заключается в генерации фонов и поиске концепций.

ИИ может передать настроение, но он не может клонировать успешную формулу. Он решает легкие части задачи, но не сложные.

Источник: https://dev.to/sophie_bella_5f438de0c1c3/i-tried-to-automate-my-thumbnail-pipeline-with-ai-at-3-am-heres-what-actually-happened-1be5