Стоимость проверки — это и есть реальная стоимость ИИ-программирования

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorial6 дней назад2мин чтения

Стоимость проверки — это и есть реальная стоимость ИИ-программирования

Стоимость проверки — это и есть реальная стоимость ИИ-кодинга

Раньше при выборе ИИ-модели для написания кода я задавал один вопрос.

Какая модель достаточно мощная для этой задачи?

Этот вопрос вполне уместен. Но теперь он больше не первый.

Лучший вопрос звучит так: Как быстро я смогу проверить результат?

Такой подход меняет способ использования дешевых моделей. Не рассматривайте их как слабые версии больших моделей. Воспринимайте их как исполнителей задач с коротким путем проверки.

Некоторые задачи дешевы в плане проверки, потому что результат виден сразу.

• Очистка README • Примеры использования • Комментарии к коду • Заметки в списке изменений (changelog) • Небольшие скрипты форматирования • Шаблоны issue

Если модель напишет плохой абзац в README, вы это сразу заметите. Вы просто удалите неудачную часть. Ошибка раздражает, но она почти ничего вам не стоит. Это лучший способ использования дешевых моделей.

Следующая категория — задачи, поддающиеся тестированию.

Если вы можете определить ожидаемое поведение и запустить набор тестов, используйте более дешевую модель для создания черновика. Вы должны задать модели четкие границы.

Не говорите: Добавь тесты для этого хелпера.

Говорите: Добавь тесты для пустого ввода, ввода null, дублирующихся значений, неверной конфигурации, конфигурации по умолчанию и обычного ввода. Не меняй рабочий код.

Это заставляет модель работать в рамках процесса проверки.

Некоторым задачам не хватает автоматизированных тестов, но они допускают четкую ручную проверку.

• Форматирование вывода CLI • Примеры конфигурации • Заметки по пробному запуску миграции (dry run) • Небольшие скрипты конвертации данных

Для таких задач просите модель включить:

Как запустить код
Какие входные данные использовать
Какого результата ожидать
Какие граничные случаи проверить

Если модель не может объяснить, как проверить её собственную работу, не доверяйте этому коду.

Небольшие рефакторинги опасны. Дифф может выглядеть коротким и чистым, но поведение может измениться в скрытом пути, значении по умолчанию или проверке прав доступа.

Повышайте уровень осторожности, если задача затрагивает:

Резервные механизмы (fallbacks)
Значения по умолчанию
Маршрутизацию
Права доступа
Биллинг
Лимиты запросов (rate limits)
Миграции
Обратную совместимость

Такие ошибки трудно заметить при обычном код-ревью. Они требуют глубокого понимания контекста.

Распределяйте работу в зависимости от стоимости проверки:

Низкая стоимость проверки: используйте дешевую модель для создания черновика.
Средняя стоимость проверки: используйте дешевую модель, затем правки человеком.
Высокая стоимость проверки: используйте мощную модель с тестами и проверкой человеком.

Размер не имеет значения. Маленькая задача может быть дорогой, если её трудно проверить.

Самая дорогая часть ИИ-кодинга — это не генерация. Это доверие.

Source: https://dev.to/zephyrelabs369/verification-cost-is-the-real-ai-coding-cost-1354

Optional learning community: https://t.me/GyaanSetuAi

Стоимость проверки — это и есть реальная стоимость ИИ-программирования

Стоимость проверки — это и есть реальная стоимость ИИ-кодинга

Продолжить чтение

Лестница верификации для бюджетных моделей ИИ для написания кода

Программирование передового уровня по цене бюджетного сегмента