Gemini-SQL2 от Google устанавливает новый стандарт точности преобразования текста в SQL

Google Research представила Gemini-SQL2 — мощную систему преобразования текста в SQL, которая значительно превосходит нынешних лидеров отрасли в переводе естественного языка в запросы к базам данных. Построенная на базе передовой архитектуры Gemini 3.1 Pro, эта новая модель знаменует собой огромный скачок в том, как люди взаимодействуют со сложными структурированными данными.

Доминирование в таблице лидеров бенчмарка BIRD

Истинное влияние Gemini-SQL2 наиболее заметно по результатам тестирования на бенчмарке BIRD (Big Bench for Intelligent Retrieval and Database). Этот специализированный бенчмарк оценивает, насколько точно ИИ может переводить человеческий язык в исполняемые SQL-запросы, которые выдают корректные результаты.

Gemini-SQL2 достигла ошеломляющей точности выполнения в 80,04 процента, заняв безоговорочное первое место в таблице лидеров. Чтобы оценить масштаб этого достижения, стоит отметить, что оно создает огромный разрыв между Google и его ближайшими конкурентами. GPT-5.5-xhigh от OpenAI следует за ней с точностью около 72,8 процента, в то время как Claude Opus 4.6 от Anthropic показывает результат 70,9 процента. Другие крупные игроки отрасли, включая Databricks, AWS, Tencent и Alibaba, значительно отстают от этого нового потолка производительности.

Решение проблем сложности бизнес-логики

Преобразование естественного языка в SQL гораздо сложнее, чем стандартная генерация текста. Google Research отмечает, что реальные среды баз данных редко бывают простыми; данные часто имеют сложную многоуровневую структуру, а запросы должны учитывать запутанную многоэтапную бизнес-логику, чтобы быть полезными.

Распространенной точкой отказа существующих LLM является генерация «синтаксически правильного» SQL, который не выдает «логически верный» ответ из-за неправильного понимания связей в схеме данных. Gemini-SQL2 решает эту проблему, гарантируя, что сгенерированные запросы не только структурно верны, но и успешно выполняются, предоставляя именно те данные, которые запросил пользователь. Эта возможность критически важна для корпоративных приложений, где одно неверное соединение (join) или фильтр могут привести к катастрофически ошибочным бизнес-выводам.

Последствия для будущего интеллектуального анализа данных

Хотя Google еще не опубликовала официальную исследовательскую работу и не объявила дату публичного релиза Gemini-SQL2, последствия этого события для всего ландшафта ИИ будут весьма значительными. По мере того как LLM становятся всё более искусными в манипулировании структурированными данными, барьер между нетехническими пользователями и огромными корпоративными хранилищами данных будет продолжать исчезать.

Для разработчиков и основателей это развитие предвещает будущее, в котором «интерфейсы на естественном языке» для работы с данными станут стандартной функцией, а не роскошью. Можно ожидать появления расширенных возможностей обработки естественного языка, интегрированных во весь пакет сервисов данных Google, что позволит аналитикам запрашивать сложные базы данных так же легко, как они задают вопрос коллеге. Это движение в сторону надежного и высокоточного text-to-SQL является критически важным шагом на пути к созданию по-настоящему автономного и масштабируемого интеллектуального анализа данных на базе ИИ.

Основные выводы

  • Лидерство в бенчмарках: Gemini-SQL2 достигла точности выполнения 80,04% в бенчмарке BIRD, значительно опередив OpenAI (72,8%) и Anthropic (70,9%).
  • Архитектурная основа: Система построена на модели Gemini 3.1 Pro, специально оптимизированной для работы со сложными схемами баз данных и запутанной бизнес-логикой.
  • Влияние на корпоративный сектор: Этот прорыв прокладывает путь к созданию более надежных интерфейсов на естественном языке в сервисах данных, сокращая разрыв между необработанными данными и практическими выводами.