Gemini-SQL2 گوگل معیار جدیدی را در دقت تبدیل متن به SQL تعیین می‌کند

بخش تحقیقات گوگل از Gemini-SQL2 رونمایی کرد؛ یک سیستم قدرتمند تبدیل متن به SQL که در ترجمه زبان طبیعی به پرس‌وجوهای پایگاه داده، به‌طور قابل‌توجهی از پیشگامان فعلی صنعت پیشی می‌گیرد. این مدل جدید که بر پایه معماری پیشرفته Gemini 3.1 Pro ساخته شده است، جهشی بزرگ در نحوه تعامل انسان با داده‌های ساختاریافته پیچیده محسوب می‌شود.

تسلط بر جدول امتیازات معیار BIRD

تأثیر واقعی Gemini-SQL2 در عملکرد آن در معیار BIRD (Big Bench for Intelligent Retrieval and Database) بیش از هر جای دیگری مشهود است. این معیار تخصصی ارزیابی می‌کند که یک هوش مصنوعی با چه دقتی می‌تواند زبان انسانی را به پرس‌وجوهای SQL قابل اجرا تبدیل کند که نتایج صحیحی به همراه داشته باشند.

Gemini-SQL2 به دقت اجرای خیره‌کننده ۸۰.۰۴ درصد دست یافت و جایگاه نخست را در جدول امتیازات از آن خود کرد. برای درک بهتر این دستاورد، باید گفت که این میزان، شکاف عظیمی میان گوگل و نزدیک‌ترین رقبای آن ایجاد کرده است. مدل GPT-5.5-xhigh از OpenAI با دقتی در حدود ۷۲.۸ درصد در رتبه دوم قرار دارد، در حالی که Claude Opus 4.6 از Anthropic با ۷۰.۹ درصد در جایگاه بعدی است. سایر بازیگران بزرگ این صنعت، از جمله Databricks، AWS، Tencent و Alibaba، همگی با فاصله قابل‌توجهی از این سقف عملکرد جدید عقب مانده‌اند.

حل پیچیدگی‌های منطق کسب‌وکار

تبدیل زبان طبیعی به SQL بسیار دشوارتر از تولید متن استاندارد است. بخش تحقیقات گوگل خاطرنشان می‌کند که محیط‌های پایگاه داده در دنیای واقعی به‌ندرت ساده هستند؛ داده‌ها اغلب دارای لایه‌های متعدد هستند و پرس‌وجوها برای کاربردی بودن، باید منطق پیچیده و چندمرحله‌ای کسب‌وکار را در نظر بگیرند.

یکی از نقاط شکست رایج در مدل‌های زبانی بزرگ (LLM) فعلی، تولید SQL «از نظر نحو صحیح» (syntactically correct) است که به دلیل درک نادرست از روابط طرح‌واره (schema)، در ارائه پاسخ «از نظر منطقی صحیح» (logically correct) شکست می‌خورند. Gemini-SQL2 این مشکل را با اطمینان از اینکه پرس‌وجوهای تولیدشده نه تنها از نظر ساختاری سالم هستند، بلکه با موفقیت اجرا می‌شوند تا دقیقاً همان داده‌های درخواستی کاربر را ارائه دهند، برطرف می‌کند. این قابلیت برای کاربردهای سازمانی که در آن‌ها یک اتصال (join) یا فیلتر اشتباه می‌تواند منجر به تحلیل‌های تجاری فاجعه‌بار و نادرست شود، حیاتی است.

پیامدها برای آینده هوش داده‌ها

اگرچه گوگل هنوز مقاله پژوهشی رسمی یا تاریخ انتشار عمومی برای Gemini-SQL2 اعلام نکرده است، اما پیامدهای آن برای چشم‌انداز گسترده‌تر هوش مصنوعی بسیار عمیق است. با ماهرتر شدن LLMها در دستکاری داده‌های ساختاریافته، اصطکاک بین کاربران غیرفنی و انبارهای داده عظیم سازمانی به تدریج از بین خواهد رفت.

برای توسعه‌دهندگان و بنیان‌گذاران، این پیشرفت نشان‌دهنده آینده‌ای است که در آن «رابط‌های زبان طبیعی» (Natural Language Interfaces) برای داده‌ها، به جای یک ویژگی لوکس، به یک قابلیت استاندارد تبدیل می‌شوند. می‌توان انتظار داشت که ویژگی‌های پیشرفته زبان طبیعی در تمام مجموعه خدمات داده گوگل ادغام شوند و به تحلیلگران اجازه دهند تا به همان راحتی که از یک همکار سوال می‌پرسند، از پایگاه‌های داده پیچیده پرس‌وجو کنند. این حرکت به سمت text-to-SQL قابل اعتماد و با دقت بالا، گامی حیاتی در جهت خودگردان و مقیاس‌پذیر کردن هوش داده‌محور مبتنی بر هوش مصنوعی است.

نکات کلیدی

  • پیشتازی در بنچمارک: Gemini-SQL2 به دقت اجرای ۸۰.۰۴٪ در بنچمارک BIRD دست یافت که به طور قابل توجهی از OpenAI (۷۲.۸٪) و Anthropic (۷۰.۹٪) پیشی گرفته است.
  • بنیان معماری: این سیستم بر پایه مدل Gemini 3.1 Pro ساخته شده است که به طور ویژه برای مدیریت schemaهای پیچیده پایگاه داده و منطق تجاری دشوار بهینه‌سازی شده است.
  • تأثیر سازمانی: این پیشرفت راه را برای رابط‌های زبان طبیعی قابل اعتمادتر در خدمات داده هموار می‌کند و شکاف بین داده‌های خام و بینش‌های کاربردی را کاهش می‌دهد.