Gemini SQL2 Google Menetapkan Penanda Aras Baharu dalam Ketepatan Teks ke SQL

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 minggu lalu3min read

In this article

Gemini-SQL2 Google Menetapkan Penanda Aras Baharu dalam Ketepatan Text-to-SQL

Google Research telah memperkenalkan Gemini-SQL2, sebuah sistem text-to-SQL yang berkuasa tinggi yang mengatasi pemimpin industri semasa secara signifikan dalam menterjemah bahasa tabii kepada pertanyaan pangkalan data. Dibina berasaskan seni bina Gemini 3.1 Pro yang canggih, model baharu ini menandakan lonjakan besar dalam cara manusia berinteraksi dengan data berstruktur yang kompleks.

Mendominasi Papan Pendahulu Penanda Aras BIRD

Impak sebenar Gemini-SQL2 paling ketara dalam prestasinya pada penanda aras BIRD (Big Bench for Intelligent Retrieval and Database). Penanda aras khusus ini menilai sejauh mana ketepatan AI dalam menterjemah bahasa manusia kepada pertanyaan SQL yang boleh dilaksanakan untuk menghasilkan keputusan yang betul.

Gemini-SQL2 mencapai ketepatan pelaksanaan yang menakjubkan sebanyak 80.04 peratus, sekali gus mengamankan tempat pertama yang mutlak dalam papan pendahulu. Untuk memberi gambaran tentang pencapaian ini, ia mewujudkan jurang yang besar antara Google dan pesaing terdekatnya. GPT-5.5-xhigh daripada OpenAI menyusul dengan ketepatan kira-kira 72.8 peratus, manakala Claude Opus 4.6 daripada Anthropic berada pada tahap 70.9 peratus. Pemain industri utama yang lain, termasuk Databricks, AWS, Tencent, dan Alibaba, semuanya ketinggalan jauh di belakang siling prestasi baharu ini.

Menyelesaikan Kerumitan Logik Perniagaan

Menterjemah bahasa tabii kepada SQL adalah jauh lebih sukar berbanding penjanaan teks standard. Google Research menyatakan bahawa persekitaran pangkalan data dunia nyata jarang sekali mudah; data sering kali berlapis-lapis, dan pertanyaan mesti mengambil kira logik perniagaan pelbagai langkah yang rumit untuk menjadi berguna.

Titik kegagalan biasa bagi LLM sedia ada adalah menjana SQL yang "betul dari segi sintaks" tetapi gagal memberikan jawapan yang "betul dari segi logik" disebabkan oleh salah faham terhadap hubungan skema. Gemini-SQL2 menangani perkara ini dengan memastikan pertanyaan yang dijana bukan sahaja kukuh dari segi struktur, tetapi juga dilaksanakan dengan berjaya untuk menyediakan data tepat yang diminta oleh pengguna. Keupayaan ini sangat penting untuk aplikasi perusahaan di mana satu join atau penapis yang salah boleh membawa kepada cerapan perniagaan yang salah dan membawa bencana.

Implikasi untuk Masa Depan Kecerdasan Data

Walaupun Google belum lagi menerbitkan kertas penyelidikan rasmi atau mengumumkan tarikh pelancaran awam untuk Gemini-SQL2, implikasinya terhadap landskap AI yang lebih luas adalah sangat mendalam. Memandangkan LLM menjadi lebih mahir dalam manipulasi data berstruktur, geseran antara pengguna bukan teknikal dan gudang data perusahaan yang besar akan terus berkurangan.

Bagi pembangun dan pengasas, perkembangan ini mencadangkan masa depan di mana "Antara Muka Bahasa Tabii" untuk data menjadi ciri standard dan bukannya satu kemewahan. Kita boleh menjangkakan ciri bahasa tabii yang dipertingkatkan akan disepadukan ke seluruh rangkaian perkhidmatan data Google, membolehkan penganalisis membuat pertanyaan pada pangkalan data yang kompleks semudah mereka bertanya soalan kepada rakan sekerja. Peralihan ke arah text-to-SQL yang boleh dipercayai dan berketepatan tinggi ini merupakan langkah kritikal dalam menjadikan kecerdasan data dipacu AI benar-benar autonomi dan boleh skala.

Rumusan Utama

Kepimpinan Penanda Aras: Gemini-SQL2 mencapai ketepatan pelaksanaan sebanyak 80.04% pada penanda aras BIRD, mengatasi OpenAI (72.8%) dan Anthropic (70.9%) dengan ketara.
Asas Seni Bina: Sistem ini dibina berasaskan model Gemini 3.1 Pro, yang dioptimumkan secara khusus untuk mengendalikan skema pangkalan data yang kompleks dan logik perniagaan yang rumit.
Impak Perusahaan: Kejayaan ini membuka jalan kepada antara muka bahasa tabii yang lebih boleh dipercayai dalam perkhidmatan data, sekali gus mengurangkan jurang antara data mentah dan cerapan yang boleh diambil tindakan.