Google ਦਾ Gemini-SQL2 Text-to-SQL ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਨਵਾਂ ਬੈਂਚਮਾਰਕ ਸਥਾਪਿਤ ਕਰਦਾ ਹੈ
Google Research ਨੇ Gemini-SQL2 ਨੂੰ ਪੇਸ਼ ਕੀਤਾ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ text-to-SQL ਸਿਸਟਮ ਹੈ ਜੋ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਨੂੰ ਡਾਟਾਬੇਸ ਕੁਐਰੀਆਂ ਵਿੱਚ ਬਦਲਣ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਮੌਜੂਦਾ ਉਦਯੋਗਿਕ ਲੀਡਰਾਂ ਨਾਲੋਂ ਕਿਤੇ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਉੱਨਤ Gemini 3.1 Pro ਆਰਕੀਟੈਕਚਰ 'ਤੇ ਅਧਾਰਤ, ਇਹ ਨਵਾਂ ਮਾਡਲ ਇਸ ਗੱਲ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਪ੍ਰਗਤੀ ਹੈ ਕਿ ਮਨੁੱਖ ਗੁੰਝਲਦਾਰ ਸੰਰਚਨਾਤਮਕ ਡਾਟਾ (structured data) ਨਾਲ ਕਿਵੇਂ ਗੱਲਬਾਤ ਕਰਦੇ ਹਨ।
BIRD ਬੈਂਚਮਾਰਕ ਲੀਡਰਬੋਰਡ 'ਤੇ ਦਬਦਬਾ
Gemini-SQL2 ਦਾ ਅਸਲ ਪ੍ਰਭਾਵ BIRD (Big Bench for Intelligent Retrieval and Database) ਬੈਂਚਮਾਰਕ 'ਤੇ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ ਸਪਸ਼ਟ ਹੁੰਦਾ ਹੈ। ਇਹ ਵਿਸ਼ੇਸ਼ ਬੈਂਚਮਾਰਕ ਇਸ ਗੱਲ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ ਕਿ ਇੱਕ AI ਕਿੰਨੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਨੂੰ ਚਲਾਉਣਯੋਗ SQL ਕੁਐਰੀਆਂ ਵਿੱਚ ਬਦਲ ਸਕਦਾ ਹੈ ਜੋ ਸਹੀ ਨਤੀਜੇ ਦਿੰਦੀਆਂ ਹਨ।
Gemini-SQL2 ਨੇ 80.04 ਪ੍ਰਤੀਸ਼ਤ ਦੀ ਹੈਰਾਨੀਜਨਕ execution accuracy ਪ੍ਰਾਪਤ ਕੀਤੀ ਹੈ, ਜਿਸ ਨਾਲ ਲੀਡਰਬੋਰਡ 'ਤੇ ਨਿਸ਼ਚਿਤ ਤੌਰ 'ਤੇ ਪਹਿਲਾ ਸਥਾਨ ਹਾਸਲ ਕੀਤਾ ਹੈ। ਇਸ ਪ੍ਰਾਪਤੀ ਨੂੰ ਸਮਝਣ ਲਈ, ਇਹ Google ਅਤੇ ਇਸਦੇ ਸਭ ਤੋਂ ਨੇੜਲੇ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਵਿਚਕਾਰ ਇੱਕ ਵੱਡਾ ਅੰਤਰ ਪੈਦਾ ਕਰਦਾ ਹੈ। OpenAI ਦਾ GPT-5.5-xhigh ਲਗਭਗ 72.8 ਪ੍ਰਤੀਸ਼ਤ ਦੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਦੂਜੇ ਸਥਾਨ 'ਤੇ ਹੈ, ਜਦੋਂ ਕਿ Anthropic ਦਾ Claude Opus 4.6 70.9 ਪ੍ਰਤੀਸ਼ਤ 'ਤੇ ਹੈ। Databricks, AWS, Tencent, ਅਤੇ Alibaba ਸਮੇਤ ਹੋਰ ਪ੍ਰਮੁੱਖ ਉਦਯੋਗਿਕ ਖਿਡਾਰੀ ਵੀ ਇਸ ਨਵੇਂ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਪੱਧਰ ਤੋਂ ਕਾਫ਼ੀ ਪਿੱਛੇ ਹਨ।
ਬਿਜ਼ਨਸ ਲੌਜਿਕ ਦੀ ਗੁੰਝਲਤਾ ਨੂੰ ਹੱਲ ਕਰਨਾ
ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਨੂੰ SQL ਵਿੱਚ ਬਦਲਣਾ ਸਧਾਰਨ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਮੁਸ਼ਕਲ ਹੈ। Google Research ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ ਅਸਲ ਦੁਨੀਆ ਦੇ ਡਾਟਾਬੇਸ ਵਾਤਾਵਰਣ ਸ਼ਾਇਦ ਹੀ ਕਦੇ ਸਿੱਧੇ ਹੁੰਦੇ ਹਨ; ਡਾਟਾ ਅਕਸਰ ਬਹੁਤ ਸਾਰੀਆਂ ਪਰਤਾਂ ਵਿੱਚ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਕੁਐਰੀਆਂ ਨੂੰ ਉਪਯੋਗੀ ਹੋਣ ਲਈ ਗੁੰਝਲਦਾਰ, ਬਹੁ-ਪੜਾਵੀ ਬਿਜ਼ਨਸ ਲੌਜਿਕ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਣਾ ਪੈਂਦਾ ਹੈ।
ਮੌਜੂਦਾ LLMs ਲਈ ਇੱਕ ਆਮ ਅਸਫਲਤਾ ਦਾ ਕਾਰਨ "syntactically correct" SQL ਤਿਆਰ ਕਰਨਾ ਹੈ, ਜੋ schema ਰਿਲੇਸ਼ਨਸ਼ਿਪ ਦੀ ਗਲਤ ਸਮਝ ਕਾਰਨ "logically correct" ਉੱਤਰ ਦੇਣ ਵਿੱਚ ਅਸਫਲ ਰਹਿੰਦਾ ਹੈ। Gemini-SQL2 ਇਸ ਨੂੰ ਇਹ ਯਕੀਨੀ ਬਣਾ ਕੇ ਹੱਲ ਕਰਦਾ ਹੈ ਕਿ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਕੁਐਰੀਆਂ ਨਾ ਸਿਰਫ਼ ਸੰਰਚਨਾਤਮਕ ਤੌਰ 'ਤੇ ਸਹੀ ਹਨ, ਸਗੋਂ ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਮੰਗੇ ਗਏ ਸਹੀ ਡਾਟਾ ਨੂੰ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਸਫਲਤਾਪੂਰਵਕ ਚੱਲਦੀਆਂ ਵੀ ਹਨ। ਇਹ ਸਮਰੱਥਾ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਿੱਥੇ ਇੱਕ ਗਲਤ join ਜਾਂ filter ਬਿਜ਼ਨਸ ਇਨਸਾਈਟਸ ਨੂੰ ਬਹੁਤ ਗਲਤ ਬਣਾ ਸਕਦਾ ਹੈ।
ਡਾਟਾ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਭਵਿੱਖ ਲਈ ਪ੍ਰਭਾਵ
ਹਾਲਾਂਕਿ Google ਨੇ ਅਜੇ ਤੱਕ Gemini-SQL2 ਲਈ ਕੋਈ ਰਸਮੀ ਖੋਜ ਪੱਤਰ ਜਾਰੀ ਨਹੀਂ ਕੀਤਾ ਹੈ ਜਾਂ ਜਨਤਕ ਰਿਲੀਜ਼ ਦੀ ਮਿਤੀ ਦਾ ਐਲਾਨ ਨਹੀਂ ਕੀਤਾ ਹੈ, ਪਰ ਵਿਆਪਕ AI परिदृश्य ਲਈ ਇਸਦੇ ਪ੍ਰਭਾਵ ਬਹੁਤ ਡੂੰਘੇ ਹਨ। ਜਿਵੇਂ-ਜਿਵੇਂ LLMs ਸੰਰਚਿਤ ਡੇਟਾ ਮੈਨੀਪੂਲੇਸ਼ਨ ਵਿੱਚ ਵਧੇਰੇ ਨਿਪੁੰਨ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਗੈਰ-ਤਕਨੀਕੀ ਉਪਭੋਗਤਾਵਾਂ ਅਤੇ ਵਿਸ਼ਾਲ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਡੇਟਾ ਵੇਅਰਹਾਊਸਾਂ ਵਿਚਕਾਰ ਰੁਕਾਵਟਾਂ ਲਗਾਤਾਰ ਖਤਮ ਹੁੰਦੀਆਂ ਰਹਿਣਗੀਆਂ।
ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਸਥਾਪਕਾਂ ਲਈ, ਇਹ ਵਿਕਾਸ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਡੇਟਾ ਲਈ "Natural Language Interfaces" ਇੱਕ ਵਿਲਾਸਤਾ ਦੀ ਬਜਾਏ ਇੱਕ ਮਿਆਰੀ ਵਿਸ਼ੇਸ਼ਤਾ ਬਣ ਜਾਣਗੇ। ਅਸੀਂ Google ਦੀਆਂ ਡੇਟਾ ਸੇਵਾਵਾਂ ਦੇ ਪੂਰੇ ਸੂਟ ਵਿੱਚ ਵਧੇਰੇ ਬਿਹਤਰ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਖੰਡਿਤ ਹੋਣ ਦੀ ਉਮੀਦ ਕਰ ਸਕਦੇ ਹਾਂ, ਜੋ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਨੂੰ ਗੁੰਝਲਦਾਰ ਡੇਟਾਬੇਸਾਂ ਵਿੱਚ ਉਨੀ ਹੀ ਆਸਾਨੀ ਨਾਲ ਕੁਐਰੀ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦੇਵੇਗੀ ਜਿੰਨੀ ਆਸਾਨੀ ਨਾਲ ਉਹ ਕਿਸੇ ਸਾਥੀ ਤੋਂ ਸਵਾਲ ਪੁੱਛਦੇ ਹਨ। ਭਰੋਸੇਯੋਗ, ਉੱਚ-ਸ਼ੁੱਧਤਾ ਵਾਲੇ text-to-SQL ਵੱਲ ਇਹ ਕਦਮ AI-ਅਧਾਰਿਤ ਡੇਟਾ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਸੱਚਮੁੱਚ ਖੁਦਮੁਖਤਿਆਰ ਅਤੇ ਵਿਸਥਾਰਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ।
ਮੁੱਖ ਨੁਕਤੇ
- ਬੈਂਚਮਾਰਕ ਲੀਡਰਸ਼ਿਪ: Gemini-SQL2 ਨੇ BIRD ਬੈਂਚਮਾਰਕ 'ਤੇ 80.04% ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕੀਤੀ, ਜੋ ਕਿ OpenAI (72.8%) ਅਤੇ Anthropic (70.9%) ਨਾਲੋਂ ਕਾਫ਼ੀ ਅੱਗੇ ਹੈ।
- ਆਰਕੀਟੈਕਚਰਲ ਫਾਊਂਡੇਸ਼ਨ: ਇਹ ਸਿਸਟਮ Gemini 3.1 Pro ਮਾਡਲ 'ਤੇ ਬਣਿਆ ਹੈ, ਜੋ ਖਾਸ ਤੌਰ 'ਤੇ ਗੁੰਝਲਦਾਰ ਡੇਟਾਬੇਸ ਸਕੀਮਾ ਅਤੇ ਬਾਰੀਕ ਕਾਰੋਬਾਰੀ ਤਰਕ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਗਿਆ ਹੈ।
- ਐਂਟਰਪ੍ਰਾਈਜ਼ ਪ੍ਰਭਾਵ: ਇਹ ਕ੍ਰਾਂਤੀ ਡੇਟਾ ਸੇਵਾਵਾਂ ਵਿੱਚ ਵਧੇਰੇ ਭਰੋਸੇਯੋਗ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਇੰਟਰਫੇਸਾਂ ਲਈ ਰਾਹ ਪੱਧਰਾ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਕੱਚੇ ਡੇਟਾ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਜਾਣਕਾਰੀ ਵਿਚਕਾਰਲੀ ਦੂਰੀ ਘਟਦੀ ਹੈ।