ಟೆಕ್ಸ್ಟ್ ಟು SQL ನಿಖರತೆಯಲ್ಲಿ ಗೂಗಲ್‌ನ ಜೆಮಿನಿ SQL2 ಹೊಸ ಮಾನದಂಡವನ್ನು ಸ್ಥಾಪಿಸಿದೆ

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 ವಾರಗಳ ಹಿಂದೆ3min read

In this article

Google ನ Gemini-SQL2 ಪಠ್ಯದಿಂದ-SQL ಗೆ (Text-to-SQL) ನಿಖರತೆಯಲ್ಲಿ ಹೊಸ ಮಾನದಂಡವನ್ನು ಸ್ಥಾಪಿಸಿದೆ

Google Research ತನ್ನ Gemini-SQL2 ಅನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ. ಇದು ನೈಸರ್ಗಿಕ ಭಾಷೆಯನ್ನು ಡೇಟಾಬೇಸ್ ಪ್ರಶ್ನೆಗಳಾಗಿ (queries) ಪರಿವರ್ತಿಸುವಲ್ಲಿ ಪ್ರಸ್ತುತ ಉದ್ಯಮದ ಮುಂಚೂಣಿಯಲ್ಲಿರುವ ವ್ಯವಸ್ಥೆಗಳಿಗಿಂತ ಗಮನಾರ್ಹವಾಗಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಶಕ್ತಿಯುತ text-to-SQL ವ್ಯವಸ್ಥೆಯಾಗಿದೆ. ಸುಧಾರಿತ Gemini 3.1 Pro ಆರ್ಕಿಟೆಕ್ಚರ್ ಮೇಲೆ ನಿರ್ಮಿಸಲಾದ ಈ ಹೊಸ ಮಾಡೆಲ್, ಮನುಷ್ಯರು ಸಂಕೀರ್ಣವಾದ ರಚನಾತ್ಮಕ ಡೇಟಾದೊಂದಿಗೆ (structured data) ಹೇಗೆ ಸಂವಹನ ನಡೆಸುತ್ತಾರೆ ಎಂಬುದರಲ್ಲಿ ಒಂದು ದೊಡ್ಡ ಪ್ರಗತಿಯನ್ನು ಸೂಚಿಸುತ್ತದೆ.

BIRD ಬೆಂಚ್‌ಮಾರ್ಕ್ ಲೀಡರ್‌ಬೋರ್ಡ್‌ನಲ್ಲಿ ಪ್ರಾಬಲ್ಯ

Gemini-SQL2 ನ ನಿಜವಾದ ಪ್ರಭಾವವು BIRD (Big Bench for Intelligent Retrieval and Database) ಬೆಂಚ್‌ಮಾರ್ಕ್‌ನಲ್ಲಿ ಅದರ ಕಾರ್ಯಕ್ಷಮತೆಯಲ್ಲಿ ಸ್ಪಷ್ಟವಾಗಿ ಕಂಡುಬರುತ್ತದೆ. ಈ ವಿಶೇಷ ಬೆಂಚ್‌ಮಾರ್ಕ್, ಒಂದು AI ಮನುಷ್ಯನ ಭಾಷೆಯನ್ನು ಸರಿಯಾದ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುವ ಕಾರ್ಯಗತ SQL ಪ್ರಶ್ನೆಗಳಾಗಿ (executable SQL queries) ಎಷ್ಟು ನಿಖರವಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ.

Gemini-SQL2 ಶೇಕಡಾ 80.04 ರಷ್ಟು ಅದ್ಭುತವಾದ ಕಾರ್ಯಗತ ನಿಖರತೆಯನ್ನು (execution accuracy) ಸಾಧಿಸಿ, ಲೀಡರ್‌ಬೋರ್ಡ್‌ನಲ್ಲಿ ಖಚಿತವಾಗಿ ಮೊದಲ ಸ್ಥಾನವನ್ನು ಪಡೆದುಕೊಂಡಿದೆ. ಈ ಸಾಧನೆಯನ್ನು ಗಮನಿಸಿದರೆ, ಇದು Google ಮತ್ತು ಅದರ ಹತ್ತಿರದ ಸ್ಪರ್ಧಿಗಳ ನಡುವೆ ದೊಡ್ಡ ಅಂತರವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ. OpenAI ನ GPT-5.5-xhigh ಸುಮಾರು ಶೇಕಡಾ 72.8 ರಷ್ಟು ನಿಖರತೆಯನ್ನು ಹೊಂದಿದ್ದರೆ, Anthropic ನ Claude Opus 4.6 ಶೇಕಡಾ 70.9 ರಲ್ಲಿದೆ. Databricks, AWS, Tencent ಮತ್ತು Alibaba ಸೇರಿದಂತೆ ಇತರ ಪ್ರಮುಖ ಉದ್ಯಮದ ಸಂಸ್ಥೆಗಳು ಈ ಹೊಸ ಕಾರ್ಯಕ್ಷಮತೆಯ ಮಟ್ಟಕ್ಕಿಂತ ಸಾಕಷ್ಟು ಹಿಂದೆ ಇವೆ.

ಬಿಸಿನೆಸ್ ಲಾಜಿಕ್‌ನ ಸಂಕೀರ್ಣತೆಯನ್ನು ಪರಿಹರಿಸುವುದು

ನೈಸರ್ಗಿಕ ಭಾಷೆಯನ್ನು SQL ಗೆ ಪರಿವರ್ತಿಸುವುದು ಸಾಮಾನ್ಯ ಪಠ್ಯ ರಚನೆಗಿಂತ (text generation) ಹೆಚ್ಚು ಕಷ್ಟಕರವಾಗಿದೆ. ನೈಜ ಪ್ರಪಂಚದ ಡೇಟಾಬೇಸ್ ಪರಿಸರಗಳು ಅಪರೂಪಕ್ಕೆ ಮಾತ್ರ ಸರಳವಾಗಿರುತ್ತವೆ; ಡೇಟಾವು ಹೆಚ್ಚಾಗಿ ಅನೇಕ ಪದರಗಳನ್ನು ಹೊಂದಿರುತ್ತದೆ ಮತ್ತು ಪ್ರಶ್ನೆಗಳು ಉಪಯುಕ್ತವಾಗಬೇಕಾದರೆ ಸಂಕೀರ್ಣವಾದ, ಬಹು-ಹಂತದ ಬಿಸಿನೆಸ್ ಲಾಜಿಕ್ ಅನ್ನು ಪರಿಗಣಿಸಬೇಕಾಗುತ್ತದೆ ಎಂದು Google Research ಗಮನಿಸಿದೆ.

ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ LLM ಗಳಿಗೆ ಸಾಮಾನ್ಯ ವೈಫಲ್ಯದ ಅಂಶವೆಂದರೆ, ಸ್ಕೀಮಾ ಸಂಬಂಧಗಳ (schema relationships) ತಪ್ಪು ತಿಳುವಳಿಕೆಯಿಂದಾಗಿ "ವ್ಯಾಕರಣಬದ್ಧವಾಗಿ ಸರಿಯಾದ" (syntactically correct) SQL ಅನ್ನು ರಚಿಸುವುದು, ಆದರೆ ಅದು "ತಾರ್ಕಿಕವಾಗಿ ಸರಿಯಾದ" (logically correct) ಉತ್ತರವನ್ನು ನೀಡಲು ವಿಫಲವಾಗುವುದು. Gemini-SQL2 ಇದನ್ನು ಪರಿಹರಿಸುತ್ತದೆ; ಇದು ರಚಿಸಲಾದ ಪ್ರಶ್ನೆಗಳು ರಚನಾತ್ಮಕವಾಗಿ ಸದೃಢವಾಗಿರದೆ, ಬಳಕೆದಾರರು ಕೇಳಿದ ನಿಖರವಾದ ಡೇಟಾವನ್ನು ಒದಗಿಸಲು ಯಶಸ್ವಿಯಾಗಿ ಕಾರ್ಯಗತಗೊಳ್ಳುವಂತೆ ನೋಡಿಕೊಳ್ಳುತ್ತದೆ. ಎಂಟರ್‌ಪ್ರೈಸ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಈ ಸಾಮರ್ಥ್ಯವು ಬಹಳ ಮುಖ್ಯವಾಗಿದೆ, ಏಕೆಂದರೆ ಅಲ್ಲಿ ಒಂದು ತಪ್ಪಾದ join ಅಥವಾ filter ವ್ಯವಹಾರದ ಒಳನೋಟಗಳನ್ನು (business insights) ವಿಪರೀತ ತಪ್ಪಾಗಿ ತೋರಿಸಬಹುದು.

ಡೇಟಾ ಇಂಟೆಲಿಜೆನ್ಸ್‌ನ ಭವಿಷ್ಯದ ಮೇಲಿನ ಪರಿಣಾಮಗಳು

Google ಇನ್ನೂ Gemini-SQL2 ಗಾಗಿ ಅಧಿಕೃತ ಸಂಶೋಧನಾ ಪ್ರಬಂಧವನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿಲ್ಲ ಅಥವಾ ಸಾರ್ವಜನಿಕ ಬಿಡುಗಡೆಯ ದಿನಾಂಕವನ್ನು ಘೋಷಿಸಿಲ್ಲವಾದರೂ, ವಿಶಾಲವಾದ AI ವಲಯದ ಮೇಲೆ ಇದರ ಪರಿಣಾಮಗಳು ಆಳವಾಗಿವೆ. LLMಗಳು ರಚನಾತ್ಮಕ ಡೇಟಾ ನಿರ್ವಹಣೆಯಲ್ಲಿ ಹೆಚ್ಚು ಪರಿಣಿತರಾಗುತ್ತಿದ್ದಂತೆ, ತಾಂತ್ರಿಕ ಜ್ಞಾನವಿಲ್ಲದ ಬಳಕೆದಾರರು ಮತ್ತು ಬೃಹತ್ ಎಂಟರ್‌ಪ್ರೈಸ್ ಡೇಟಾ ವೇರ್‌ಹೌಸ್‌ಗಳ ನಡುವಿನ ಅಡೆತಡೆಗಳು ನಿರಂತರವಾಗಿ ಕರಗುತ್ತಾ ಹೋಗುತ್ತವೆ.

ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಸಂಸ್ಥಾಪಕರಿಗೆ, ಈ ಬೆಳವಣಿಗೆಯು ಡೇಟಾಕ್ಕಾಗಿ "Natural Language Interfaces" ಎಂಬುದು ಒಂದು ಐಷಾರಾಮಿ ವಸ್ತುವಿಗಿಂತ ಹೆಚ್ಚಾಗಿ ಒಂದು ಪ್ರಮಾಣಿತ ವೈಶಿಷ್ಟ್ಯವಾಗಿ ಬದಲಾಗುವ ಭವಿಷ್ಯವನ್ನು ಸೂಚಿಸುತ್ತದೆ. Google ನ ಸಂಪೂರ್ಣ ಡೇಟಾ ಸೇವೆಗಳಾದ್ಯಂತ ಸುಧಾರಿತ ನೈಸರ್ಗಿಕ ಭಾಷಾ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನಾವು ನಿರೀಕ್ಷಿಸಬಹುದು, ಇದು ವಿಶ್ಲೇಷಕರು ಸಹೋದ್ಯೋಗಿಯನ್ನು ಪ್ರಶ್ನೆ ಕೇಳುವಷ್ಟೇ ಸುಲಭವಾಗಿ ಸಂಕೀರ್ಣ ಡೇಟಾಬೇಸ್‌ಗಳನ್ನು ಪ್ರಶ್ನಿಸಲು (query) ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ವಿಶ್ವಾಸಾರ್ಹ ಮತ್ತು ಹೆಚ್ಚಿನ ನಿಖರತೆಯ text-to-SQL ಕಡೆಗೆ ಸಾಗುತ್ತಿರುವ ಈ ಚಲನೆಯು, AI ಚಾಲಿತ ಡೇಟಾ ಇಂಟೆಲಿಜೆನ್ಸ್ ಅನ್ನು ನಿಜವಾಗಿಯೂ ಸ್ವಾಯತ್ತ ಮತ್ತು ವಿಸ್ತರಿಸಬಹುದಾದ ಆಗಿ ಮಾಡುವಲ್ಲಿ ಒಂದು ನಿರ್ಣಾಯಕ ಹಂತವಾಗಿದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

ಬೆಂಚ್‌ಮಾರ್ಕ್ ನಾಯಕತ್ವ: Gemini-SQL2, BIRD benchmark ನಲ್ಲಿ 80.04% ಕಾರ್ಯಗತಗೊಳಿಸುವ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸಿದೆ, ಇದು OpenAI (72.8%) ಮತ್ತು Anthropic (70.9%) ಅನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಹಿಂದಿಕ್ಕಿದೆ.
ವಾಸ್ತುಶಿಲ್ಪದ ಅಡಿಪಾಯ: ಈ ವ್ಯವಸ್ಥೆಯು Gemini 3.1 Pro ಮಾಡೆಲ್ ಮೇಲೆ ನಿರ್ಮಿತವಾಗಿದೆ, ಇದನ್ನು ಸಂಕೀರ್ಣ ಡೇಟಾಬೇಸ್ ಸ್ಕೀಮಾಗಳು ಮತ್ತು ಜಟಿಲವಾದ ವ್ಯವಹಾರ ತರ್ಕವನ್ನು ನಿರ್ವಹಿಸಲು ವಿಶೇಷವಾಗಿ ಉತ್ತಮಗೊಳಿಸಲಾಗಿದೆ.
ಎಂಟರ್‌ಪ್ರೈಸ್ ಪ್ರಭಾವ: ಈ ಮಹತ್ವದ ಬೆಳವಣಿಗೆಯು ಡೇಟಾ ಸೇವೆಗಳಲ್ಲಿ ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹ ನೈಸರ್ಗಿಕ ಭಾಷಾ ಇಂಟರ್‌ಫೇಸ್‌ಗಳಿಗೆ ದಾರಿ ಮಾಡಿಕೊಡುತ್ತದೆ, ಇದು ಕಚ್ಚಾ ಡೇಟಾ ಮತ್ತು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದಾದ ಒಳನೋಟಗಳ ನಡುವಿನ ಅಂತರವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.