Google-இன் Gemini-SQL2, Text-to-SQL துல்லியத்தில் புதிய மைல்கல்லை எட்டுகிறது
Google Research, Gemini-SQL2-ஐ அறிமுகப்படுத்தியுள்ளது. இது இயற்கை மொழியை (natural language) தரவுத்தள வினவல்களாக (database queries) மாற்றுவதில் தற்போதைய முன்னணி நிறுவனங்களை விட மிகச் சிறப்பாகச் செயல்படும் ஒரு சக்திவாய்ந்த text-to-SQL அமைப்பாகும். மேம்பட்ட Gemini 3.1 Pro கட்டமைப்பின் அடிப்படையில் உருவாக்கப்பட்ட இந்த புதிய மாடல், மனிதர்கள் சிக்கலான கட்டமைக்கப்பட்ட தரவுகளுடன் (complex structured data) எவ்வாறு தொடர்பு கொள்கிறார்கள் என்பதில் ஒரு மிகப்பெரிய முன்னேற்றத்தைக் குறிக்கிறது.
BIRD Benchmark Leaderboard-இல் ஆதிக்கம் செலுத்துதல்
Gemini-SQL2-இன் உண்மையான தாக்கம், BIRD (Big Bench for Intelligent Retrieval and Database) benchmark-இல் அதன் செயல்பாட்டின் மூலம் மிகத் தெளிவாகத் தெரிகிறது. ஒரு AI, மனித மொழியைச் சரியான முடிவுகளைத் தரும் செயல்படுத்தக்கூடிய SQL வினவல்களாக எவ்வளவு துல்லியமாக மாற்றுகிறது என்பதை இந்தச் சிறப்பு benchmark மதிப்பீடு செய்கிறது.
Gemini-SQL2 80.04 சதவீத வியக்கத்தக்கச் செயல்பாட்டுத் துல்லியத்தைப் (execution accuracy) பெற்று, leaderboard-இல் முதலிடத்தைப் பிடித்துள்ளது. இந்தச் சாதனையை ஒப்பிட்டுப் பார்த்தால், Google மற்றும் அதன் நெருக்கமான போட்டியாளர்களுக்கு இடையே இது ஒரு மிகப்பெரிய இடைவெளியை உருவாக்குகிறது. OpenAI-இன் GPT-5.5-xhigh சுமார் 72.8 சதவீதத் துல்லியத்துடன் அடுத்த இடத்தைப் பிடித்துள்ள நிலையில், Anthropic-இன் Claude Opus 4.6 70.9 சதவீதத்தில் உள்ளது. Databricks, AWS, Tencent மற்றும் Alibaba உள்ளிட்ட பிற முக்கியத் தொழில் நிறுவனங்கள் அனைத்தும் இந்த புதிய செயல்திறன் உச்சத்திற்குப் பின்னால் தங்கிவிட்டன.
வணிகத் தர்க்கத்தின் (Business Logic) சிக்கல்களைத் தீர்த்தல்
இயற்கை மொழியை SQL-ஆக மாற்றுவது என்பது சாதாரண உரை உருவாக்கத்தை (text generation) விட மிகவும் கடினமானது. நிஜ உலகத் தரவுத்தளச் சூழல்கள் (database environments) அரிதாகவே எளிமையாக இருக்கும் என்று Google Research குறிப்பிடுகிறது; தரவுகள் பெரும்பாலும் பல அடுக்குகளாக இருக்கும், மேலும் வினவல்கள் பயனுள்ளதாக இருக்க வேண்டுமெனில், அவை சிக்கலான, பல படிநிலைகளைக் கொண்ட வணிகத் தர்க்கங்களைக் (multi-step business logic) கருத்தில் கொள்ள வேண்டும்.
தற்போதுள்ள LLM-களின் பொதுவான தோல்விப் புள்ளி என்னவென்றால், schema உறவுகளைத் தவறாகப் புரிந்துகொள்வதால், "syntactically correct" (தொடரியல் ரீதியாகச் சரியான) SQL-ஐ உருவாக்கினாலும், அது "logically correct" (தர்க்கரீதியாகச் சரியான) பதிலைத் தருவதில் தோல்வியடைகிறது. Gemini-SQL2 இதைச் சரிசெய்கிறது; இது உருவாக்கப்பட்ட வினவல்கள் கட்டமைப்பால் வலுவானதாக இருப்பது மட்டுமல்லாமல், பயனர் கோரிய துல்லியமான தரவை வழங்குவதற்கு வெற்றிகரமாகச் செயல்படுத்தப்படுவதையும் உறுதி செய்கிறது. ஒரு தவறான join அல்லது filter கூட மோசமான வணிகத் தகவல்களுக்கு (business insights) வழிவகுக்கும் நிறுவனப் பயன்பாடுகளுக்கு (enterprise applications) இந்தத் திறன் மிகவும் அவசியமானது.
தரவு நுண்ணறிவின் (Data Intelligence) எதிர்காலத்திற்கான தாக்கங்கள்
Google இன்னும் Gemini-SQL2 க்கான முறையான ஆராய்ச்சித் தாளை வெளியிடவில்லை அல்லது பொது வெளியீட்டுத் தேதியை அறிவிக்கவில்லை என்றாலும், பரந்த AI சூழலில் இதன் தாக்கங்கள் ஆழமானவை. LLM-கள் கட்டமைக்கப்பட்ட தரவுகளைக் கையாளுவதில் அதிகத் திறன் கொண்டதாக மாறும்போது, தொழில்நுட்ப அறிவு இல்லாத பயனர்களுக்கும் மிகப்பெரிய நிறுவன தரவு சேமிப்பகங்களுக்கும் (enterprise data warehouses) இடையிலான சிக்கல்கள் தொடர்ந்து நீக்கப்பட்டு வருகின்றன.
டெவலப்பர்கள் மற்றும் நிறுவனர்களுக்கு, இந்த வளர்ச்சி தரவிற்கான "இயற்கை மொழி இடைமுகங்கள்" (Natural Language Interfaces) ஒரு ஆடம்பரமாக இல்லாமல், ஒரு தரநிலையாக மாறும் எதிர்காலத்தைக் காட்டுகிறது. Google-இன் முழு தரவுச் சேவைகளிலும் மேம்படுத்தப்பட்ட இயற்கை மொழி அம்சங்கள் ஒருங்கிணைக்கப்படுவதை நாம் எதிர்பார்க்கலாம்; இது ஆய்வாளர்கள் ஒரு சக ஊழியரிடம் கேள்வி கேட்பது போலவே சிக்கலான தரவுத்தளங்களை (databases) எளிதாகக் கேள்வி கேட்க அனுமதிக்கும். நம்பகமான, அதிக துல்லியமான text-to-SQL நோக்கிய இந்த நகர்வு, AI மூலம் இயக்கப்படும் தரவு நுண்ணறிவை (data intelligence) உண்மையிலேயே தன்னாட்சி மற்றும் அளவிடக்கூடியதாக (scalable) மாற்றுவதில் ஒரு முக்கியமான படியாகும்.
முக்கியக் குறிப்புகள்
- Benchmark தலைமைத்துவம்: Gemini-SQL2, BIRD benchmark-இல் 80.04% செயலாக்கத் துல்லியத்தை (execution accuracy) எட்டியுள்ளது, இது OpenAI (72.8%) மற்றும் Anthropic (70.9%) ஆகியவற்றை விட கணிசமாக அதிகமாகும்.
- கட்டமைப்பு அடிப்படை: இந்த அமைப்பு Gemini 3.1 Pro மாடலின் அடிப்படையில் உருவாக்கப்பட்டுள்ளது, இது சிக்கலான தரவுத்தளத் திட்டங்கள் (database schemas) மற்றும் நுணுக்கமான வணிகத் தர்க்கங்களைக் (business logic) கையாளுவதற்குத் தனிப்பயனாக்கப்பட்டுள்ளது.
- நிறுவனத் தாக்கம்: இந்த முன்னேற்றம் தரவுச் சேவைகளில் அதிக நம்பகமான இயற்கை மொழி இடைமுகங்களுக்கான வழியை வகுக்கிறது, இது மூலத் தரவுக்கும் (raw data) செயல்படுத்தக்கூடிய நுண்ணறிவுகளுக்கும் (actionable insights) இடையிலான இடைவெளியைக் குறைக்கிறது.