Gemini 3.5 Flash-இல் கணினி கட்டுப்பாட்டை (Computer Control) ஒருங்கிணைக்கிறது Google

Gemini 3.5 Flash மாடலில் "Computer Use" திறன்களை நேரடியாக ஒருங்கிணைப்பதன் மூலம், ஏஜென்டிக் AI (agentic AI) துறையில் Google ஒரு முக்கிய மைல்கல்லை எட்டியுள்ளது. இந்தத் திருத்தம், மாடல் கணினித் திரைகள், இணைய உலாவிகள் (web browsers) மற்றும் மொபைல் சாதனங்களை நிகழ்நேரத்தில் (real-time) உணரவும், புரிந்துகொள்ளவும் மற்றும் அவற்றுடன் தொடர்பு கொள்ளவும் அனுமதிக்கிறது. இது வெறும் உரை அடிப்படையிலான உரையாடலில் (text-based chat) இருந்து மாறி, செயலில் டிஜிட்டல் செயல்பாடுகளை (active digital execution) மேற்கொள்ள வழிவகை செய்கிறது.

சாட்போட்டிலிருந்து (Chatbot) தன்னாட்சி ஏஜென்ட் (Autonomous Agent) வரை

இதற்கு முன்பு, கணினி இடைமுகத்தை (computer interface) இயக்கும் திறன் ஒரு தனி Gemini 2.5 மாடலுக்கு மட்டுமே மட்டுப்படுத்தப்பட்டிருந்தது, இது தடையற்ற ஒருங்கிணைப்பிற்கு ஒரு தடையாக இருந்தது. இந்தச் செயல்பாட்டை நேரடியாக Gemini 3.5 Flash-இல் இணைப்பதன் மூலம், மிகவும் திறமையான, மல்டிமோடல் ஏஜென்ட்களை (multimodal agents) உருவாக்க Google டெவலப்பர்களுக்கு வழிவகை செய்கிறது. Function calling, Google Search மற்றும் Maps போன்ற ஏற்கனவே உள்ள திறன்களுடன் இணையும் போது, இந்த ஏஜென்ட்கள் டெஸ்க்டாப், மொபைல் மற்றும் பிரவுசர் சூழல்களில் சிக்கலான பணிப்பாய்வுகளை (workflows) கையாள முடியும். இது தானியங்கி மென்பொருள் சோதனை (automated software testing), சிக்கலான அலுவலக நிர்வாகம் மற்றும் பல்வேறு தளங்களுக்கிடையிலான தரவு உள்ளீடு (cross-platform data entry) போன்ற பெரிய அளவிலான தானியங்கி பணிகளுக்கு இந்த மாடலை ஒரு சிறந்த இயந்திரமாக மாற்றுகிறது.

செயல்திறன் ஒப்பீடு: Gemini மற்றும் பிற மாடல்கள்

இந்த ஒருங்கிணைப்பின் தாக்கம் OSWorld benchmark-இல் மிகத் தெளிவாகத் தெரிகிறது, இது ஒரு AI கணினி அமைப்பை இயக்கும் திறனை அளவிடுகிறது. Gemini 3.5 Flash 78.4 என்ற ஈர்க்கக்கூடிய மதிப்பெண்ணைப் பெற்றுள்ளது, இது பல தொழில்முறை மாடல்களை விட சிறந்த பகுத்தறிவு மற்றும் செயல்பாட்டை வெளிப்படுத்துகிறது.

ஒப்பீட்டிற்காகச் சொன்னால், Gemini 3.5 Flash ஆனது Gemini 3 Flash (65.1) மற்றும் GPT-5.4 mini (72.1) ஆகியவற்றை விடச் சிறப்பாகச் செயல்பட்டது. இது தொழில் துறையின் முன்னணியான Anthropic Opus 4.8 (83.4) மற்றும் மிகக் குறைந்த இடைவெளியில் உள்ள GPT-5.5 (78.7) ஆகியவற்றிற்கு சற்று பின்னால் இருந்தாலும், Sonnet 4.6 (78.4)-இன் செயல்திறனுக்கு இணையாகவும், Gemini 3.1 Pro (76.2)-ஐ விடவும் மேலாகவும் இருப்பதால் மிகவும் போட்டியாக உள்ளது. வேகம் மற்றும் மேம்பட்ட கணினித் தொடர்பு ஆகியவற்றுக்கு இடையே ஒரு சமநிலையைத் தேடும் டெவலப்பர்களுக்கு, Gemini 3.5 Flash ஒரு சிறந்த தேர்வாக அமைகிறது என்பதை இந்தத் தரவுகள் காட்டுகின்றன.

தன்னாட்சி கட்டுப்பாட்டில் பாதுகாப்பு மற்றும்ப் பாதுகாப்பு (Security and Safety)

ஒரு LLM-க்கு பயனரின் இடைமுகத்தின் மீதான கட்டுப்பாட்டை வழங்குவது குறிப்பிடத்தக்க பாதுகாப்பு அபாயங்களை ஏற்படுத்துகிறது, குறிப்பாக prompt injection தாக்குதல்கள் குறித்து. இந்த அச்சுறுத்தல்களைக் குறைக்க, Google கடுமையான adversarial training முறைகளைச் செயல்படுத்தியுள்ளதுடன், இரண்டு தனித்துவமான நிறுவனத் தரத்திலான (enterprise-grade) பாதுகாப்பு வழிமுறைகளையும் வழங்குகிறது.

முதல் பாதுகாப்பு வழிமுறை, கோப்புகளை நீக்குதல் அல்லது நிதிப் பரிவர்த்தனைகளைச் செய்தல் போன்ற முக்கியமான அல்லது மாற்ற முடியாத செயல்களை மாடல் செய்வதற்கு முன், பயனரின் தெளிவான உறுதிப்படுத்தலைத் (explicit user confirmation) தேவைப்படுத்துகிறது. இரண்டாவது பாதுகாப்பு வழிமுறை, மறைமுகமான prompt injection முயற்சியை அமைப்பு கண்டறிந்தால், எந்தவொரு பணியையும் தானாகவே நிறுத்திவிடும். இந்த உள்ளமைக்கப்பட்ட கருவிகளுக்கு அப்பால், ஏஜென்ட்டின் சூழலைச் தனிமைப்படுத்துதல் (sandboxing), மனித மேற்பார்வையைத் தொடர்தல் மற்றும் கடுமையான அணுகல் கட்டுப்பாடுகளைச் செயல்படுத்துதல் போன்ற "defense-in-depth" உத்தியைப் பின்பற்றுமாறு Google டெவலப்பர்களுக்குப் பரிந்துரைக்கிறது.

கிடைப்புத்தன்மை மற்றும் செயல்படுத்துதல்

இந்தத் திறன்களைப் பயன்படுத்த விரும்பும் டெவலப்பர்கள் Gemini API மற்றும் Gemini Enterprise Agent Platform மூலம் உடனடியாகப் பயன்படுத்திக் கொள்ளலாம். உருவாக்கச் செயல்முறையை விரைவுபடுத்த, Google ஒரு GitHub reference implementation மற்றும் Browserbase demo ஆகியவற்றை வழங்கியுள்ளது, இது ஏற்கனவே உள்ள மென்பொருள் சூழல்களில் தன்னாட்சி கணினி கட்டுப்பாட்டை ஒருங்கிணைப்பதற்கான தெளிவான வழிகாட்டியாக அமைகிறது.

முக்கியக் குறிப்புகள்

  • நேரடி ஒருங்கிணைப்பு: கணினி கட்டுப்பாடு இப்போது Gemini 3.5 Flash-இல் இயல்பாகவே இணைக்கப்பட்டுள்ளது, இது திரைகள் மற்றும் உலாவிகளுடன் தடையற்ற மல்டிமோடல் தொடர்பை சாத்தியமாக்குகிறது.
  • உயர்ந்த தரநிலைகள்: 78.4 என்ற OSWorld மதிப்பெண்ணுடன், Gemini 3.5 Flash தன்னாட்சி கணினிப் பணிகளுக்கான ஒரு சிறந்த மாடலாக உள்ளது, இது GPT-5.4 mini-ஐ விடச் சிறந்தது.
  • நிறுவனப் பாதுகாப்பு: Google, adversarial training மற்றும் முக்கியமான செயல்களுக்குக் கட்டாய பயனர் உறுதிப்படுத்தல் போன்ற விருப்பத் பாதுகாப்பு வழிமுறைகள் மூலம் தன்னாட்சி ஏஜென்ட்களின் அபாயங்களைக் கையாள்கிறது.