Google Integrates Computer Control into Gemini 3.5 Flash

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialகடந்த வாரம்3min read

Google Integrates Computer Control into Gemini 3.5 Flash

In this article

Gemini 3.5 Flash-இல் கணினி கட்டுப்பாட்டை (Computer Control) ஒருங்கிணைக்கிறது Google

Gemini 3.5 Flash மாடலில் "Computer Use" திறன்களை நேரடியாக ஒருங்கிணைப்பதன் மூலம், ஏஜென்டிக் AI (agentic AI) துறையில் Google ஒரு முக்கிய மைல்கல்லை எட்டியுள்ளது. இந்தத் திருத்தம், மாடல் கணினித் திரைகள், இணைய உலாவிகள் (web browsers) மற்றும் மொபைல் சாதனங்களை நிகழ்நேரத்தில் (real-time) உணரவும், புரிந்துகொள்ளவும் மற்றும் அவற்றுடன் தொடர்பு கொள்ளவும் அனுமதிக்கிறது. இது வெறும் உரை அடிப்படையிலான உரையாடலில் (text-based chat) இருந்து மாறி, செயலில் டிஜிட்டல் செயல்பாடுகளை (active digital execution) மேற்கொள்ள வழிவகை செய்கிறது.

சாட்போட்டிலிருந்து (Chatbot) தன்னாட்சி ஏஜென்ட் (Autonomous Agent) வரை

இதற்கு முன்பு, கணினி இடைமுகத்தை (computer interface) இயக்கும் திறன் ஒரு தனி Gemini 2.5 மாடலுக்கு மட்டுமே மட்டுப்படுத்தப்பட்டிருந்தது, இது தடையற்ற ஒருங்கிணைப்பிற்கு ஒரு தடையாக இருந்தது. இந்தச் செயல்பாட்டை நேரடியாக Gemini 3.5 Flash-இல் இணைப்பதன் மூலம், மிகவும் திறமையான, மல்டிமோடல் ஏஜென்ட்களை (multimodal agents) உருவாக்க Google டெவலப்பர்களுக்கு வழிவகை செய்கிறது. Function calling, Google Search மற்றும் Maps போன்ற ஏற்கனவே உள்ள திறன்களுடன் இணையும் போது, இந்த ஏஜென்ட்கள் டெஸ்க்டாப், மொபைல் மற்றும் பிரவுசர் சூழல்களில் சிக்கலான பணிப்பாய்வுகளை (workflows) கையாள முடியும். இது தானியங்கி மென்பொருள் சோதனை (automated software testing), சிக்கலான அலுவலக நிர்வாகம் மற்றும் பல்வேறு தளங்களுக்கிடையிலான தரவு உள்ளீடு (cross-platform data entry) போன்ற பெரிய அளவிலான தானியங்கி பணிகளுக்கு இந்த மாடலை ஒரு சிறந்த இயந்திரமாக மாற்றுகிறது.

செயல்திறன் ஒப்பீடு: Gemini மற்றும் பிற மாடல்கள்

இந்த ஒருங்கிணைப்பின் தாக்கம் OSWorld benchmark-இல் மிகத் தெளிவாகத் தெரிகிறது, இது ஒரு AI கணினி அமைப்பை இயக்கும் திறனை அளவிடுகிறது. Gemini 3.5 Flash 78.4 என்ற ஈர்க்கக்கூடிய மதிப்பெண்ணைப் பெற்றுள்ளது, இது பல தொழில்முறை மாடல்களை விட சிறந்த பகுத்தறிவு மற்றும் செயல்பாட்டை வெளிப்படுத்துகிறது.

ஒப்பீட்டிற்காகச் சொன்னால், Gemini 3.5 Flash ஆனது Gemini 3 Flash (65.1) மற்றும் GPT-5.4 mini (72.1) ஆகியவற்றை விடச் சிறப்பாகச் செயல்பட்டது. இது தொழில் துறையின் முன்னணியான Anthropic Opus 4.8 (83.4) மற்றும் மிகக் குறைந்த இடைவெளியில் உள்ள GPT-5.5 (78.7) ஆகியவற்றிற்கு சற்று பின்னால் இருந்தாலும், Sonnet 4.6 (78.4)-இன் செயல்திறனுக்கு இணையாகவும், Gemini 3.1 Pro (76.2)-ஐ விடவும் மேலாகவும் இருப்பதால் மிகவும் போட்டியாக உள்ளது. வேகம் மற்றும் மேம்பட்ட கணினித் தொடர்பு ஆகியவற்றுக்கு இடையே ஒரு சமநிலையைத் தேடும் டெவலப்பர்களுக்கு, Gemini 3.5 Flash ஒரு சிறந்த தேர்வாக அமைகிறது என்பதை இந்தத் தரவுகள் காட்டுகின்றன.

தன்னாட்சி கட்டுப்பாட்டில் பாதுகாப்பு மற்றும்ப் பாதுகாப்பு (Security and Safety)

ஒரு LLM-க்கு பயனரின் இடைமுகத்தின் மீதான கட்டுப்பாட்டை வழங்குவது குறிப்பிடத்தக்க பாதுகாப்பு அபாயங்களை ஏற்படுத்துகிறது, குறிப்பாக prompt injection தாக்குதல்கள் குறித்து. இந்த அச்சுறுத்தல்களைக் குறைக்க, Google கடுமையான adversarial training முறைகளைச் செயல்படுத்தியுள்ளதுடன், இரண்டு தனித்துவமான நிறுவனத் தரத்திலான (enterprise-grade) பாதுகாப்பு வழிமுறைகளையும் வழங்குகிறது.

முதல் பாதுகாப்பு வழிமுறை, கோப்புகளை நீக்குதல் அல்லது நிதிப் பரிவர்த்தனைகளைச் செய்தல் போன்ற முக்கியமான அல்லது மாற்ற முடியாத செயல்களை மாடல் செய்வதற்கு முன், பயனரின் தெளிவான உறுதிப்படுத்தலைத் (explicit user confirmation) தேவைப்படுத்துகிறது. இரண்டாவது பாதுகாப்பு வழிமுறை, மறைமுகமான prompt injection முயற்சியை அமைப்பு கண்டறிந்தால், எந்தவொரு பணியையும் தானாகவே நிறுத்திவிடும். இந்த உள்ளமைக்கப்பட்ட கருவிகளுக்கு அப்பால், ஏஜென்ட்டின் சூழலைச் தனிமைப்படுத்துதல் (sandboxing), மனித மேற்பார்வையைத் தொடர்தல் மற்றும் கடுமையான அணுகல் கட்டுப்பாடுகளைச் செயல்படுத்துதல் போன்ற "defense-in-depth" உத்தியைப் பின்பற்றுமாறு Google டெவலப்பர்களுக்குப் பரிந்துரைக்கிறது.

கிடைப்புத்தன்மை மற்றும் செயல்படுத்துதல்

இந்தத் திறன்களைப் பயன்படுத்த விரும்பும் டெவலப்பர்கள் Gemini API மற்றும் Gemini Enterprise Agent Platform மூலம் உடனடியாகப் பயன்படுத்திக் கொள்ளலாம். உருவாக்கச் செயல்முறையை விரைவுபடுத்த, Google ஒரு GitHub reference implementation மற்றும் Browserbase demo ஆகியவற்றை வழங்கியுள்ளது, இது ஏற்கனவே உள்ள மென்பொருள் சூழல்களில் தன்னாட்சி கணினி கட்டுப்பாட்டை ஒருங்கிணைப்பதற்கான தெளிவான வழிகாட்டியாக அமைகிறது.

முக்கியக் குறிப்புகள்

நேரடி ஒருங்கிணைப்பு: கணினி கட்டுப்பாடு இப்போது Gemini 3.5 Flash-இல் இயல்பாகவே இணைக்கப்பட்டுள்ளது, இது திரைகள் மற்றும் உலாவிகளுடன் தடையற்ற மல்டிமோடல் தொடர்பை சாத்தியமாக்குகிறது.
உயர்ந்த தரநிலைகள்: 78.4 என்ற OSWorld மதிப்பெண்ணுடன், Gemini 3.5 Flash தன்னாட்சி கணினிப் பணிகளுக்கான ஒரு சிறந்த மாடலாக உள்ளது, இது GPT-5.4 mini-ஐ விடச் சிறந்தது.
நிறுவனப் பாதுகாப்பு: Google, adversarial training மற்றும் முக்கியமான செயல்களுக்குக் கட்டாய பயனர் உறுதிப்படுத்தல் போன்ற விருப்பத் பாதுகாப்பு வழிமுறைகள் மூலம் தன்னாட்சி ஏஜென்ட்களின் அபாயங்களைக் கையாள்கிறது.

Google Integrates Computer Control into Gemini 3.5 Flash

Gemini 3.5 Flash-இல் கணினி கட்டுப்பாட்டை (Computer Control) ஒருங்கிணைக்கிறது Google

சாட்போட்டிலிருந்து (Chatbot) தன்னாட்சி ஏஜென்ட் (Autonomous Agent) வரை

செயல்திறன் ஒப்பீடு: Gemini மற்றும் பிற மாடல்கள்

தன்னாட்சி கட்டுப்பாட்டில் பாதுகாப்பு மற்றும்ப் பாதுகாப்பு (Security and Safety)

கிடைப்புத்தன்மை மற்றும் செயல்படுத்துதல்

முக்கியக் குறிப்புகள்

Continue reading

ஆண்ட்ராய்டு 17 வெளியீடு: ஜெமினி ஆம்னி மற்றும் மேம்பட்ட மல்டிடாஸ்கிங் வசதிகளை ஒருங்கிணைக்கிறது கூகுள்

கூகுள் டீப்மைண்டின் புதிய AI கட்டுப்பாட்டுத் திட்டம்: ஏஜெண்டுகளை உள்நாட்டு அச்சுறுத்தல்களாகக் கருதுதல்

Google Shifts Gemini to Interactions API to Power the New Era of Agents

கூகுள் ஹோம் ஸ்பீக்கர் நேரடி அனுபவம்: பிரீமியம் ஆடியோ மற்றும் ஜெமினி AI-ன் சங்கமம்

கூகுள் மேக்கிற்கான Gemini Spark-ஐ அறிமுகப்படுத்துகிறது: ஏஜென்டிக் AI-ன் ஒரு புதிய யுகம்