Gemini 3.5 Flash இப்போது நேரடி கணினி பயன்பாட்டைக் (Native Computer Use) கொண்டுள்ளது

Google, ஜூன் 24, 2026 அன்று Gemini 3.5 Flash-ஐப் புதுப்பித்தது. இதில் இப்போது நேரடி கணினி பயன்பாடு சேர்க்கப்பட்டுள்ளது. இதன் பொருள், இந்த மாடல் திரைகளுடன் (screens) நேரடியாகத் தொடர்பு கொள்ள முடியும் என்பதாகும்.

இந்தத் புதுப்பிப்பிற்கு முன்பு, டெவலப்பர்கள் ஒரு சவாலை எதிர்கொண்டனர். திரையைக் கட்டுப்படுத்த ஒரு தனி மாடலைப் பயன்படுத்த வேண்டும் அல்லது வெவ்வேறு மாடல்களுக்கு இடையே சிக்கலான வழிமுறைகளை (pipelines) உருவாக்க வேண்டும். இது கூடுதல் செலவையும் பொறியியல் வேலையையும் அதிகரித்தது.

இப்போது, கணினி பயன்பாடு என்பது ஒரு நிலையான கருவியாகும். நீங்கள் Search மற்றும் Maps ஆகியவற்றுடன் ஒரே படியில் இதையும் பயன்படுத்தலாம்.

உங்களுக்கான மாற்றங்கள்:

  • ஒற்றை இன்ஃபரன்ஸ் பாஸ் (Single inference pass): மாடல்களை மாற்றாமலேயே ஒரு ஏஜென்ட் இணையதளங்களை உலாவவும், நிறுவன செயலிகளைப் (enterprise apps) பயன்படுத்தவும் மற்றும் Maps-ஐச் சரிபார்க்கவும் முடியும்.
  • பெரிய சூழல் (Larger context): இதன் விண்டோ 128K-லிருந்து 1 மில்லியன் டோக்கன்களாக அதிகரித்துள்ளது. இது நீண்ட பணிகளுக்கு உதவுகிறது.
  • சிறந்த பகுத்தறிவு (Better reasoning): ஒவ்வொரு செயலும் இப்போது ஒரு 'intent' புலத்தை (field) உள்ளடக்கியது. மாடல் ஏன் கிளிக் செய்தது அல்லது தட்டச்சு செய்தது என்பதை இது விளக்குகிறது. இது இணக்கத்தன்மைக்காக (compliance) ஒரு தணிக்கைப் பாதையை (audit trail) உருவாக்குகிறது.
  • குறைந்த செலவு: Gemini 3.5 Flash ஒரு மில்லியன் இன்புட் டோக்கன்களுக்கு $1.50 செலவாகும். GPT-5.5-ன் செலவு $5.00 ஆகும். அளவிடுவதற்கு (scaling) Gemini மிகவும் மலிவானது.

இது எவ்வாறு செயல்படுகிறது:

  • உங்கள் ஆப் ஒரு ஸ்கிரீன்ஷாட்டை எடுக்கிறது.
  • API அந்தப் படத்தையும் உங்கள் இலக்கையும் பெறுகிறது.
  • மாடல் ஒரு UI உறுப்பைத் தேர்ந்தெடுத்து, கிளிக் அல்லது ஸ்க்ரோல் போன்ற ஒரு கட்டளையைத் திருப்பித் தருகிறது.
  • உங்கள் ஆப் அந்த கட்டளையைச் செயல்படுத்தி, இந்தச் செயல்முறையைத் தொடர்கிறது.

பாதுகாப்பு என்பது ஒரு முக்கிய கவலை. ஒரு ஏஜென்ட் மின்னஞ்சல்களை அனுப்புவது அல்லது பணம் செலுத்துவது போன்ற மாற்ற முடியாத செயல்களைச் செய்ய முடியும். இதை நிர்வகிக்க Google கூடுதல் அடுக்குகளைச் சேர்த்துள்ளது:

  • Prompt injection-ஐத் தடுக்க Adversarial training.
  • முக்கியமான செயல்களுக்கு மனிதர்களின் உறுதிப்படுத்தல்.
  • நிதி சார்ந்த நகர்வுகள் போன்ற குறிப்பிட்ட பணிகளைத் தடுக்க ஏழு பாதுகாப்புப் பிரிவுகள்.

இந்த மாடல் 20-க்கும் மேற்பட்ட செயல் வகைகளை ஆதரிக்கிறது. இதில் பிரவுசர்கள், மொபைல் மற்றும் டெஸ்க்டாப்பிற்கான கிளிக், டைப்பிங், ஸ்க்ரோலிங் மற்றும் டிராகிங் ஆகியவை அடங்கும்.

பெஞ்ச்மார்க் அளவீடுகளுக்கும் (benchmarks) நிஜ உலகப் பயன்பாட்டிற்கும் இடையே இன்னும் இடைவெளி உள்ளது. செயலிகள் அடிக்கடி மாறுகின்றன மற்றும் அங்கீகார ஓட்டங்கள் (authentication flows) சிக்கலானவை. எனவே, 'read-only' பணிகளுடன் தொடங்குங்கள். லாக்ஸ்களை (logs) நீங்கள் நம்பிய பிறகு, மனித ஒப்புதல் தேவைப்படும் பணிப்பாய்வுகளுக்கு (workflows) மாறலாம்.

கணினி பயன்பாடு என்பது ஒரு பிரீமியம் கூடுதல் வசதியிலிருந்து (premium add-on) ஒரு நிலையான கருவியாக மாறி வருகிறது.

ஆதாரம்: https://dev.to/prabhakar_chaudhary_7afe4/gemini-35-flash-now-has-native-computer-use-heres-what-that-actually-changes-ol0

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi