Gemini 3.5 Flash ਵਿੱਚ ਹੁਣ ਨੈਟਿਵ ਕੰਪਿਊਟਰ ਯੂਜ਼ ਦੀ ਸਹੂਲਤ ਹੈ
Google ਨੇ 24 ਜੂਨ, 2026 ਨੂੰ Gemini 3.5 Flash ਨੂੰ ਅਪਡੇਟ ਕੀਤਾ। ਇਸ ਵਿੱਚ ਹੁਣ ਨੈਟਿਵ ਕੰਪਿਊਟਰ ਯੂਜ਼ (native computer use) ਸ਼ਾਮਲ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਾਡਲ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਸਕ੍ਰੀਨਾਂ ਨਾਲ ਇੰਟਰੈਕਟ ਕਰ ਸਕਦਾ ਹੈ।
ਇਸ ਅਪਡੇਟ ਤੋਂ ਪਹਿਲਾਂ, ਡਿਵੈਲਪਰਾਂ ਕੋਲ ਇੱਕ ਚੋਣ ਹੁੰਦੀ ਸੀ। ਤੁਹਾਨੂੰ ਸਕ੍ਰੀਨ ਕੰਟਰੋਲ ਲਈ ਇੱਕ ਵੱਖਰੇ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਪੈਂਦੀ ਸੀ ਜਾਂ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਗੁੰਝਲਦਾਰ ਪਾਈਪਲਾਈਨ ਬਣਾਉਣੀਆਂ ਪੈਂਦੀਆਂ ਸਨ। ਇਸ ਨਾਲ ਲਾਗਤ ਅਤੇ ਇੰਜੀਨੀਅਰਿੰਗ ਦਾ ਕੰਮ ਵਧ ਜਾਂਦਾ ਸੀ।
ਹੁਣ, ਕੰਪਿਊਟਰ ਯੂਜ਼ ਇੱਕ ਸਟੈਂਡਰਡ ਟੂਲ ਹੈ। ਤੁਸੀਂ ਇਸਨੂੰ ਇੱਕੋ ਕਦਮ ਵਿੱਚ Search ਅਤੇ Maps ਦੇ ਨਾਲ ਵਰਤ ਸਕਦੇ ਹੋ।
ਤੁਹਾਡੇ ਲਈ ਕੀ ਬਦਲਦਾ ਹੈ:
- ਸਿੰਗਲ ਇਨਫਰੈਂਸ ਪਾਸ (Single inference pass): ਇੱਕ ਏਜੰਟ ਮਾਡਲ ਬਦਲੇ ਬਿਨਾਂ ਵੈੱਬ ਸਰੋਖਣ ਕਰ ਸਕਦਾ ਹੈ, ਐਂਟਰਪ੍ਰਾਈਜ਼ ਐਪਸ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ Maps ਚੈੱਕ ਕਰ ਸਕਦਾ ਹੈ।
- ਵੱਡਾ ਕੰਟੈਕਸਟ (Larger context): ਵਿੰਡੋ 128K ਤੋਂ ਵਧ ਕੇ 1 ਮਿਲੀਅਨ ਟੋਕਨ ਹੋ ਗਈ ਹੈ। ਇਹ ਲੰਬੇ ਕੰਮਾਂ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।
- ਬਿਹਤਰ ਰੀਜ਼ਨਿੰਗ (Better reasoning): ਹੁਣ ਹਰ ਐਕਸ਼ਨ ਵਿੱਚ ਇੱਕ ਇੰਟੈਂਟ ਫੀਲਡ (intent field) ਸ਼ਾਮਲ ਹੈ। ਇਹ ਦੱਸਦਾ ਹੈ ਕਿ ਮਾਡਲ ਨੇ ਕਲਿੱਕ ਜਾਂ ਟਾਈਪ ਕਿਉਂ ਕੀਤਾ। ਇਹ ਕੰਪਲਾਇੰਸ (compliance) ਲਈ ਇੱਕ ਆਡਿਟ ਟ੍ਰੇਲ ਬਣਾਉਂਦਾ ਹੈ।
- ਘੱਟ ਲਾਗਤ (Lower costs): Gemini 3.5 Flash ਦੀ ਕੀਮਤ $1.50 ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ ਹੈ। GPT-5.5 ਦੀ ਕੀਮਤ $5.00 ਹੈ। ਸਕੈਲਿੰਗ ਲਈ Gemini ਕਿਤੇ ਜ਼ਿਆਦਾ ਸਸਤਾ ਹੈ।
ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ:
- ਤੁਹਾਡੀ ਐਪ ਇੱਕ ਸਕ੍ਰੀਨਸ਼ੌਟ ਲੈਂਦੀ ਹੈ।
- API ਤਸਵੀਰ ਅਤੇ ਤੁਹਾਡਾ ਟੀਚਾ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ।
- ਮਾਡਲ ਇੱਕ UI ਐਲੀਮੈਂਟ ਚੁਣਦਾ ਹੈ ਅਤੇ ਕਲਿੱਕ ਜਾਂ ਸਕ੍ਰੋਲ ਵਰਗੀ ਕਮਾਂਡ ਵਾਪਸ ਕਰਦਾ ਹੈ।
- ਤੁਹਾਡੀ ਐਪ ਕਮਾਂਡ ਨੂੰ ਲਾਗੂ ਕਰਦੀ ਹੈ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਹਰਾਉਂਦੀ ਹੈ।
ਸੁਰੱਖਿਆ ਇੱਕ ਵੱਡੀ ਚਿੰਤਾ ਹੈ। ਇੱਕ ਏਜੰਟ ਈਮੇਲ ਭੇਜਣ ਜਾਂ ਭੁਗਤਾਨ ਕਰਨ ਵਰਗੇ ਅਟੱਲ (irreversible) ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ। Google ਨੇ ਇਸਨੂੰ ਸੰਭਾਲਣ ਲਈ ਕਈ ਪੱਧਰ ਜੋੜੇ ਹਨ:
- ਪ੍ਰੋਂਪਟ ਇੰਜੈਕਸ਼ਨ (prompt injection) ਨੂੰ ਰੋਕਣ ਲਈ ਐਡਵਰਸੇਰੀਅਲ ਟ੍ਰੇਨਿੰਗ।
- ਸੰਵੇਦਨਸ਼ੀਲ ਕੰਮਾਂ ਲਈ ਮਨੁੱਖੀ ਪੁਸ਼ਟੀ (Human confirmation)।
- ਵਿੱਤੀ ਲੈਣ-ਦੇਣ ਵਰਗੇ ਖਾਸ ਕੰਮਾਂ ਨੂੰ ਰੋਕਣ ਲਈ ਸੱਤ ਸੁਰੱਖਿਆ ਸ਼੍ਰੇਣੀਆਂ।
ਮਾਡਲ 20 ਤੋਂ ਵੱਧ ਐਕਸ਼ਨ ਕਿਸਮਾਂ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਬ੍ਰਾਊਜ਼ਰ, ਮੋਬਾਈਲ ਅਤੇ ਡੈਸਕਟਾਪ ਲਈ ਕਲਿੱਕ, ਟਾਈਪਿੰਗ, ਸਕ੍ਰੋਲਿੰਗ ਅਤੇ ਡ੍ਰੈਗਿੰਗ ਸ਼ਾਮਲ ਹਨ।
ਬੈਂਚਮਾਰਕਸ ਅਤੇ ਅਸਲ ਦੁਨੀਆ ਦੀ ਵਰਤੋਂ ਵਿਚਕਾਰ ਅਜੇ ਵੀ ਫਰਕ ਹੈ। ਐਪਸ ਅਕਸਰ ਬਦਲਦੀਆਂ ਰਹਿੰਦੀਆਂ ਹਨ ਅਤੇ ਅਥੈਂਟੀਕੇਸ਼ਨ ਫਲੋਅ (authentication flows) ਗੁੰਝਲਦਾਰ ਹੁੰਦੇ ਹਨ। ਸਿਰਫ਼ 'ਰੀਡ-ਓਨਲੀ' (read-only) ਕੰਮਾਂ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ। ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਹਾਨੂੰ ਲੌਗਸ (logs) 'ਤੇ ਭਰੋਸਾ ਹੋ ਜਾਵੇ, ਤਾਂ ਅਜਿਹੇ ਵਰਕਫਲੋਅ ਵੱਲ ਵਧੋ ਜਿਨ੍ਹਾਂ ਲਈ ਮਨੁੱਖੀ ਪ੍ਰਵਾਨਗੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
ਕੰਪਿਊਟਰ ਯੂਜ਼ ਹੁਣ ਇੱਕ ਪ੍ਰੀਮੀਅਮ ਐਡ-ਆਨ ਤੋਂ ਇੱਕ ਸਟੈਂਡਰਡ ਟੂਲ ਬਣ ਰਿਹਾ ਹੈ।
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi
