ਨਵੇਂ ਹੈਲਥ ਬੈਂਚਮਾਰਕ ਵਿੱਚ OpenAI ਦਾ GPT-5.5 Instant ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ

OpenAI ਨੇ GPT-5.5 Instant ਮਾਡਲ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰਕੇ ਆਪਣੀ ਹੈਲਥਕੇਅਰ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਇੱਕ ਨਵੇਂ ਪੱਧਰ 'ਤੇ ਪਹੁੰਚਾ ਦਿੱਤਾ ਹੈ, ਜੋ ਵਿਸ਼ੇਸ਼ AI ਤਰਕ (reasoning) ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੀਲ ਪੱਥਰ ਹੈ। ਇਹ ਨਵਾਂ ਅੱਪਗ੍ਰੇਡ ਡਾਕਟਰੀ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਉੱਚ-ਪੱਧਰੀ "Thinking" ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਹੋਣ ਦੀ ਇੱਕ ਬੇਮਿਸਾਲ ਯੋਗਤਾ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਦਕਿ ਇਹ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਕਿਫਾਇਤੀ ਵੀ ਹੈ।

ਡਾਕਟਰਾਂ ਦੁਆਰਾ ਲਿਖੇ ਜਵਾਬਾਂ ਤੋਂ ਅੱਗੇ ਨਿਕਲਣਾ

OpenAI ਦੇ ਤਾਜ਼ਾ ਡੇਟਾ ਤੋਂ ਸਭ ਤੋਂ ਹੈਰਾਨੀਜਨਕ ਖੁਲਾਸਾ ਇਹ ਹੈ ਕਿ GPT-5.5 Instant ਨੇ ਕੁਝ ਖਾਸ ਮਿਆਰੀ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ। OpenAI ਦੇ ਆਪਣੇ ਬੈਂਚਮਾਰਕਸ ਵਿੱਚ, ਮਾਡਲ ਨੇ ਪੰਜ ਮਹੱਤਵਪੂਰਨ ਮੁਲਾਂਕਣ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ GPT-4o ਅਤੇ ਡਾਕਟਰਾਂ ਦੁਆਰਾ ਲਿਖੇ ਜਵਾਬਾਂ, ਦੋਵਾਂ ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਹੈ ਕਿ ਮਾਡਲ ਨੇ ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਿੱਚ 89.9 ਪ੍ਰਤੀਸ਼ਤ ਤੱਕ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ ਹੈ, ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਡਾਕਟਰੀ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਸਹੀ, ਸੰਰਚਿਤ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਮਾਰਗਦਰਸ਼ਨ ਨਾਲ ਦਿੱਤੇ ਜਾਣ।

ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਇਹ ਉਛਾਲ ਸਿਰਫ਼ ਥੋੜ੍ਹਾ ਜਿਹਾ ਵਾਧਾ ਨਹੀਂ ਹੈ; ਇਹ ਗਲਤੀਆਂ ਦੀ ਦਰ ਵਿੱਚ ਭਾਰੀ ਕਮੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। OpenAI ਦੀ ਰਿਪੋਰਟ ਅਨੁਸਾਰ, ਪਿਛਲੇ ਦੋ ਮਹੀਨਿਆਂ ਵਿੱਚ ਗਲਤ ਸਿਹਤ ਸਬੰਧੀ ਬਿਆਨਾਂ ਦੀ ਬਾਰ-ਬਾਰਤਾ ਵਿੱਚ 71 ਪ੍ਰਤੀਸ਼ਤ ਦੀ ਕਮੀ ਆਈ ਹੈ, ਜੋ ਕਿ ਉੱਚ-ਜੋਖਮ ਵਾਲੇ ਖੇਤਰਾਂ ਵਿੱਚ ਮਾਡਲ ਦੀ ਤਰਕ ਸ਼ਕਤੀ ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਸਥਿਰ ਹੋਣ ਦਾ ਸੰਕੇਤ ਹੈ।

Human-in-the-Loop: ਡਾਕਟਰੀ ਪ੍ਰਮਾਣਿਕਤਾ ਦਾ ਪੈਮਾਨਾ

GPT-5.5 Instant ਦਾ ਵਿਕਾਸ ਕਿਸੇ ਖਾਲੀ ਜਾਂ ਅਲੱਗ-ਥਲੱਗ ਤਰੀਕੇ ਨਾਲ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ। ਕਲੀਨਿਕਲ ਸੁਰੱਖਿਆ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ, OpenAI ਨੇ 60 ਵੱਖ-ਵੱਖ ਦੇਸ਼ਾਂ ਦੇ 260 ਤੋਂ ਵੱਧ ਡਾਕਟਰਾਂ ਦੇ ਵਿਸ਼ਵਵਿਆਪੀ ਨੈੱਟਵਰਕ ਵਾਲੇ ਇੱਕ ਵਿਸ਼ਾਲ human-in-the-loop ਰੀਇਨਫੋਰਸਮੈਂਟ ਸਿਸਟਮ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਸ ਮਾਹਰ ਪੈਨਲ ਨੇ AI ਦੇ ਡਾਕਟਰੀ ਤਰਕ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ 700,000 ਤੋਂ ਵੱਧ ਮਾਡਲ ਜਵਾਬਾਂ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ।

HealthBench ਅਤੇ HealthBench Professional ਵਰਗੇ ਬੈਂਚਮਾਰਕਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, OpenAI ਨੇ ਸਾਬਤ ਕਰ ਦਿੱਤਾ ਹੈ ਕਿ GPT-5.5 Instant ਉਦਯੋਗ ਦੇ ਸਭ ਤੋਂ ਮਹਿੰਗੇ ਅਤੇ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਵਾਲੇ "Thinking" ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੋ ਸਕਦਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਹ ਬਹੁਤ ਹੀ ਘੱਟ ਸੰਚਾਲਨ ਲਾਗਤ 'ਤੇ ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਉੱਚ-ਪੱਧਰੀ ਡਾਕਟਰੀ ਬੁੱਧੀ ਆਮ ਲੋਕਾਂ ਲਈ ਵਧੇਰੇ ਸੁਲਭ ਹੋ ਜਾਂਦੀ ਹੈ।

ਡਾਕਟਰੀ ਬੁੱਧੀ ਦਾ ਲੋਕਤੰਤਰੀਕਰਨ

ਵਿਆਪਕ AI ਲੈਂਡਸਕੇਪ ਲਈ ਇਸਦੇ ਪ੍ਰਭਾਵ ਡੂੰਘੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਮੌਜੂਦਾ ਵਰਤੋਂ ਦੇ ਪੈਮਾਨੇ ਨੂੰ ਦੇਖਦੇ ਹੋਏ। ਹਰ ਹਫ਼ਤੇ 230 ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਲੋਕ ਸਿਹਤ ਨਾਲ ਸਬੰਧਤ ਪੁੱਛਗਿੱਛਾਂ ਲਈ ChatGPT ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹਨ—ਜਿਸ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਲੈਬ ਰਿਪੋਰਟਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਬੀਮਾ ਗੁੰਝਲਾਂ ਨੂੰ ਸਮਝਣ ਤੱਕ ਸ਼ਾਮਲ ਹਨ—ਇਸ ਲਈ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਜਨਤਕ ਮਹੱਤਵ ਦਾ ਵਿਸ਼ਾ ਹੈ।

OpenAI ਆਪਣੀ ਰਣਨੀਤੀ ਨੂੰ ਦੋਵਾਂ ਪਾਸਿਆਂ ਦੀ ਸੇਵਾ ਕਰਨ ਲਈ ਵੰਡ ਰਿਹਾ ਹੈ: ਆਮ ਜਨਤਾ ਅਤੇ ਪੇਸ਼ੇਵਰ ਭਾਈਚਾਰਾ। ਜਦੋਂ ਕਿ GPT-5.5 Instant ਸਾਰੇ ਮੁਫ਼ਤ ChatGPT ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਲਾਗੂ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ (ਵਰਤੋਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਅਧੀਨ), ਕੰਪਨੀ "ChatGPT for Clinicians" ਅਤੇ "OpenAI for Healthcare" ਰਾਹੀਂ ਆਪਣੇ ਪੇਸ਼ੇਵਰ-ਦਰਜੇ ਦੇ ਈਕੋਸਿਸਟਮਾਂ ਦਾ ਵਿਸਤਾਰ ਕਰਨਾ ਜਾਰੀ ਰੱਖ ਰਹੀ ਹੈ। ਇਸ ਦੋਹਰੀ ਪਹੁੰਚ ਦਾ ਉਦੇਸ਼ ਮਰੀਜ਼ਾਂ ਦੀ ਤਿਆਰੀ ਲਈ ਤੁਰੰਤ ਉਪਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਨਾ ਅਤੇ ਨਾਲ ਹੀ ਮੈਡੀਕਲ ਕਰਮਚਾਰੀਆਂ ਲਈ ਮਜ਼ਬੂਤ, ਵਿਸ਼ੇਸ਼ ਸਾਧਨ ਬਣਾਉਣਾ ਹੈ।

ਮੁੱਖ ਨੁਕਤੇ

  • ਸ਼ਾਨਦਾਰ ਸ਼ੁੱਧਤਾ: GPT-5.5 Instant ਨੇ 89.9% ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦਾ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ ਹੈ ਅਤੇ ਦੋ ਮਹੀਨਿਆਂ ਵਿੱਚ ਗਲਤ ਸਿਹਤ ਸਬੰਧੀ ਬਿਆਨਾਂ ਨੂੰ 71% ਤੱਕ ਘਟਾ ਦਿੱਤਾ ਹੈ।
  • ਮਾਹਰਾਂ ਦੁਆਰਾ ਪ੍ਰਮਾਣਿਕਤਾ: ਇਸ ਮਾਡਲ ਨੂੰ 260+ ਡਾਕਟਰਾਂ ਦੇ ਵਿਸ਼ਵਵਿਆਪੀ ਨੈੱਟਵਰਕ ਦੁਆਰਾ 700,000 ਜਵਾਬਾਂ ਦੀ ਸਮੀਖਿਆ ਰਾਹੀਂ ਸੁਧਾਰਿਆ ਗਿਆ ਸੀ।
  • ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਕੁਸ਼ਲਤਾ: ਨਵਾਂ ਮਾਡਲ HealthBench ਬੈਂਚਮਾਰਕਸ 'ਤੇ ਭਾਰੀ "Thinking" ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੈ, ਪਰ ਬਹੁਤ ਘੱਟ ਲਾਗਤ 'ਤੇ।