ਨਵੇਂ ਸਿਹਤ ਬੈਂਚਮਾਰਕ ਵਿੱਚ OpenAI ਦਾ GPT 5.5 Instant ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ

Translated for your language. Read the original.

AI-assisted draft.

In this article

ਨਵੇਂ ਹੈਲਥ ਬੈਂਚਮਾਰਕ ਵਿੱਚ OpenAI ਦਾ GPT-5.5 Instant ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ

OpenAI ਨੇ GPT-5.5 Instant ਮਾਡਲ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰਕੇ ਆਪਣੀ ਹੈਲਥਕੇਅਰ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਇੱਕ ਨਵੇਂ ਪੱਧਰ 'ਤੇ ਪਹੁੰਚਾ ਦਿੱਤਾ ਹੈ, ਜੋ ਵਿਸ਼ੇਸ਼ AI ਤਰਕ (reasoning) ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੀਲ ਪੱਥਰ ਹੈ। ਇਹ ਨਵਾਂ ਅੱਪਗ੍ਰੇਡ ਡਾਕਟਰੀ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਉੱਚ-ਪੱਧਰੀ "Thinking" ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਹੋਣ ਦੀ ਇੱਕ ਬੇਮਿਸਾਲ ਯੋਗਤਾ ਦਿਖਾਉਂਦਾ ਹੈ, ਜਦਕਿ ਇਹ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਕਿਫਾਇਤੀ ਵੀ ਹੈ।

ਡਾਕਟਰਾਂ ਦੁਆਰਾ ਲਿਖੇ ਜਵਾਬਾਂ ਤੋਂ ਅੱਗੇ ਨਿਕਲਣਾ

OpenAI ਦੇ ਤਾਜ਼ਾ ਡੇਟਾ ਤੋਂ ਸਭ ਤੋਂ ਹੈਰਾਨੀਜਨਕ ਖੁਲਾਸਾ ਇਹ ਹੈ ਕਿ GPT-5.5 Instant ਨੇ ਕੁਝ ਖਾਸ ਮਿਆਰੀ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਹੈ। OpenAI ਦੇ ਆਪਣੇ ਬੈਂਚਮਾਰਕਸ ਵਿੱਚ, ਮਾਡਲ ਨੇ ਪੰਜ ਮਹੱਤਵਪੂਰਨ ਮੁਲਾਂਕਣ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ GPT-4o ਅਤੇ ਡਾਕਟਰਾਂ ਦੁਆਰਾ ਲਿਖੇ ਜਵਾਬਾਂ, ਦੋਵਾਂ ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਹੈ ਕਿ ਮਾਡਲ ਨੇ ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਵਿੱਚ 89.9 ਪ੍ਰਤੀਸ਼ਤ ਤੱਕ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ ਹੈ, ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਡਾਕਟਰੀ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਸਹੀ, ਸੰਰਚਿਤ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਮਾਰਗਦਰਸ਼ਨ ਨਾਲ ਦਿੱਤੇ ਜਾਣ।

ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਇਹ ਉਛਾਲ ਸਿਰਫ਼ ਥੋੜ੍ਹਾ ਜਿਹਾ ਵਾਧਾ ਨਹੀਂ ਹੈ; ਇਹ ਗਲਤੀਆਂ ਦੀ ਦਰ ਵਿੱਚ ਭਾਰੀ ਕਮੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। OpenAI ਦੀ ਰਿਪੋਰਟ ਅਨੁਸਾਰ, ਪਿਛਲੇ ਦੋ ਮਹੀਨਿਆਂ ਵਿੱਚ ਗਲਤ ਸਿਹਤ ਸਬੰਧੀ ਬਿਆਨਾਂ ਦੀ ਬਾਰ-ਬਾਰਤਾ ਵਿੱਚ 71 ਪ੍ਰਤੀਸ਼ਤ ਦੀ ਕਮੀ ਆਈ ਹੈ, ਜੋ ਕਿ ਉੱਚ-ਜੋਖਮ ਵਾਲੇ ਖੇਤਰਾਂ ਵਿੱਚ ਮਾਡਲ ਦੀ ਤਰਕ ਸ਼ਕਤੀ ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਸਥਿਰ ਹੋਣ ਦਾ ਸੰਕੇਤ ਹੈ।

Human-in-the-Loop: ਡਾਕਟਰੀ ਪ੍ਰਮਾਣਿਕਤਾ ਦਾ ਪੈਮਾਨਾ

GPT-5.5 Instant ਦਾ ਵਿਕਾਸ ਕਿਸੇ ਖਾਲੀ ਜਾਂ ਅਲੱਗ-ਥਲੱਗ ਤਰੀਕੇ ਨਾਲ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ। ਕਲੀਨਿਕਲ ਸੁਰੱਖਿਆ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ, OpenAI ਨੇ 60 ਵੱਖ-ਵੱਖ ਦੇਸ਼ਾਂ ਦੇ 260 ਤੋਂ ਵੱਧ ਡਾਕਟਰਾਂ ਦੇ ਵਿਸ਼ਵਵਿਆਪੀ ਨੈੱਟਵਰਕ ਵਾਲੇ ਇੱਕ ਵਿਸ਼ਾਲ human-in-the-loop ਰੀਇਨਫੋਰਸਮੈਂਟ ਸਿਸਟਮ ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਇਸ ਮਾਹਰ ਪੈਨਲ ਨੇ AI ਦੇ ਡਾਕਟਰੀ ਤਰਕ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ 700,000 ਤੋਂ ਵੱਧ ਮਾਡਲ ਜਵਾਬਾਂ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ।

HealthBench ਅਤੇ HealthBench Professional ਵਰਗੇ ਬੈਂਚਮਾਰਕਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, OpenAI ਨੇ ਸਾਬਤ ਕਰ ਦਿੱਤਾ ਹੈ ਕਿ GPT-5.5 Instant ਉਦਯੋਗ ਦੇ ਸਭ ਤੋਂ ਮਹਿੰਗੇ ਅਤੇ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਵਾਲੇ "Thinking" ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੋ ਸਕਦਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਹ ਬਹੁਤ ਹੀ ਘੱਟ ਸੰਚਾਲਨ ਲਾਗਤ 'ਤੇ ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਉੱਚ-ਪੱਧਰੀ ਡਾਕਟਰੀ ਬੁੱਧੀ ਆਮ ਲੋਕਾਂ ਲਈ ਵਧੇਰੇ ਸੁਲਭ ਹੋ ਜਾਂਦੀ ਹੈ।

ਡਾਕਟਰੀ ਬੁੱਧੀ ਦਾ ਲੋਕਤੰਤਰੀਕਰਨ

ਵਿਆਪਕ AI ਲੈਂਡਸਕੇਪ ਲਈ ਇਸਦੇ ਪ੍ਰਭਾਵ ਡੂੰਘੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਮੌਜੂਦਾ ਵਰਤੋਂ ਦੇ ਪੈਮਾਨੇ ਨੂੰ ਦੇਖਦੇ ਹੋਏ। ਹਰ ਹਫ਼ਤੇ 230 ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਲੋਕ ਸਿਹਤ ਨਾਲ ਸਬੰਧਤ ਪੁੱਛਗਿੱਛਾਂ ਲਈ ChatGPT ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹਨ—ਜਿਸ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਲੈਬ ਰਿਪੋਰਟਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਬੀਮਾ ਗੁੰਝਲਾਂ ਨੂੰ ਸਮਝਣ ਤੱਕ ਸ਼ਾਮਲ ਹਨ—ਇਸ ਲਈ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਜਨਤਕ ਮਹੱਤਵ ਦਾ ਵਿਸ਼ਾ ਹੈ।

OpenAI ਆਪਣੀ ਰਣਨੀਤੀ ਨੂੰ ਦੋਵਾਂ ਪਾਸਿਆਂ ਦੀ ਸੇਵਾ ਕਰਨ ਲਈ ਵੰਡ ਰਿਹਾ ਹੈ: ਆਮ ਜਨਤਾ ਅਤੇ ਪੇਸ਼ੇਵਰ ਭਾਈਚਾਰਾ। ਜਦੋਂ ਕਿ GPT-5.5 Instant ਸਾਰੇ ਮੁਫ਼ਤ ChatGPT ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਲਾਗੂ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ (ਵਰਤੋਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਅਧੀਨ), ਕੰਪਨੀ "ChatGPT for Clinicians" ਅਤੇ "OpenAI for Healthcare" ਰਾਹੀਂ ਆਪਣੇ ਪੇਸ਼ੇਵਰ-ਦਰਜੇ ਦੇ ਈਕੋਸਿਸਟਮਾਂ ਦਾ ਵਿਸਤਾਰ ਕਰਨਾ ਜਾਰੀ ਰੱਖ ਰਹੀ ਹੈ। ਇਸ ਦੋਹਰੀ ਪਹੁੰਚ ਦਾ ਉਦੇਸ਼ ਮਰੀਜ਼ਾਂ ਦੀ ਤਿਆਰੀ ਲਈ ਤੁਰੰਤ ਉਪਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਨਾ ਅਤੇ ਨਾਲ ਹੀ ਮੈਡੀਕਲ ਕਰਮਚਾਰੀਆਂ ਲਈ ਮਜ਼ਬੂਤ, ਵਿਸ਼ੇਸ਼ ਸਾਧਨ ਬਣਾਉਣਾ ਹੈ।

ਮੁੱਖ ਨੁਕਤੇ

ਸ਼ਾਨਦਾਰ ਸ਼ੁੱਧਤਾ: GPT-5.5 Instant ਨੇ 89.9% ਹਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦਾ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ ਹੈ ਅਤੇ ਦੋ ਮਹੀਨਿਆਂ ਵਿੱਚ ਗਲਤ ਸਿਹਤ ਸਬੰਧੀ ਬਿਆਨਾਂ ਨੂੰ 71% ਤੱਕ ਘਟਾ ਦਿੱਤਾ ਹੈ।
ਮਾਹਰਾਂ ਦੁਆਰਾ ਪ੍ਰਮਾਣਿਕਤਾ: ਇਸ ਮਾਡਲ ਨੂੰ 260+ ਡਾਕਟਰਾਂ ਦੇ ਵਿਸ਼ਵਵਿਆਪੀ ਨੈੱਟਵਰਕ ਦੁਆਰਾ 700,000 ਜਵਾਬਾਂ ਦੀ ਸਮੀਖਿਆ ਰਾਹੀਂ ਸੁਧਾਰਿਆ ਗਿਆ ਸੀ।
ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਕੁਸ਼ਲਤਾ: ਨਵਾਂ ਮਾਡਲ HealthBench ਬੈਂਚਮਾਰਕਸ 'ਤੇ ਭਾਰੀ "Thinking" ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਹੈ, ਪਰ ਬਹੁਤ ਘੱਟ ਲਾਗਤ 'ਤੇ।

ਨਵੇਂ ਸਿਹਤ ਬੈਂਚਮਾਰਕ ਵਿੱਚ OpenAI ਦਾ GPT 5.5 Instant ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ

ਨਵੇਂ ਹੈਲਥ ਬੈਂਚਮਾਰਕ ਵਿੱਚ OpenAI ਦਾ GPT-5.5 Instant ਡਾਕਟਰਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ

ਡਾਕਟਰਾਂ ਦੁਆਰਾ ਲਿਖੇ ਜਵਾਬਾਂ ਤੋਂ ਅੱਗੇ ਨਿਕਲਣਾ

Human-in-the-Loop: ਡਾਕਟਰੀ ਪ੍ਰਮਾਣਿਕਤਾ ਦਾ ਪੈਮਾਨਾ

ਡਾਕਟਰੀ ਬੁੱਧੀ ਦਾ ਲੋਕਤੰਤਰੀਕਰਨ

ਮੁੱਖ ਨੁਕਤੇ

Continue reading

𝗢𝗽𝗲𝗻𝗔𝗜 𝗚𝗣𝗧 𝟰𝗼 𝗕𝗿𝗶𝗻𝗴𝘀 𝗠𝘂𝗹𝘁𝗶𝗺𝗼𝗱𝗮𝗹 𝗜𝗻𝘁𝗲𝗹𝗹𝗶𝗴𝗲𝗻𝗰𝗲 𝘁𝗼 𝗘𝘃𝗲𝗿𝘆𝗼𝗻𝗲

𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗚𝗣𝗧 𝟱 𝗘𝗿𝗿𝗼𝗿𝘀 𝗪𝗶𝘁𝗵 𝟵𝟮% 𝗔𝗰𝗰𝘂𝗿𝗮𝗰𝘆

𝗚𝗣𝗧 𝟱.𝟱 𝗜𝗻𝘀𝘁𝗮𝗻𝘁 𝗕𝗲𝗮𝘁𝘀 𝗗𝗼𝗰𝘁𝗼𝗿𝘀 𝗶𝗻 𝗛𝗲𝗮𝗹𝘁𝗵 𝗧𝗲𝘀𝘁𝘀

OpenAI Unveils Scheduled Task Controls to Transform ChatGPT into an AI Assistant

OpenAI Launches GPT 5.5 Instant With Health Intelligence