కొత్త ఆరోగ్య బెంచ్‌మార్క్‌లో OpenAI యొక్క GPT 5.5 Instant, వైద్యుల కంటే మెరుగైన పనితీరును కనబరిచింది

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial4 రోజుల క్రితం2min read

In this article

కొత్త హెల్త్ బెంచ్‌మార్క్‌లో వైద్యుల కంటే OpenAI యొక్క GPT-5.5 Instant మెరుగైన పనితీరు కనబరిచింది

GPT-5.5 Instant మోడల్‌ను లాంచ్ చేయడం ద్వారా OpenAI అధికారికంగా తన హెల్త్‌కేర్ ఇంటెలిజెన్స్‌ను మెరుగుపరిచింది, ఇది ప్రత్యేక AI రీజనింగ్‌లో ఒక ముఖ్యమైన మైలురాయిని సూచిస్తుంది. ఈ కొత్త అప్‌గ్రేడ్, వైద్య ఖచ్చితత్వంలో హై-ఎండ్ "Thinking" మోడళ్లతో సమానంగా ఉండే అపూర్వమైన సామర్థ్యాన్ని ప్రదర్శిస్తూనే, గణనీయంగా తక్కువ ఖర్చుతో కూడుకున్నదిగా ఉంది.

వైద్యులు రాసిన సమాధానాలను అధిగమించడం

OpenAI యొక్క తాజా డేటా నుండి వెల్లడైన అత్యంత ఆశ్చర్యకరమైన విషయం ఏమిటంటే, నిర్దిష్ట ప్రమాణీకరించబడిన మూల్యాంకనాలలో GPT-5.5 Instant మానవ వైద్యుల కంటే మెరుగైన పనితీరును కనబరిచింది. OpenAI యొక్క స్వంత బెంచ్‌మార్క్‌లలో, ఈ మోడల్ ఐదు కీలక మూల్యాంకన విభాగాలలో GPT-4o మరియు వైద్యులు రాసిన సమాధానాలు రెండింటినీ అధిగమించింది. ముఖ్యంగా, ఇన్‌స్ట్రక్షన్ ఫాలోయింగ్‌లో (instruction following) ఈ మోడల్ 89.9 శాతం వరకు స్కోరు సాధించింది, దీనివల్ల వైద్యపరమైన ప్రశ్నలకు ఖచ్చితమైన, నిర్మాణాత్మకమైన మరియు సందర్భోచితంగా సంబంధిత మార్గదర్శకత్వం లభిస్తుంది.

ఈ పనితీరులో వచ్చిన మార్పు కేవలం స్వల్పమైనది మాత్రమే కాదు; ఇది లోపాల రేటులో భారీ తగ్గుదలను సూచిస్తుంది. గత రెండు నెలల్లో తప్పుడు ఆరోగ్య ప్రకటనల ఫ్రీక్వెన్సీ 71 శాతం పడిపోయిందని OpenAI నివేదించింది, ఇది అత్యంత కీలకమైన రంగాలలో మోడల్ యొక్క రీజనింగ్ సామర్థ్యాలు వేగంగా స్థిరపడుతున్నాయని సూచిస్తోంది.

Human-in-the-Loop: వైద్య ధృవీకరణ యొక్క పరిధి

GPT-5.5 Instant అభివృద్ధి అనేది ఏకాంతంగా జరిగిన ప్రక్రియ కాదు. క్లినికల్ భద్రత మరియు ఖచ్చితత్వాన్ని నిర్ధారించడానికి, OpenAI 60 వేర్వేరు దేశాల నుండి 260 మందికి పైగా వైద్యుల గ్లోబల్ నెట్‌వర్క్‌తో కూడిన భారీ human-in-the-loop రీన్‌ఫోర్స్‌మెంట్ సిస్టమ్‌ను ఉపయోగించింది. AI యొక్క వైద్య రీజనింగ్‌ను మెరుగుపరచడానికి (fine-tune) ఈ నిపుణుల ప్యానెల్ 700,000 కంటే ఎక్కువ మోడల్ సమాధానాలను సమీక్షించింది.

HealthBench మరియు HealthBench Professional వంటి బెంచ్‌మార్క్‌లను ఉపయోగించడం ద్వారా, పరిశ్రమలోని అత్యంత ఖరీదైన, భారీ కంప్యూటింగ్ అవసరమయ్యే "Thinking" మోడళ్ల పనితీరును GPT-5.5 Instant అందుకోగలదని OpenAI నిరూపించింది. కీలకమైన విషయం ఏమిటంటే, ఇది చాలా తక్కువ నిర్వహణ ఖర్చుతో దీనిని సాధిస్తుంది, తద్వారా ఉన్నత స్థాయి వైద్య మేధస్సును సామాన్యులకు మరింత అందుబాటులోకి తెస్తుంది.

వైద్య మేధస్సును అందరికీ అందుబాటులోకి తీసుకురావడం

ప్రస్తుత వినియోగ పరిమాణాన్ని పరిగణనలోకి తీసుకుంటే, విస్తృతమైన AI రంగంపై దీని ప్రభావం చాలా లోతైనది. సంక్లిష్టమైన ల్యాబ్ రిపోర్టులను అర్థం చేసుకోవడం నుండి ఇన్సూరెన్స్ సమస్యలను పరిష్కరించుకోవడం వరకు, ఆరోగ్య సంబంధిత ప్రశ్నల కోసం ప్రతి వారం 230 మిలియన్ల కంటే ఎక్కువ మంది ప్రజలు ChatGPTని ఉపయోగిస్తున్నారు, కాబట్టి ఈ మోడళ్ల ఖచ్చితత్వం అనేది ప్రజల ప్రాముఖ్యత కలిగిన అంశం.

OpenAI తన వ్యూహాన్ని రెండు విభిన్న వర్గాలకు సేవలు అందించేలా విభజిస్తోంది: సామాన్య ప్రజలు మరియు వృత్తిపరమైన వర్గం. GPT-5.5 Instant అనేది వినియోగ పరిమితులకు లోబడి అందరు ఉచిత ChatGPT వినియోగదారులకు అందుబాటులోకి వస్తున్నప్పటికీ, కంపెనీ "ChatGPT for Clinicians" మరియు "OpenAI for Healthcare" ద్వారా తన వృత్తిపరమైన స్థాయి ఎకోసిస్టమ్‌లను విస్తరిస్తోంది. ఈ ద్వంద్వ విధానం రోగుల సన్నద్ధత కోసం తక్షణ ప్రయోజనాన్ని అందించడమే కాకుండా, వైద్య సిబ్బంది కోసం పటిష్టమైన, ప్రత్యేకమైన సాధనాలను నిర్మించడమే లక్ష్యంగా పెట్టుకుంది.

ముఖ్య అంశాలు

అత్యుత్తమ ఖచ్చితత్వం: GPT-5.5 Instant 89.9% ఇన్‌స్ట్రక్షన్-ఫాలోయింగ్ స్కోర్‌ను సాధించింది మరియు రెండు నెలల్లో తప్పుడు ఆరోగ్య ప్రకటనలను 71% తగ్గించింది.
నిపుణుల ధృవీకరణ: 260 కంటే ఎక్కువ మంది వైద్యుల ప్రపంచ నెట్‌వర్క్ ద్వారా 700,000 ప్రతిస్పందనలను సమీక్షించడం ద్వారా ఈ మోడల్‌ను మెరుగుపరిచారు.
భారీ స్థాయిలో సామర్థ్యం: కొత్త మోడల్ HealthBench బెంచ్‌మార్క్‌లలో భారీ "Thinking" మోడల్‌ల పనితీరుకు సమానంగా ఉంటుంది, కానీ చాలా తక్కువ ఖర్చుతో లభిస్తుంది.

కొత్త ఆరోగ్య బెంచ్‌మార్క్‌లో OpenAI యొక్క GPT 5.5 Instant, వైద్యుల కంటే మెరుగైన పనితీరును కనబరిచింది

కొత్త హెల్త్ బెంచ్‌మార్క్‌లో వైద్యుల కంటే OpenAI యొక్క GPT-5.5 Instant మెరుగైన పనితీరు కనబరిచింది

వైద్యులు రాసిన సమాధానాలను అధిగమించడం

Human-in-the-Loop: వైద్య ధృవీకరణ యొక్క పరిధి

వైద్య మేధస్సును అందరికీ అందుబాటులోకి తీసుకురావడం

ముఖ్య అంశాలు

Continue reading

OpenAI GPT-4o అందరికీ మల్టీమోడల్ ఇంటెలిజెన్స్‌ను అందిస్తోంది

𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗚𝗣𝗧 𝟱 𝗘𝗿𝗿𝗼𝗿𝘀 𝗪𝗶𝘁𝗵 𝟵𝟮% 𝗔𝗰𝗰𝘂𝗿𝗮𝗰𝘆

ఆరోగ్య పరీక్షలలో వైద్యులను మించిపోయిన GPT 5.5 ఇన్‌స్టంట్

OpenAI Unveils Scheduled Task Controls to Transform ChatGPT into an AI Assistant

OpenAI Launches GPT 5.5 Instant With Health Intelligence