GPT 5.5 Instant od OpenAI przewyższa lekarzy w nowym teście medycznym

Translated for your language. Read the original.

AI-assisted draft.

In this article

GPT-5.5 Instant od OpenAI przewyższa lekarzy w nowym benchmarku medycznym

OpenAI oficjalnie podniosło poziom swojej inteligencji w dziedzinie ochrony zdrowia poprzez wprowadzenie modelu GPT-5.5 Instant, co stanowi istotny kamień milowy w specjalistycznym rozumowaniu AI. Ta nowa aktualizacja wykazuje bezprecedensową zdolność do dorównania zaawansowanym modelom typu „Thinking” pod względem dokładności medycznej, pozostając jednocześnie znacznie bardziej opłacalną.

Przewyższanie odpowiedzi pisanych przez lekarzy

Najbardziej uderzającym wnioskiem z najnowszych danych OpenAI jest fakt, że GPT-5.5 Instant zaczął przewyższać lekarzy w konkretnych, ustandaryzowanych ocenach. W zastrzeżonych benchmarkach OpenAI model ten wyprzedził zarówno GPT-4o, jak i odpowiedzi przygotowane przez lekarzy w pięciu krytycznych kategoriach ewaluacyjnych. Co najważniejsze, model osiągnął wynik do 89,9 procent w zakresie podążania za instrukcjami, co zapewnia, że zapytania medyczne są obsługiwane poprzez precyzyjne, ustrukturyzowane i kontekstowo istotne wskazówki.

Ten skok wydajności nie jest jedynie stopniowy; stanowi on ogromną redukcję współczynnika błędów. OpenAI informuje, że częstotliwość błędnych stwierdzeń dotyczących zdrowia spadła o 71 procent w ciągu ostatnich dwóch miesięcy, co sygnalizuje szybką stabilizację zdolności rozumowania modelu w obszarach o wysokim znaczeniu.

Human-in-the-Loop: Skala walidacji medycznej

Rozwój GPT-5.5 Instant nie odbył się w próżni. Aby zapewnić bezpieczeństwo kliniczne i dokładność, OpenAI wykorzystało masowy system wzmacniania typu human-in-the-loop, angażujący globalną sieć ponad 260 lekarzy z 60 różnych krajów. Ten panel ekspertów przeanalizował ponad 700 000 odpowiedzi modelu, aby dopracować medyczne rozumowanie AI.

Wykorzystując takie benchmarki jak HealthBench i HealthBench Professional, OpenAI wykazało, że GPT

OpenAI rozdziela swoją strategię, aby obsługiwać oba końce spektrum: opinię publiczną oraz społeczność profesjonalistów. Podczas gdy GPT-5.5 Instant jest wdrażany dla wszystkich darmowych użytkowników ChatGPT (z uwzględnieniem limitów użytkowania), firma kontynuuje rozbudowę swoich ekosystemów klasy profesjonalnej poprzez „ChatGPT for Clinicians” oraz „OpenAI for Healthcare”. To podwójne podejście ma na celu zapewnienie natychmiastowej użyteczności w przygotowaniu pacjentów, przy jednoczesnym budowaniu solidnych, wyspecjalizowanych narzędzi dla personelu medycznego.

Kluczowe wnioski

Wyższa dokładność: GPT-5.5 Instant osiągnął wynik 89,9% w zakresie podążania za instrukcjami i zredukował liczbę błędnych stwierdzeń dotyczących zdrowia o 71% w ciągu dwóch miesięcy.
Weryfikacja ekspercka: Model został udoskonalony dzięki przeglądowi 700 000 odpowiedzi przez globalną sieć ponad 260 lekarzy.
Efektywność na dużą skalę: Nowy model dorównuje wydajnością ciężkim modelom typu „Thinking” w benchmarkach HealthBench, ale przy znacznie niższym koszcie.

GPT 5.5 Instant od OpenAI przewyższa lekarzy w nowym teście medycznym

GPT-5.5 Instant od OpenAI przewyższa lekarzy w nowym benchmarku medycznym

Przewyższanie odpowiedzi pisanych przez lekarzy

Human-in-the-Loop: Skala walidacji medycznej

Kluczowe wnioski

Continue reading

OpenAI GPT-4o wprowadza multimodalną inteligencję dla każdego

OpenAI przewiduje błędy GPT 5 z 92% dokładnością

GPT 5.5 Instant pokonuje lekarzy w testach zdrowotnych

OpenAI zaprezentowało funkcje planowania zadań, aby przekształcić ChatGPT w asystenta AI

OpenAI Launches GPT 5.5 Instant With Health Intelligence