GPT-5.5 Instant 在健康测试中表现优于医生

OpenAI 发布了 GPT-5.5 Instant。在健康测试中,它在准确性、清晰度和完整性方面均超越了医生。

该模型在两个月内将健康陈述中的错误率降低了 71%。

关键发现:

  • GPT-5.5 Instant 在 HealthBench 上达到了顶尖推理模型的水平。
  • 它能以更低的成本提供这些答案。
  • 来自 60 个国家的 260 多名医生审查了 700,000 条回复。
  • 免费版 ChatGPT 用户也可以使用这些改进后的功能。

许多人使用 ChatGPT 处理健康相关任务。他们会询问化验结果、保险问题或如何为就诊做准备。每周有超过 2.3 亿人提出健康问题。

重要背景: 该模型是与医生的常规书面回答进行对比。它不能取代专科医生的咨询或面对面的诊断。

您应当关注独立的审计结果,以验证这些关于降低错误率的说法。

来源:https://dev.to/gentic_news/gpt-55-instant-tops-doctor-answers-in-openai-health-tests-c48

可选学习社区:https://t.me/GyaanSetuAi