ಹೊಸ ಆರೋಗ್ಯ ಬೆಂಚ್ಮಾರ್ಕ್ನಲ್ಲಿ ವೈದ್ಯರಿಗಿಂತ ಉತ್ತಮ ಪ್ರದರ್ಶನ ನೀಡಿದ OpenAI ನ GPT-5.5 Instant
OpenAI ತನ್ನ GPT-5.5 Instant ಮಾಡೆಲ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ಮೂಲಕ ತನ್ನ ಆರೋಗ್ಯ ರಕ್ಷಣಾ ಬುದ್ಧಿಮತ್ತೆಯನ್ನು (healthcare intelligence) ಅಧಿಕೃತವಾಗಿ ಮೇಲ್ದರ್ಜೆಗೇರಿಸಿದೆ, ಇದು ವಿಶೇಷ AI ತರ್ಕದಲ್ಲಿ (reasoning) ಒಂದು ಪ್ರಮುಖ ಮೈಲಿಗಲ್ಲಾಗಿದೆ. ಈ ಹೊಸ ಅಪ್ಗ್ರೇಡ್ ವೈದ್ಯಕೀಯ ನಿಖರತೆಯಲ್ಲಿ ಉನ್ನತ ಮಟ್ಟದ "Thinking" ಮಾಡೆಲ್ಗಳಿಗೆ ಸಮನಾಗಿ ಸ್ಪರ್ಧಿಸುವ ಅಪ್ರತಿಮ ಸಾಮರ್ಥ್ಯವನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ ಮತ್ತು ಅದೇ ಸಮಯದಲ್ಲಿ ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚು ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿಯಾಗಿದೆ.
ವೈದ್ಯರು ಬರೆದ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಮೀರಿಸುವಿಕೆ
OpenAI ನ ಇತ್ತೀಚಿನ ದತ್ತಾಂಶದ ಪ್ರಕಾರ ಅತ್ಯಂತ ಆಘಾತಕಾರಿ ವಿಷಯವೆಂದರೆ, ನಿರ್ದಿಷ್ಟ ಪ್ರಮಾಣಿತ ಮೌಲ್ಯಮಾಪನಗಳಲ್ಲಿ GPT-5.5 Instant ಮಾನವ ವೈದ್ಯರಿಗಿಂತ ಉತ್ತಮ ಪ್ರದರ್ಶನ ನೀಡಲು ಪ್ರಾರಂಭಿಸಿದೆ. OpenAI ನ ಸ್ವಂತ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ, ಈ ಮಾಡೆಲ್ ಐದು ಪ್ರಮುಖ ಮೌಲ್ಯಮಾಪನ ವರ್ಗಗಳಲ್ಲಿ GPT-4o ಮತ್ತು ವೈದ್ಯರು ಬರೆದ ಉತ್ತರಗಳೆರಡನ್ನೂ ಮೀರಿಸಿದೆ. ಮುಖ್ಯವಾಗಿ, ಈ ಮಾಡೆಲ್ ಸೂಚನೆಗಳನ್ನು ಪಾಲಿಸುವಲ್ಲಿ (instruction following) 89.9 ಪ್ರತಿಶತದಷ್ಟು ಅಂಕವನ್ನು ಗಳಿಸಿದೆ, ಇದು ವೈದ್ಯಕೀಯ ಪ್ರಶ್ನೆಗಳಿಗೆ ನಿಖರವಾದ, ರಚನಾತ್ಮಕ ಮತ್ತು ಸಂದರ್ಭಕ್ಕೆ ಅನುಗುಣವಾದ ಮಾರ್ಗದರ್ಶನ ಸಿಗುವಂತೆ ಮಾಡುತ್ತದೆ.
ಈ ಕಾರ್ಯಕ್ಷಮತೆಯ ಏರಿಕೆ ಕೇವಲ ಸಣ್ಣ ಬದಲಾವಣೆಯಲ್ಲ; ಇದು ತಪ್ಪುಗಳ ಪ್ರಮಾಣದಲ್ಲಿನ ಭಾರಿ ಇಳಿಕೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ. ಕಳೆದ ಎರಡು ತಿಂಗಳುಗಳಲ್ಲಿ ತಪ್ಪು ಆರೋಗ್ಯ ಹೇಳಿಕೆಗಳ ಆವರ್ತನವು 71 ಪ್ರತಿಶತದಷ್ಟು ಕುಸಿದಿದೆ ಎಂದು OpenAI ವರದಿ ಮಾಡಿದೆ, ಇದು ಹೆಚ್ಚಿನ ಜವಾಬ್ದಾರಿಯುತ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಮಾಡೆಲ್ನ ತರ್ಕ ಸಾಮರ್ಥ್ಯದ (reasoning capabilities) ಕ್ಷಿಪ್ರ ಸ್ಥಿರತೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ.
Human-in-the-Loop: ವೈದ್ಯಕೀಯ ಮೌಲ್ಯೀಕರಣದ ವ್ಯಾಪ್ತಿ
GPT-5.5 Instant ನ ಅಭಿವೃದ್ಧಿಯು ಶೂನ್ಯದಲ್ಲಿ ನಡೆದಿದ್ದಲ್ಲ. ಕ್ಲಿನಿಕಲ್ ಸುರಕ್ಷತೆ ಮತ್ತು ನಿಖರತೆಯನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು, OpenAI 60 ವಿವಿಧ ದೇಶಗಳ 260 ಕ್ಕೂ ಹೆಚ್ಚು ವೈದ್ಯರ ಜಾಗತಿಕ ನೆಟ್ವರ್ಕ್ ಒಳಗೊಂಡಿರುವ ಬೃಹತ್ human-in-the-loop ಬಲವರ್ಧನಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸಿಕೊಂಡಿದೆ. AI ನ ವೈದ್ಯಕೀಯ ತರ್ಕವನ್ನು ಸೂಕ್ಷ್ಮಗೊಳಿಸಲು (fine-tune) ಈ ತಜ್ಞರ ಸಮಿತಿಯು 700,000 ಕ್ಕೂ ಹೆಚ್ಚು ಮಾಡೆಲ್ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಪರಿಶೀಲಿಸಿದೆ.
HealthBench ಮತ್ತು HealthBench Professional ನಂತಹ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳನ್ನು ಬಳಸುವ ಮೂಲಕ, GPT-5.5 Instant ಉದ್ಯಮದ ಅತ್ಯಂತ ದುಬಾರಿ ಮತ್ತು ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟಿಂಗ್ ಸಾಮರ್ಥ್ಯದ "Thinking" ಮಾಡೆಲ್ಗಳ ಕಾರ್ಯಕ್ಷಮತೆಗೆ ಸಮನಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಲ್ಲದು ಎಂದು OpenAI ತೋರಿಸಿಕೊಟ್ಟಿದೆ. ಮುಖ್ಯವಾಗಿ, ಇದು ಅತ್ಯಲ್ಪ ಕಾರ್ಯಾಚರಣಾ ವೆಚ್ಚದಲ್ಲಿ ಇದನ್ನು ಮಾಡುತ್ತದೆ, ಇದರಿಂದಾಗಿ ಉನ್ನತ ಮಟ್ಟದ ವೈದ್ಯಕೀಯ ಬುದ್ಧಿಮತ್ತೆಯು ಜನಸಾಮಾನ್ಯರಿಗೆ ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಲಭ್ಯವಾಗುತ್ತದೆ.
ವೈದ್ಯಕೀಯ ಬುದ್ಧಿಮತ್ತೆಯ ಪ್ರಜಾಪ್ರಭುತ್ವೀಕರಣ (Democratizing)
ಪ್ರಸ್ತುತ ಬಳಕೆಯ ವ್ಯಾಪ್ತಿಯನ್ನು ಪರಿಗಣಿಸಿದರೆ, ವಿಶಾಲವಾದ AI ವಲಯಕ್ಕೆ ಇದರ ಪರಿಣಾಮಗಳು ಆಳವಾಗಿವೆ. ಸಂಕೀರ್ಣ ಪ್ರಯೋಗಾಲಯದ ವರದಿಗಳನ್ನು ಅರ್ಥೈಸಿಕೊಳ್ಳುವುದರಿಂದ ಹಿಡಿದು ವಿಮೆ ಸಂಕೀರ್ಣತೆಗಳನ್ನು ನಿಭಾಯಿಸುವವರೆಗೆ, ವಾರಕ್ಕೆ 230 ಮಿಲಿಯನ್ಗಿಂತ ಹೆಚ್ಚು ಜನರು ಆರೋಗ್ಯ ಸಂಬಂಧಿತ ವಿಚಾರಗಳಿಗಾಗಿ ChatGPT ಅನ್ನು ಬಳಸುತ್ತಿದ್ದಾರೆ — ಹೀಗಾಗಿ ಈ ಮಾಡೆಲ್ಗಳ ನಿಖರತೆಯು ಸಾರ್ವಜನಿಕ ಪ್ರಾಮುಖ್ಯತೆಯ ವಿಷಯವಾಗಿದೆ.
OpenAI ತನ್ನ ತಂತ್ರಗಾರಿಕೆಯನ್ನು ಎರಡು ವಿಧಗಳಾಗಿ ವಿಭಜಿಸುತ್ತಿದೆ: ಸಾಮಾನ್ಯ ಸಾರ್ವಜನಿಕರು ಮತ್ತು ವೃತ್ತಿಪರ ಸಮುದಾಯ. GPT-5.5 Instant ಅನ್ನು ಎಲ್ಲಾ ಉಚಿತ ChatGPT ಬಳಕೆದಾರರಿಗೆ (ಬಳಕೆಯ ಮಿತಿಗಳಿಗೆ ಒಳಪಟ್ಟು) ನೀಡಲಾಗುತ್ತಿರುವಾಗ, ಕಂಪನಿಯು "ChatGPT for Clinicians" ಮತ್ತು "OpenAI for Healthcare" ಮೂಲಕ ತನ್ನ ವೃತ್ತಿಪರ-ಶ್ರೇಣಿಯ ಪರಿಸರ ವ್ಯವಸ್ಥೆಗಳನ್ನು ವಿಸ್ತರಿಸುತ್ತಲೇ ಇದೆ. ಈ ದ್ವಿಮುಖ ವಿಧಾನವು ರೋಗಿಗಳ ಸಿದ್ಧತೆಗಾಗಿ ತಕ್ಷಣದ ಉಪಯುಕ್ತತೆಯನ್ನು ಒದಗಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದ್ದು, ಅದೇ ಸಮಯದಲ್ಲಿ ವೈದ್ಯಕೀಯ ಕಾರ್ಯಪಡೆಯನ್ನು 위한 ಬಲಿಷ್ಠ ಮತ್ತು ವಿಶೇಷ ಪರಿಕರಗಳನ್ನು ನಿರ್ಮಿಸುವ ಉದ್ದೇಶವನ್ನು ಹೊಂದಿದೆ.
ಪ್ರಮುಖ ಅಂಶಗಳು
- ಉತ್ತಮ ನಿಖರತೆ: GPT-5.5 Instant 89.9% ಸೂಚನೆಗಳನ್ನು ಪಾಲಿಸುವ (instruction-following) ಸ್ಕೋರ್ ಅನ್ನು ಸಾಧಿಸಿದೆ ಮತ್ತು ಎರಡು ತಿಂಗಳಲ್ಲಿ ತಪ್ಪಾದ ಆರೋಗ್ಯ ಹೇಳಿಕೆಗಳನ್ನು 71% ರಷ್ಟು ಕಡಿಮೆ ಮಾಡಿದೆ.
- ತಜ್ಞರ ಮೌಲ್ಯೀಕರಣ: 260ಕ್ಕೂ ಹೆಚ್ಚು ವೈದ್ಯರ ಜಾಗತಿಕ ನೆಟ್ವರ್ಕ್ನ ಮೂಲಕ 700,000 ಪ್ರತಿಕ್ರಿಯೆಗಳ ಪರಿಶೀಲನೆಯ ಮೂಲಕ ಈ ಮಾಡೆಲ್ ಅನ್ನು ಪರಿಷ್ಕರಿಸಲಾಗಿದೆ.
- ವ್ಯಾಪಕ ಮಟ್ಟದಲ್ಲಿ ದಕ್ಷತೆ: ಹೊಸ ಮಾಡೆಲ್ HealthBench ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ ಭಾರೀ "Thinking" ಮಾಡೆಲ್ಗಳ ಕಾರ್ಯಕ್ಷಮತೆಗೆ ಸಮಾನವಾಗಿದೆ, ಆದರೆ ಇದು ಅತ್ಯಂತ ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿದೆ.