AI Agents Rival Doctors in Nature Studies: MIRA and AMIE Performance

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 ವಾರಗಳ ಹಿಂದೆ3min read

In this article

Nature ಅಧ್ಯಯನಗಳಲ್ಲಿ ವೈದ್ಯರಿಗೆ ಸರಿಸಮಾನವಾಗಿ ಸ್ಪರ್ಧಿಸುತ್ತಿರುವ AI ಏಜೆಂಟ್‌ಗಳು: MIRA ಮತ್ತು AMIE ಕಾರ್ಯಕ್ಷಮತೆ

Nature ನಲ್ಲಿ ಪ್ರಕಟವಾದ ಹೊಸ ಸಂಶೋಧನೆಯು, ಸಿಮ್ಯುಲೇಟೆಡ್ ವೈದ್ಯಕೀಯ ಪರಿಸರಗಳಲ್ಲಿ ಸ್ವಾಯತ್ತ AI ಏಜೆಂಟ್‌ಗಳು ಈಗ ಮಾನವ ವೈದ್ಯರ ಮಟ್ಟದಲ್ಲಿ ಅಥವಾ ಅದಕ್ಕಿಂತ ಹೆಚ್ಚಿನ ಮಟ್ಟದಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿವೆ ಎಂದು ಬಹಿರಂಗಪಡಿಸಿದೆ. ಈ ಮಹತ್ವದ ಬೆಳವಣಿಗೆಗಳು ರೋಗನಿರ್ಣಯದ ನಿಖರತೆಯಲ್ಲಿ ಒಂದು ದೊಡ್ಡ ಬದಲಾವಣೆಯನ್ನು ಸೂಚಿಸುತ್ತವೆಯಾದರೂ, ಪ್ರಸ್ತುತ ಸಂಕೀರ್ಣವಾದ "scaffolding" ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವುದು ವಿಕಸನಗೊಳ್ಳುತ್ತಿರುವ ಮಾಡೆಲ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳ ದೀರ್ಘಕಾಲೀನ ಪ್ರಯೋಜನಗಳನ್ನು ಸೀಮಿತಗೊಳಿಸಬಹುದು ಎಂದು ತಜ್ಞರು ಎಚ್ಚರಿಸಿದ್ದಾರೆ.

MIRA: ಸ್ವಾಯತ್ತ ತುರ್ತು ಚಿಕಿತ್ಸಾ ಕೊಠಡಿ ಏಜೆಂಟ್

TUD Dresden ಮತ್ತು Heidelberg University ನ ಸಂಶೋಧಕರಿಂದ ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ MIRA (Medical Intelligence for Reasoning and Action), ವರ್ಚುವಲ್ ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಆರೋಗ್ಯ ದಾಖಲೆಯೊಳಗೆ ಒಂದು ಸ್ವಾಯತ್ತ ಏಜೆಂಟ್ ಆಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯ LLMಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, MIRA ಹನ್ನೊಂದು ವಿಶೇಷ ಪರಿಕರಗಳ ಮೂಲಕ 85,000 ಕ್ಕೂ ಹೆಚ್ಚು ಆಯ್ಕೆಗಳಲ್ಲಿಂದ ನಿರ್ಧಾರ ತೆಗೆದುಕೊಳ್ಳಬಲ್ಲ ಇಂಜಿನ್ ಆಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

MIMIC-IV ಡೇಟಾಸೆಟ್‌ನ 500 ನೈಜ ತುರ್ತು ವಿಭಾಗದ ಪ್ರಕರಣಗಳ ವಿರುದ್ಧ MIRA ಅನ್ನು ಪರೀಕ್ಷಿಸಿದಾಗ ಅದ್ಭುತ ಫಲಿತಾಂಶಗಳು ಲಭ್ಯವಾಗಿವೆ:

ರೋಗನಿರ್ಣಯದ ನಿಖರತೆ: MIRA 88.9% ಸರಿಯಾದ ರೋಗನಿರ್ಣಯದ ದರವನ್ನು ಸಾಧಿಸಿದೆ.
ಮುಖಾಮುಖಿ ಹೋಲಿಕೆ: 311 ಪ್ರಕರಣಗಳ ಉಪಸಮೂಹದಲ್ಲಿ, MIRA 87.8% ಅಂಕಗಳನ್ನು ಗಳಿಸಿತು, ಇದು ಅನುಭವಿ ತಜ್ಞರ (78.1%) ಮತ್ತು ರೆಸಿಡೆಂಟ್ ಹಾಗೂ ತಜ್ಞರ ಮಿಶ್ರ ತಂಡಗಳಿಗಿಂತ (71.1%) ಗಮನಾರ್ಹವಾಗಿ ಉತ್ತಮವಾಗಿದೆ.
ವೈದ್ಯಕೀಯ ಸಾಮರ್ಥ್ಯಗಳು: ಈ ವ್ಯವಸ್ಥೆಯು ಹೆಚ್ಚಿನ ತೀವ್ರತೆಯ ಸನ್ನಿವೇಶಗಳಲ್ಲಿ ಅತ್ಯುತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಿತು, ಅಪೆಂಡಿಸೈಟಿಸ್‌ಗಾಗಿ 98.6% ಮತ್ತು ಪ್ಯಾಂಕ್ರಿಯಾಟೈಟಿಸ್‌ಗಾಗಿ 92.3% ನಿಖರತೆಯನ್ನು ತಲುಪಿತು.
ಸುರಕ್ಷತಾ ಗುಣಲಕ್ಷಣಗಳು: ಅಂಧ ವಿಮರ್ಶಕರು (Blinded reviewers) ಯಾವುದೇ ಅಪಾಯಕಾರಿ ಔಷಧಿಯ ಸಂವಹನಗಳು ಅಥವಾ ತಪ್ಪಾದ ಡೋಸೇಜ್ ಅನ್ನು ಕಂಡುಬಂದಿಲ್ಲ ಎಂದು ತಿಳಿಸಿದ್ದಾರೆ, ಮತ್ತು ಆಸ್ಪತ್ರೆಗೆ ದಾಖಲಿಸುವ ಅಗತ್ಯವಿರುವ ರೋಗಿಗಳನ್ನು ಗುರುತಿಸುವಲ್ಲಿ ಈ ವ್ಯವಸ್ಥೆಯು ಪರಿಪೂರ್ಣ ದಾಖಲೆಯನ್ನು ಸಾಧಿಸಿದೆ.

Google ನ AMIE: ದೀರ್ಘಕಾಲೀನ ವೈದ್ಯಕೀಯ ಮಾರ್ಗಸೂಚಿಗಳಲ್ಲಿ ಪರಿಣತಿ

MIRA ತೀವ್ರವಾದ ತರ್ಕದ ಮೇಲೆ ಗಮನ ಹರಿಸಿದರೆ, Google ನ AMIE (Articulate Medical Intelligence Explorer) ದೀರ್ಘಕಾಲೀನ ಪ್ರಾಥಮಿಕ ಆರೈಕೆಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. AMIE ದ್ವಿ-ಏಜೆಂಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು ಬಳಸುತ್ತದೆ: ರೋಗಿಯೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಲು ಒಂದು ಸಂಭಾಷಣಾ ಏಜೆಂಟ್ ಮತ್ತು ಪ್ರಕರಣಗಳನ್ನು UK ನ NICE Guidance ನಂತಹ ವೈದ್ಯಕೀಯ ಮಾರ್ಗಸೂಚಿಗಳೊಂದಿಗೆ ಹೋಲಿಕೆ ಮಾಡಲು ಒಂದು ಬ್ಯಾಕ್‌ಗ್ರೌಂಡ್ ಏಜೆಂಟ್.

ಹಲವಾರು ಭೇಟಿಗಳನ್ನು ಒಳಗೊಂಡ 100 ಪ್ರಕರಣಗಳ ಅಧ್ಯಯನದಲ್ಲಿ, AMIE ಚಿಕಿತ್ಸಾ ನಿರ್ಧಾರಗಳಲ್ಲಿ ವೈದ್ಯರಿಗೆ ಸಮಾನವಾಗಿತ್ತು ಮತ್ತು ಮಾರ್ಗಸೂಚಿಗಳ ಪಾಲನೆಯಲ್ಲಿ ಅವರನ್ನು ಮೀರಿಸಿತು. ಗಮನಾರ್ಹವಾಗಿ, ಮಾನವ ವೈದ್ಯರಿಗೆ ಕೇವಲ 72% ರಷ್ಟು ಮಾತ್ರ ಸೂಕ್ತವೆಂದು ಪರಿಗಣಿಸಲ್ಪಟ್ಟರೆ, AMIE ನ ಚಿಕಿತ್ಸಾ ಯೋಜನೆಗಳು 95% ಪ್ರಕರಣಗಳಲ್ಲಿ ಸೂಕ್ತವೆಂದು ರೇಟ್ ಮಾಡಲ್ಪಟ್ಟವು. AMIE ಪರಮಾವಧಿ ಫಾರ್ಮಾಸ್ಯುಟಿಕಲ್ ಜ್ಞಾನದ ಕಠಿಣ ಪರೀಕ್ಷೆಯಾದ RxQA ಬೆಂಚ್‌ಮಾರ್ಕ್‌ನಲ್ಲಿಯೂ ವೈದ್ಯರಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಿತು, ಇದನ್ನು ಪರವಾನಗಿ ಪಡೆದ ಫಾರ್ಮಾಸಿಸ್ಟ್‌ಗಳು ಪರಿಶೀಲಿಸಿದ್ದಾರೆ.

"Scaffolding" ಸಂದಿಗ್ಧತೆ ಮತ್ತು ಭವಿಷ್ಯದ ಮಿತಿಗಳು

ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯ ಹೊರತಾಗಿಯೂ, ಅಧ್ಯಯನಗಳಿಂದ ಒಂದು ನಿರ್ಣಾಯಕ ತಾಂತ್ರಿಕ ಸೂಕ್ಷ್ಮತೆ ಹೊರಹೊಮ್ಮಿದೆ. MIRA (GPT-4o ಮತ್ತು o1-preview ಬಳಸುವ) ಮತ್ತು AMIE (Gemini 1.5 Flash ಬಳಸುವ) ಎರಡೂ "scaffolding" ಮೇಲೆ ಹೆಚ್ಚು ಅವಲಂಬಿತವಾಗಿವೆ—ಅಂದರೆ ಮಾಡೆಲ್‌ನ ತಾರ್ಕಿಕತೆಯನ್ನು ಮಾರ್ಗದರ್ಶನ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಸಂಕೀರ್ಣ ಬಾಹ್ಯ ಚೌಕಟ್ಟುಗಳು.

ಪೂರಕ ಪ್ರಯೋಗಗಳು ಸಂಭಾವ್ಯ "aging" ಸಮಸ್ಯೆಯನ್ನು ಸೂಚಿಸಿವೆ: ಈ scaffolding ಹಳೆಯ ಅಥವಾ ಸಣ್ಣ ಮಾಡೆಲ್‌ಗಳ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಗಣನೀಯವಾಗಿ ಹೆಚ್ಚಿಸಿದರೂ, ಮೂಲಭೂತ ಮಾಡೆಲ್‌ಗಳು (foundational models) ಹೆಚ್ಚು ಸಹಜವಾಗಿ ಸಾಮರ್ಥ್ಯಶಾಲಿಯಾಗುತ್ತಿದ್ದಂತೆ ಇದರ ಅಗತ್ಯವು ಕಡಿಮೆಯಾಗಬಹುದು. ಪ್ರಸ್ತುತ ಯಶಸ್ಸು ಉನ್ನತ ಬುದ್ಧಿವಂತಿಕೆಯ ಫಲವೇ ಅಥವಾ ಕೇವಲ ಅತ್ಯುತ್ತಮ ಪ್ರಾಂಪ್ಟ್ ಇಂಜಿನಿಯರಿಂಗ್ ಮತ್ತು ವಾಸ್ತುಶಿಲ್ಪದ "crutches" (ಸಹಾಯಕಾರಿ ಸಾಧನಗಳು) ಫಲವೇ ಎಂಬ ಪ್ರಶ್ನೆಗಳು ಇದು ಎತ್ತುತ್ತದೆ.

ಇದಲ್ಲದೆ, ಈ ಫಲಿತಾಂಶಗಳು ಅನುಕರಿಸಲಾದ (simulated), ರಚನಾತ್ಮಕ ಡೇಟಾದಿಂದ ಪಡೆದವು ಎಂದು ಸಂಶೋಧಕರು ಎಚ್ಚರಿಸುತ್ತಾರೆ. ಪ್ರೊಫೆಸರ್ ಕ್ಯಾಥರೀನ್ ಪೋಪ್ ಅವರಂತಹ ತಜ್ಞರು, ಈ ಪರಿಸರಗಳು ನೈಜ ಆರೋಗ್ಯ ರಕ್ಷಣೆಯ "ಅಸ್ತವ್ಯಸ್ತವಾದ, ಸಂಕೀರ್ಣವಾದ, ಮಾನವ ಜಗತ್ತನ್ನು" ಹೊಂದಿಲ್ಲ ಎಂದು ಗಮನಿಸುತ್ತಾರೆ ಮತ್ತು ತರಬೇತಿಯ ಸಮಯದಲ್ಲಿ ಮಾಡೆಲ್‌ಗಳು ಈಗಾಗಲೇ MIMIC-IV ಡೇಟಾಸೆಟ್‌ನ ಕೆಲವು ಭಾಗಗಳನ್ನು ನೋಡಿದಿರಬಹುದು ಎಂಬ ಅಪಾಯವೂ ಇದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

ಅನುಕರಣೆಯಲ್ಲಿ (Simulation) ಕ್ಲಿನಿಕಲ್ ಶ್ರೇಷ್ಠತೆ: ನಿಯಂತ್ರಿತ, ಅನುಕರಿಸಲಾದ ವೈದ್ಯಕೀಯ ಪರಿಸರಗಳಲ್ಲಿ AI ಏಜೆಂಟ್‌ಗಳಾದ MIRA ಮತ್ತು AMIE, ಮಾನವ ತಜ್ಞರಿಗಿಂತ ಹೆಚ್ಚಿನ ರೋಗನಿರ್ಣಯದ ನಿಖರತೆ ಮತ್ತು ಮಾರ್ಗಸೂಚಿಗಳ ಪಾಲನೆಯನ್ನು ಪ್ರದರ್ಶಿಸಿವೆ.
ಸುರಕ್ಷತೆ ಮತ್ತು ನಿಖರತೆ: ಎರಡೂ ವ್ಯವಸ್ಥೆಗಳು ಔಷಧ ನಿರ್ವಹಣೆ ಮತ್ತು ಆಸ್ಪತ್ರೆ ದಾಖಲಾತಿ ಗುರುತಿಸುವಿಕೆಯಲ್ಲಿ ಅಸಾಧಾರಣ ವಿಶ್ವಾಸಾರ್ಹತೆಯನ್ನು ತೋರಿಸಿವೆ, ಮತ್ತು ಯೋಜನೆಯ ಪರಿಪೂರ್ಣತೆಯಲ್ಲಿ ಮಾನವರಿಗಿಂತ ಉತ್ತಮ ಪ್ರದರ್ಶನ ನೀಡಿದೆವು.
ಸ್ಕ್ಯಾಫೋಲ್ಡಿಂಗ್ ಅಂಶ (The Scaffolding Factor): ಪ್ರಸ್ತುತ ಯಶಸ್ಸಿನ ಹೆಚ್ಚಿನ ಭಾಗವು ಸಂಕೀರ್ಣವಾದ ಮಲ್ಟಿ-ಏಜೆಂಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ, ಇದು ಮೂಲಭೂತ LLMಗಳು ವಿಕಸನಗೊಳ್ಳುತ್ತಿದ್ದಂತೆ ಅನಗತ್ಯವಾಗಬಹುದು.

AI Agents Rival Doctors in Nature Studies: MIRA and AMIE Performance

Nature ಅಧ್ಯಯನಗಳಲ್ಲಿ ವೈದ್ಯರಿಗೆ ಸರಿಸಮಾನವಾಗಿ ಸ್ಪರ್ಧಿಸುತ್ತಿರುವ AI ಏಜೆಂಟ್‌ಗಳು: MIRA ಮತ್ತು AMIE ಕಾರ್ಯಕ್ಷಮತೆ

MIRA: ಸ್ವಾಯತ್ತ ತುರ್ತು ಚಿಕಿತ್ಸಾ ಕೊಠಡಿ ಏಜೆಂಟ್

Google ನ AMIE: ದೀರ್ಘಕಾಲೀನ ವೈದ್ಯಕೀಯ ಮಾರ್ಗಸೂಚಿಗಳಲ್ಲಿ ಪರಿಣತಿ

"Scaffolding" ಸಂದಿಗ್ಧತೆ ಮತ್ತು ಭವಿಷ್ಯದ ಮಿತಿಗಳು

ಪ್ರಮುಖ ಅಂಶಗಳು

Continue reading

ಅಂಬಿಯೆಂಟ್ ಎಐ ಏಜೆಂಟ್‌ಗಳು ವರ್ಸಸ್ ಸಾಂಪ್ರದಾಯಿಕ ಆಟೊಮೇಷನ್

Why Treating AI Agents as Coworkers is a Major Productivity Trap

ನಿಮ್ಮ AI ಏಜೆಂಟ್‌ಗೆ ಎಷ್ಟು ಸ್ವಾಯತ್ತತೆ ಇರಬೇಕು?

ನಿಮ್ಮ AI ಏಜೆಂಟ್‌ಗೆ ಎಷ್ಟು ಸ್ವಾಯತ್ತತೆ ಇರಬೇಕು?