Nature ஆய்வுகளில் மருத்துவர்களுக்கு இணையாகச் செயல்படும் AI முகவர்கள்: MIRA மற்றும் AMIE-ன் செயல்பாடு

Nature இதழில் வெளியிடப்பட்ட புதிய ஆய்வின்படி, உருவகப்படுத்தப்பட்ட மருத்துவச் சூழல்களில் (simulated medical environments), தன்னாட்சி AI முகவர்கள் (autonomous AI agents) இப்போது மனித மருத்துவர்களுக்கு இணையான அல்லது அதற்கும் மேலான செயல்திறனை வெளிப்படுத்துகின்றன. இந்த முன்னேற்றங்கள் நோய் கண்டறிதலில் ஒரு மிகப்பெரிய மாற்றத்தைக் குறித்தாலும், தற்போதைய சிக்கலான "scaffolding" முறையிலான சார்புநிலை, வளர்ந்து வரும் மாடல் கட்டமைப்புகளின் (model architectures) நீண்டகாலப் பயன்களைக் குறைக்கக்கூடும் என்று நிபுணர்கள் எச்சரிக்கின்றனர்.

MIRA: தன்னாட்சி அவசர சிகிச்சை பிரிவு முகவர்

TUD Dresden மற்றும் Heidelberg பல்கலைக்கழக ஆராய்ச்சியாளர்களால் உருவாக்கப்பட்ட MIRA (Medical Intelligence for Reasoning and Action), ஒரு மெய்நிகர் மின்னணு சுகாதாரப் பதிவிற்குள் (virtual electronic health record) ஒரு தன்னாட்சி முகவராகச் செயல்படுகிறது. சாதாரண LLM-களைப் போலல்லாமல், MIRA பதினொரு சிறப்புத் கருவிகள் மூலம் 85,000-க்கும் மேற்பட்ட விருப்பங்களிலிருந்து ஒன்றைத் தேர்ந்தெடுக்கக்கூடிய ஒரு முடிவெடுக்கும் இயந்திரமாகச் செயல்படுகிறது.

MIMIC-IV தரவுத்தொகுப்பிலிருந்து (dataset) பெறப்பட்ட 500 உண்மையான அவசர சிகிச்சை பிரிவு வழக்குகளைக் கொண்டு MIRA சோதிக்கப்பட்டபோது, வியக்கத்தக்க முடிவுகள் கிடைத்தன:

  • நோய் கண்டறியும் துல்லியம்: MIRA 88.9% சரியான நோய் கண்டறிதல் விகிதத்தை எட்டியது.
  • நேரடி ஒப்பீடு: 311 வழக்குகளின் ஒரு தொகுப்பில், MIRA 87.8% மதிப்பெண்களைப் பெற்றது; இது அனுபவம் வாய்ந்த நிபுணர்களை (78.1%) மற்றும் பயிற்சி மருத்துவர்கள் மற்றும் நிபுணர்கள் கலந்த குழுக்களை (71.1%) விட குறிப்பிடத்தக்க அளவில் சிறந்தது.
  • மருத்துவ பலங்கள்: இந்த அமைப்பு தீவிரமான மருத்துவச் சூழல்களில் (high-acuity scenarios) சிறந்து விளங்கியது; appendicitis நோய்க்கு 98.6% துல்லியத்தையும், pancreatitis நோய்க்கு 92.3% துல்லியத்தையும் எட்டியது.
  • பாதுகாப்புத் திறன்: ஆய்வாளர்கள் எந்தவிதமான ஆபத்தான மருந்துத் தொடர்புகளையோ அல்லது தவறான அளவீடுகளையோ கண்டறியவில்லை; மேலும், மருத்துவமனையில் அனுமதிக்கப்பட வேண்டிய நோயாளிகளைக் கண்டறிவதில் இந்த அமைப்பு மிகச்சரியான பதிவைப் பெற்றது.

Google-ன் AMIE: நீண்டகால மருத்துவ வழிகாட்டுதல்களில் தேர்ச்சி

MIRA உடனடித் தீர்வுகளில் (acute reasoning) கவனம் செலுத்தும் அதே வேளையில், Google-ன் AMIE (Articulate Medical Intelligence Explorer) நீண்டகால முதன்மைப் பராமரிப்பிற்காக (longitudinal primary care) வடிவமைக்கப்பட்டுள்ளது. AMIE ஒரு இரட்டை முகவர் கட்டமைப்பைப் (dual-agent architecture) பயன்படுத்துகிறது: நோயாளிகளுடன் உரையாட ஒரு உரையாடல் முகவர் (conversational agent) மற்றும் மருத்துவ வழிகாட்டுதல்களான UK-ன் NICE Guidance போன்றவற்றுடன் வழக்குகளை ஒப்பிட்டுப் பார்க்க ஒரு பின்னணி முகவர் (background agent) என இது செயல்படுகிறது.

பலமுறை மருத்துவப் பரிசோதனைகள் மேற்கொள்ளப்பட்ட 100 வழக்குகளை உள்ளடக்கிய ஆய்வில், சிகிச்சை முடிவுகளில் AMIE மருத்துவர்களுக்கு இணையாகச் செயல்பட்டதுடன், மருத்துவ வழிகாட்டுதல்களைப் பின்பற்றுவதில் அவர்களை விடவும் முன்னேறியது. குறிப்பாக, மனித மருத்துவர்கள் 72% மட்டுமே பொருத்தமான சிகிச்சைத் திட்டங்களை வழங்கிய நிலையில், AMIE-ன் சிகிச்சைத் திட்டங்கள் 95% வழக்குகளில் பொருத்தமானதாக மதிப்பிடப்பட்டன. உரிமம் பெற்ற மருந்தாளுநர்களால் சரிபார்க்கப்பட்ட மருந்து அறிவு சார்ந்த RxQA பெஞ்ச்மார்க்கிலும் (benchmark), AMIE மருத்துவர்களை விடச் சிறப்பாகச் செயல்பட்டது.

"Scaffolding" சிக்கலும் எதிர்கால வரம்புகளும்

உயர் செயல்திறன் இருந்தபோதிலும், ஆய்வுகளிலிருந்து ஒரு முக்கியமான தொழில்நுட்ப நுணுக்கம் வெளிப்பட்டது. MIRA (GPT-4o மற்றும் o1-preview பயன்படுத்துகிறது) மற்றும் AMIE (Gemini 1.5 Flash பயன்படுத்துகிறது) ஆகிய இரண்டும் "scaffolding"—அதாவது மாதிரியின் தர்க்கரீதியான சிந்தனையை வழிநடத்துவதற்காக வடிவமைக்கப்பட்ட சிக்கலான வெளிப்புறக் கட்டமைப்புகள்—மீது பெரிதும் சார்ந்துள்ளன.

கூடுதல் ஆய்வுகள் ஒரு சாத்தியமான "முதுமையடையும்" (aging) சிக்கலைச் சுட்டிக்காட்டுகின்றன: இந்த scaffolding பழைய அல்லது சிறிய மாதிரிகளின் செயல்திறனை கணிசமாக மேம்படுத்தினாலும், அடிப்படை மாதிரிகள் இயல்பாகவே அதிகத் திறன் கொண்டவையாக மாறும் போது அதன் அவசியம் குறையக்கூடும். தற்போதைய வெற்றி சிறந்த நுண்ணறிவின் முடிவா அல்லது வெறும் சிறந்த பிராம்ப்ட் இன்ஜினியரிங் (prompt engineering) மற்றும் கட்டமைப்பு சார்ந்த "ஊன்றுகோல்களின்" (crutches) முடிவா என்ற கேள்விகளை இது எழுப்புகிறது.

மேலும், இந்த முடிவுகள் உருவகப்படுத்தப்பட்ட, கட்டமைக்கப்பட்ட தரவுகளிலிருந்து பெறப்பட்டவை என்று ஆராய்ச்சியாளர்கள் எச்சரிக்கின்றனர். உண்மையான சுகாதாரத் துறையின் "குழப்பமான, சிக்கலான, மனித உலகத்தை" இத்தகைய சூழல்கள் கொண்டிருக்கவில்லை என்று பேராசிரியர் கேத்தரின் போப் போன்ற நிபுணர்கள் குறிப்பிடுகின்றனர்; மேலும் பயிற்சியின் போது இந்த மாதிரிகள் MIMIC-IV தரவுத்தொகுப்பின் சில பகுதிகளை ஏற்கனவே பார்த்திருக்கலாம் என்ற அபாயமும் உள்ளது.

முக்கியக் குறிப்புகள்

  • உருவகப்படுத்துதலில் மருத்துவ மேன்மை: கட்டுப்படுத்தப்பட்ட, உருவகப்படுத்தப்பட்ட மருத்துவச் சூழல்களில், மனித நிபுணர்களை விட AI முகவர்களான MIRA மற்றும் AMIE அதிக நோய் கண்டறியும் துல்லியம் மற்றும் வழிகாட்டுதல் விதிகளின் இணக்கத்தைக் காட்டின.
  • பாதுகாப்பு மற்றும் துல்லியம்: மருந்து மேலாண்மை மற்றும் மருத்துவமனையில் அனுமதித்தல் ஆகியவற்றில் இரு அமைப்புகளும் விதிவிலக்கான நம்பகத்தன்மையைக் காட்டின; மேலும் திட்டங்களின் முழுமையின் விஷயத்தில் மனிதர்களை விடச் சிறப்பாகச் செயல்பட்டன.
  • Scaffolding காரணி: தற்போதைய வெற்றியின் பெரும்பகுதி சிக்கலான மல்டி-ஏஜென்ட் (multi-agent) கட்டமைப்புகளைச் சார்ந்துள்ளது; அடிப்படை LLM-கள் தொடர்ந்து வளர்ச்சியடையும் போது இவை தேவையற்றதாக மாறக்கூடும்.