Deze AI-arts stelt vaker de juiste diagnose dan een doorgewinterde dokter

1 dag geleden 3

In een nagebootste spoedeisende hulp nam een kunstmatige intelligentie het complete werk van een arts over. De AI kon praten met de patiënt, onderzoek aanvragen, een diagnose stellen en zelfs beslissen of de patiënt zou worden opgenomen. In heel wat gevallen deed de machine het beter dan ervaren menselijke artsen.

Het systeem heet MIRA en is bedacht door onderzoekers in Dresden en Heidelberg. Anders dan de chatbots die we inmiddels kennen, wacht MIRA niet braaf op één vraag om er één antwoord op te geven.

“MIRA is een voorbeeld van de verschuiving van AI-systemen van een passief hulpmiddel naar een autonome agent. In de kern zit een algemeen inzetbaar model dat als redeneermotor fungeert: het kijkt naar het klinische doel, splitst dat op in opeenvolgende stappen en gebruikt softwaretools om die uit te voeren”, vertelt Jakob Kather, hoofdauteur van de studie, aan Scientias.nl.

Een afgeschermde oefenkamer

Uiteraard kun je zo’n experimenteel systeem niet testen op echte patiënten. De onderzoekers bouwden daarom een digitale kopie van de spoedeisende hulp. Daarin kon MIRA naar hartenlust werken.

Wat wél echt was, waren de 574 geanonimiseerde ziektegevallen die de AI voorgeschoteld kreeg. Die kwamen uit een grote Amerikaanse medische databank. De patiënten hadden acht aandoeningen, waaronder alvleesklierkanker of een ontstoken blindedarm.

MIRA voerde gesprekken niet met een mens, maar met een tweede AI die de patiënt speelde. Digitale patiënten mochten uitsluitend antwoorden met informatie uit het echte dossier. De onderzoekers probeerden de virtuele patiënten te verleiden om de diagnose voortijdig te verklappen of zich te laten ompraten met trucjes, maar ze hielden telkens de lippen op elkaar.

Voor het echte dokterswerk kreeg MIRA elf gereedschappen tot zijn beschikking. Samen konden daarmee meer dan 85.000 mogelijke handelingen worden uitgevoerd. MIRA kon onder meer bloed-, urine- en kweekonderzoeken aanvragen, scans bestellen, medicatie voorschrijven, een operatie inplannen en de patiënt opnemen.

Beter dan de mens

In een rechtstreeks duel met vier ervaren menselijke specialisten (die met exact dezelfde middelen en dossiers werkten) stelde MIRA in 87,8 procent van de gevallen de juiste diagnose. De specialisten scoorden samen 78,1 procent. Toen MIRA het opnam tegen een gemengd team van jongere artsen en specialisten, een situatie die dichter bij de realiteit ligt, was het verschil nog groter.

MIRA presteerde wel niet bij elke ziekte even goed. Een blindedarmontsteking herkende het systeem vrijwel feilloos, maar bij een long- of blaasontsteking lag de score lager. Veelzeggend is wel dat menselijke artsen het daar ook moeilijk mee hadden.

Was Kather verbaasd van die uitslag? Allerminst. “We zijn bemoedigd, maar niet verrast. We weten dat AI in vrijwel elke medische benchmarktest menselijke prestaties evenaart en wat wij hebben gebouwd is eigenlijk vooral een raamwerk dat AI in staat stelt om breed te handelen bij uiteenlopende medische vraagstukken.”

Leestip: AI ziet borstkanker al jaren van tevoren aankomen

Geen ongebreidelde testdrift

De onderzoekers waren voor één ding bang: een AI die alles mag aanvragen, vraagt misschien ook alles aan. Dat zou tot onnodige kosten kunnen leiden en patiënten zouden dan te vaak ingrijpende procedures moeten ondergaan. Dat bleek niet het geval. MIRA bestelde juist minder onderzoeken dan in de praktijk gebruikelijk is en het aantal dure scans liep niet uit de hand.

Artsen lieten ook de voorschriften van MIRA nalopen op zes risicozones: gevaarlijke combinaties van medicijnen, doseringen die niet kloppen bij een slechte nierfunctie, allergieën, hartritmerisico’s, te veel opioïden en dubbel voorgeschreven middelen. In geen enkel ernstig geval ging het mis.

Ook zond MIRA in een aparte test voor longontstekingen en longembolieën niemand naar huis die eigenlijk opgenomen had moeten worden. Als het systeem al een steek liet vallen, was het uit overdreven voorzichtigheid. Toch is dat voor Kather precies de reden om geen risico’s te nemen: “We zouden zo’n systeem altijd inzetten als assistent en (nog) niet als een volledig autonoom systeem.”

Wat moet er nog gebeuren?

Voordat systemen als MIRA een echte spoedafdeling op mogen, is er onderzoek met levende patiënten nodig. Maar dat is niet alles, zegt Kather: “We moeten ervoor zorgen dat onze digitale infrastructuur geschikt is voor AI, want veel ziekenhuizen draaien momenteel nog op verouderde software die we niet kunnen gebruiken met AI-tools.” Veel ziekenhuizen draaien met andere woorden op verouderde software waar geen enkele slimme assistent iets aan heeft.

Dreigt de dokter dan overbodig te worden, indien we de IT-afdeling een hoger budget geven? Kather, zelf arts, denkt van niet. “De realistische rol is duidelijk die van teamgenoot, niet die van vervanger”, stelt hij. “Wij zijn zelf artsen en weten dat er altijd een mens de leiding moet hebben en dat onze patiënten en de samenleving dat ook willen (net zoals de samenleving menselijke piloten wil, hoewel die technisch gezien perfect door AI vervangen zouden kunnen worden).”

Schrijf je in voor de nieuwsbrief! Ook elke dag vers het laatste wetenschapsnieuws in je inbox? Of elke week? Schrijf je hier in voor de nieuwsbrief!

Uitgelezen? Luister ook eens naar de Scientias Podcast:

Lees het hele artikel