Het kan je vergeven zijn als je denkt dat AI binnenkort menselijke artsen zal vervangen op basis van koppen als 'De AI-arts zal je nu zien', 'Je toekomstige arts is misschien geen mens' en 'Deze AI versloeg menselijke artsen op een klinisch examen . ”Maar experts zeggen dat de realiteit meer een samenwerking is dan een verdrijving: patiënten kunnen hun leven snel vinden deels in handen van AI-diensten die samenwerken met menselijke clinici.
Er is geen tekort aan optimisme over AI in de medische gemeenschap. Maar velen waarschuwen ook dat de hype rond AI nog moet worden gerealiseerd in echte klinische situaties. Er zijn ook verschillende visies op hoe AI-services de grootste impact kunnen hebben. En het is nog steeds onduidelijk of AI het leven van patiënten zal verbeteren of alleen de bottom line voor Silicon Valley-bedrijven, zorgorganisaties en verzekeraars.
"Ik denk dat al onze patiënten eigenlijk willen dat AI-technologieën worden aangepakt op zwakke plekken in de gezondheidszorg, maar we moeten dit op een niet-Silicon Valley hype-manier doen", zegt Isaac Kohane, een biomedische informatica-onderzoeker bij Harvard Medical School.
Als AI werkt zoals beloofd, kan het de gezondheidszorg democratiseren door de toegang voor achtergestelde gemeenschappen te verbeteren en de kosten te verlagen - een zegen in de Verenigde Staten, die slecht scoort op veel gezondheidsmaatregelen ondanks een gemiddelde jaarlijkse zorgkosten van $ 10.739 per persoon. AI-systemen kunnen overwerkte artsen bevrijden en het risico op medische fouten verminderen die elk jaar tienduizenden, zo niet honderdduizenden Amerikaanse patiënten kunnen doden. En in veel landen met nationale artsentekorten, zoals China, waar overvolle poliklinieken van stedelijke ziekenhuizen tot 10.000 mensen per dag kunnen zien, hebben dergelijke technologieën geen perfecte nauwkeurigheid nodig om nuttig te zijn.
Maar critici wijzen erop dat al die beloften kunnen verdwijnen als de haast om AI te implementeren de privacyrechten van de patiënt vertrapt, vooroordelen en beperkingen over het hoofd ziet, of er niet in slaagt om diensten in te zetten op een manier die de gezondheidsresultaten voor de meeste mensen verbetert.
"Op dezelfde manier dat technologieën ongelijkheden kunnen verkleinen, kunnen ze ongelijkheden vergroten", zegt Jayanth Komarneni, oprichter en voorzitter van het Human Diagnosis Project (Human Dx), een organisatie voor algemeen nut gericht op crowdsourcing van medische expertise. "En niets heeft dat vermogen om ongelijkheden zoals AI te vergroten"
***
Tegenwoordig zijn machine learning en de jongere neef diep leren de meest populaire AI-technieken. In tegenstelling tot computerprogramma's die strikt door mensen geschreven regels volgen, kunnen zowel machine learning als deep learning-algoritmen naar een dataset kijken, ervan leren en nieuwe voorspellingen doen. Vooral diepgaand leren kan indrukwekkende voorspellingen doen door datapatronen te ontdekken die mensen misschien missen.
Maar om het beste uit deze voorspellingen in de gezondheidszorg te halen, kan AI er niet alleen op ingaan. Integendeel, mensen moeten nog steeds helpen beslissingen te nemen die grote gezondheids- en financiële gevolgen kunnen hebben. Omdat AI-systemen de algemene intelligentie van mensen missen, kunnen ze verbijsterende voorspellingen doen die schadelijk kunnen zijn als artsen en ziekenhuizen hen zonder twijfel volgen.
Het klassieke voorbeeld komt van Rich Caruana, een senior onderzoeker bij Microsoft Research, zoals hij vorig jaar in het tijdschrift Engineering and Technology heeft uitgelegd. In de jaren negentig werkte Caruana aan een project dat probeerde een eerdere vorm van machine learning te gebruiken om te voorspellen of een patiënt met longontsteking een geval met een laag risico of een hoog risico was. Maar er ontstonden problemen toen het machine learning-model probeerde het geval te voorspellen voor astmapatiënten, die een hoog risico lopen omdat hun bestaande ademhalingsmoeilijkheden hen kwetsbaar maken voor longontsteking. Het model koppelde deze patiënten aan als een laag risico, waarvoor minder ingrijpen nodig was dan ziekenhuisopname - iets wat een menselijke expert nooit zou hebben gedaan.
Als je blindelings het model volgt, zegt Kenneth Jung, een onderzoekswetenschapper aan het Stanford Center for Biomedical Informatics Research, “dan ben je onder water. Omdat het model zegt: "Oh, dit kind met astma kwam binnen en ze hebben longontsteking, maar we hoeven ons geen zorgen te maken en we sturen ze naar huis met wat antibiotica."
Diepgaande voorspellingen kunnen ook mislukken als ze voor het eerst ongebruikelijke gegevenspunten tegenkomen, zoals unieke medische gevallen, of wanneer ze bijzondere patronen leren in specifieke gegevenssets die niet goed generaliseren naar nieuwe medische gevallen.
De AI-voorspellingen doen het het beste wanneer ze worden toegepast op massieve datasets, zoals in China, wat een voordeel heeft bij het trainen van AI-systemen dankzij de toegang tot grote populaties en patiëntgegevens. In februari publiceerde het tijdschrift Nature Medicine een studie van onderzoekers uit San Diego en Guangzhou, China, die veelbelovend bleken bij het diagnosticeren van veel voorkomende kinderziekten op basis van de elektronische gezondheidsdossiers van meer dan 567.000 kinderen.
Maar zelfs grote datasets kunnen problemen opleveren, vooral wanneer onderzoekers proberen hun algoritme op een nieuwe populatie toe te passen. In de studie Natuurgeneeskunde kwamen alle half miljoen patiënten uit één medisch centrum in Guangzhou, wat betekent dat er geen garantie is dat de diagnostische lessen die zijn getrokken uit de training op die dataset ook van toepassing zouden zijn op pediatrische gevallen elders. Elk medisch centrum kan zijn eigen unieke set patiënten aantrekken - een ziekenhuis dat bekend staat om zijn cardiovasculaire centrum kan bijvoorbeeld meer kritieke hartaandoeningen aantrekken. En bevindingen van een ziekenhuis in Guangzhou dat vooral etnische Chinese patiënten aantrekt, vertalen zich misschien niet naar een ziekenhuis in Shanghai met een groter aantal niet-Chinese patiënten die in het buitenland zijn geboren.
In deze TEDx Talk van 2017 legt Shinjini Kundu van Johns Hopkins Hospital uit hoe AI-tools het potentieel hebben om meer uit medische beelden te halen dan artsen alleen - inclusief het voorspellen van ziekten voordat patiënten symptomen vertonen.
Deze extrapolatie zal ook in andere situaties moeilijk blijken. Bijvoorbeeld, zegt Marzyeh Ghassemi, een computerwetenschapper en biomedisch ingenieur aan de Universiteit van Toronto, zeggen dat je 40.000 ICU-patiënten hebt in Beth Israel Deaconess Medical Center - dat is slechts één ziekenhuis in één stad. “En dus heb ik al deze artikelen die voorspellingen hebben gedaan met deze gegevens. Werkt dat met een ander ziekenhuis in Boston? Kan zijn. Werkt het voor een ziekenhuis in een andere staat? Zou het in een ander land werken? We weten het niet. '
***
Hoewel AI-modellen mogelijk niet in alle gevallen werken, vindt Ghassemi de technologie nog steeds de moeite van het verkennen waard. "Ik ben er een groot voorstander van om deze modellen van de bank naar het bed te brengen, " zegt ze, "maar met echt agressieve voorzorgsmaatregelen."
Die stappen moeten bestaan tijdens de ontwikkeling en implementatie van AI, zegt I. Glenn Cohen, een professor in de rechten aan de Harvard University en een leider voor het Project on Precision Medicine, Artificial Intelligence, and the Law. Dit kan inhouden dat de nauwkeurigheid en transparantie van AI-voorspellingen worden gecontroleerd. En tijdens het verzamelen van gegevens moeten onderzoekers ook de privacy van patiënten beschermen en toestemming vragen om patiëntgegevens te gebruiken voor de opleiding van AI
Het toestemmingsprobleem komt opnieuw naar voren wanneer het AI-model klaar is voor experimentele klinische tests met echte patiënten. "Moeten patiënten te horen krijgen dat u het algoritme op hen gebruikt, en maakt het uit of de AI de zorg volledig of gedeeltelijk begeleidt?", Vraagt Cohen. "Er is echt heel weinig nadenken over deze vragen."
Ghassemi pleit ook voor het regelmatig controleren van AI-algoritmen om eerlijkheid en nauwkeurigheid bij verschillende groepen mensen te waarborgen op basis van etniciteit, geslacht, leeftijd en ziektekostenverzekering. Dat is belangrijk, gezien het feit dat AI-toepassingen in andere velden al hebben aangetoond dat ze gemakkelijk vooroordelen kunnen oppikken.
Na al die stappen zullen de mensen en bedrijven die AI-diensten aanbieden, juridische aansprakelijkheid moeten zoeken in geval van onvermijdelijke fouten. En in tegenstelling tot de meeste medische apparaten, die meestal slechts één wettelijke goedkeuring nodig hebben, kunnen AI-services aanvullende beoordeling vereisen wanneer ze leren van nieuwe gegevens.
Sommige regelgevende instanties heroverwegen hoe AI in de gezondheidszorg moet worden beoordeeld. In april heeft de Amerikaanse Food and Drug Administration (FDA) een discussienota uitgebracht om feedback van het publiek te krijgen over het bijwerken van de relevante herziening van de regelgeving. "Wat we hier continu proberen te doen, is terugkomen op ons doel om mensen toegang te geven tot technologieën, maar we realiseren ons ook dat onze huidige methoden niet helemaal goed werken", zegt Bakul Patel, directeur voor digitale gezondheid bij de FDA. "Daarom moeten we kijken naar een holistische benadering van de hele levenscyclus van producten."
Naast kwesties rond toegang, privacy en regelgeving, is het ook niet duidelijk wie de meeste baat heeft bij AI-gezondheidszorg. Er zijn al verschillen in de gezondheidszorg: volgens de Wereldbank en de Wereldgezondheidsorganisatie heeft de helft van de wereldbevolking geen toegang tot essentiële gezondheidszorgdiensten en worden bijna 100 miljoen mensen door extreme zorgkosten in extreme armoede geduwd. Afhankelijk van hoe het wordt ingezet, kan AI deze ongelijkheden verbeteren of verergeren.
"Veel van de AI-discussies gingen over hoe de gezondheidszorg te democratiseren, en ik wil dat zien gebeuren", zegt Effy Vayena, een bio-ethicus bij het Federaal Instituut voor Technologie in Zwitserland.
"Als je gewoon eindigt met een betere dienstverlening aan degenen die zich toch goede gezondheidszorg kunnen veroorloven, " voegt ze eraan toe, "ik weet niet zeker of dat de transformatie is waar we naar op zoek zijn."
Hoe dit allemaal verloopt, hangt af van de verschillende visies voor de implementatie van AI Vroege ontwikkeling heeft zich gericht op zeer nauwe diagnostische toepassingen, zoals het onderzoeken van afbeeldingen op hints van huidkanker of nagel schimmel, of het lezen van röntgenfoto's van de borst. Maar meer recente inspanningen hebben geprobeerd om meerdere gezondheidsproblemen tegelijkertijd te diagnosticeren.
In augustus 2018, Moorfields Eye Hospital in het Verenigd Koninkrijk en DeepMind. het in Londen gevestigde AI-lab van het moederbedrijf Alphabet van Google, toonde aan dat ze met succes een AI-systeem hadden getraind om meer dan 50 oogziekten in scans te identificeren, die overeenkwamen met de prestaties van toonaangevende experts. Evenzo reikten de brede ambities de studie van San Diego en Guangzhou die AI trainde om veel voorkomende aandoeningen bij kinderen te diagnosticeren. De laatste was niet zo goed in het diagnosticeren van kinderziekten in vergelijking met senior artsen, maar het presteerde beter dan sommige junior artsen.
Dergelijke AI-systemen hoeven misschien niet beter te presteren dan de beste menselijke experts om de gezondheidszorg te democratiseren, maar breiden eenvoudigweg de toegang tot de huidige medische normen uit. Tot nu toe zijn veel voorgestelde AI-toepassingen gericht op het verbeteren van de huidige zorgstandaard in plaats van het verspreiden van betaalbare gezondheidszorg, zegt Cohen: “Democratisering van wat we al hebben, zou een veel grotere waar voor je geld zijn dan verbetering van wat we hebben in veel gebieden. "
Accenture, een adviesbureau, voorspelt dat top AI-toepassingen de Amerikaanse economie in 2026 $ 150 miljard per jaar kunnen besparen. Maar het is onduidelijk of patiënten en gezondheidszorgsystemen aangevuld met belastingbetaler dollars hiervan zouden profiteren, of dat er meer geld naar de techbedrijven zou vloeien, zorgverleners en verzekeraars.
"De vraag wie hier gaat rijden en wie hiervoor gaat betalen is een belangrijke vraag", zegt Kohane. "Iets wat een beetje hallucinerend is aan al die bedrijfsplannen is dat ze denken dat ze weten hoe het zal werken."
Zelfs als AI-diensten kostenbesparende aanbevelingen doen, kunnen menselijke artsen en zorgorganisaties aarzelen om AI-advies in te nemen als ze daardoor minder geld verdienen, waarschuwt Kohane. Dat spreekt over het grotere systemische probleem van de Amerikaanse zorgverzekeraars die een fee-for-service-model gebruiken dat artsen en ziekenhuizen vaak beloont voor het toevoegen van tests en medische procedures, zelfs wanneer ze niet nodig zijn.
***
Er is nog een AI-kans die de kwaliteit van de zorg zou kunnen verbeteren, terwijl de meeste medische diagnoses nog steeds in handen van artsen blijven. In zijn boek Deep Medicine 2019 spreekt Eric Topol, directeur en oprichter van het Scripps Research Translational Institute, over het creëren van in wezen een supercharged medische Siri - een AI-assistent om aantekeningen te maken over de interacties tussen artsen en hun patiënten, voer die aantekeningen in bij elektronische gezondheid records en herinneren artsen eraan om te vragen naar relevante delen van de geschiedenis van de patiënt.
"Mijn ambitie is dat we het werk van artsen decomprimeren en hun rol als gegevensmedewerker kwijtraken, patiënten helpen meer verantwoordelijkheid te nemen en de gegevens opvoeren zodat het niet zo lang duurt om dingen te beoordelen, " zegt Topol.
Die "nooit-vergeetachtige medisch assistent of schrijver, " zegt Kohane, zou AI vereisen die automatisch meerdere stemmen tussen artsen en patiënten kan volgen en transcriberen. Hij steunt het idee van Topol, maar voegt eraan toe dat de meeste AI-toepassingen in ontwikkeling niet op dergelijke assistenten lijken te zijn gericht. Toch hebben sommige bedrijven, zoals Saykara en DeepScribe diensten in deze zin ontwikkeld, en zelfs Google werkte samen met Stanford University om een vergelijkbare "digitale scribe" -technologie te testen.
Een AI-assistent klinkt misschien minder opwindend dan een AI-arts, maar het kan artsen vrijmaken om meer tijd met hun patiënten door te brengen en de algehele kwaliteit van zorg te verbeteren. Vooral huisartsen brengen vaak meer dan de helft van hun werkdagen door met het invoeren van gegevens in elektronische gezondheidsdossiers - een belangrijke factor achter fysieke en emotionele burn-out, die ernstige gevolgen heeft, waaronder de dood van patiënten.
Ironisch genoeg zouden elektronische medische dossiers de medische zorg verbeteren en de kosten verlagen door patiëntinformatie toegankelijker te maken. Nu wezen Topol en vele andere experts op elektronische gezondheidsdossiers als een waarschuwend verhaal voor de huidige hype rond AI in de geneeskunde en de gezondheidszorg.
De implementatie van elektronische gezondheidsdossiers heeft al een patchworksysteem gecreëerd dat verspreid is over honderden particuliere leveranciers dat er vooral in slaagt patiëntgegevens te isoleren en het ontoegankelijk maakt voor zowel artsen als patiënten. Als geschiedenis een leidraad is, zullen veel technologiebedrijven en zorgorganisaties de neiging voelen om vergelijkbare paden te volgen door medische gegevens te verzamelen voor hun eigen AI-systemen.
Een manier om dit te omzeilen is om een collectief intelligentiesysteem te gebruiken dat medische expertise uit verschillende bronnen verzamelt en rangschikt, zegt Komarneni, die deze aanpak met Human Dx probeert. Gesteund door grote medische organisaties zoals de American Medical Association, heeft Human Dx een online platform gebouwd voor crowdsourcing-advies van duizenden artsen over specifieke medische gevallen. Komarneni hoopt dat een dergelijk platform in theorie op een dag ook diagnostisch advies van veel verschillende AI-diensten kan bevatten.
"Op dezelfde manier waarop meerdere menselijke professionals in de toekomst naar uw geval kunnen kijken, is er geen reden waarom meerdere AI dit niet zou kunnen doen, " zegt Komarneni.
Terwijl artsen wachten op hun AI-helpers, zouden crowdsourcing-projecten zoals Human Dx "zeker kunnen leiden tot verbeterde diagnostiek of zelfs verbeterde aanbevelingen voor therapie", zegt Topol, die co-auteur was van een 2018-studie op een soortgelijk platform genaamd Medscape Consult. Het artikel concludeerde dat collectieve menselijke intelligentie een 'competitieve of complementaire strategie' voor AI in de geneeskunde zou kunnen zijn.
Maar als AI-services alle tests en controles in de praktijk doorstaan, kunnen ze belangrijke partners voor de mens worden bij het hervormen van de moderne gezondheidszorg.
"Er zijn dingen die machines nooit goed zullen doen, en dan anderen waar ze zullen overtreffen wat een mens kan doen, " zegt Topol. "Dus wanneer je de twee samenvoegt, is het een zeer krachtig pakket."
***
Jeremy Hsu is een freelance journalist in New York City. Hij schrijft vaak over wetenschap en technologie voor onder andere Backchannel, IEEE Spectrum, Popular Science en Scientific American.
Dit artikel is oorspronkelijk gepubliceerd op Undark. Lees het originele artikel.
