De strenge bescherming van patiëntengegevens zet een rem op de kracht van big data in de diagnostische gezondheidszorg

Hoe federated learning de voordelen van een slimme gezondheidszorg verzoent met gegevensbescherming

14 oktober 2021

In de afgelopen jaren zijn enkele van de grootste vorderingen in de diagnostische gezondheidszorg het gevolg van het benutten van de kracht van big data. Met voldoende informatie kunnen machine learning modellen vele soorten ziekten diagnosticeren, soms met grotere nauwkeurigheid dan ervaren artsen. Deze technologie is krachtig omdat het miljoenen datapunten kan overlappen en ervan leren, waardoor modellen steeds nauwkeuriger kunnen worden.

Maar tot voor kort was er een dilemma. Machine learning modellen hebben honger, ze hebben namelijk veel gegevens nodig. Patiëntgegevens zijn echter persoonlijk, gevoelig en onderhevig aan specifieke verwerkingsvoorwaarden. De zorgsector moet dus preventieve maatregelen nemen om datalekken te voorkomen, wat data-allianties bemoeilijkt. Potentieel levensreddende gegevens worden dus afgezonderd - met duizenden ziekenhuizen over de hele wereld die patiëntendossiers beschermen om de vertrouwelijkheid te vrijwaren.

Nieuwe werkwijzen - nieuwe manieren om van gegevens te leren

Deze aanpak is zeer geschikt voor het beschermen van privacy van de patiënt. Maar deze werkwijze voorkomt dat de machinediagnose nauwkeuriger wordt en betere resultaten oplevert.

Dat is het moment waar het concept ‘federated learning’ om de hoek komt kijken. Federated learning introduceert een manier waarop algoritmes kunnen worden geleerd - zonder dat de gegevens op een gecentraliseerde locatie moeten worden opgeslagen.

De aanpak is aanvankelijk door Google voorgesteld om gegevensbeschermingsproblemen rond machine learning voor mobiele apparaten op te lossen. Google moest zijn algoritmes voorzien van voldoende gegevens om de functionaliteit te verbeteren, waaronder spraakherkenning, tekstinvoer en fotoselectie. Maar de techgigant moest een manier vinden om een machine learning modellen te trainen, zonder persoonlijke informatie zoals wachtwoorden, foto's, berichten en URL’s door te geven.

Hoe federated learning werkt

Elke client of elk apparaat berekent via federated learning zelf updates van het huidige globale model en er worden alleen gecodeerde updates naar de server gecommuniceerd.

Op deze manier omgaan met de gegevens betekent dat de wetgeving inzake gegevensbescherming - inclusief de Algemene Verordening Gegevensbescherming (AVG) van de Europese Unie wordt nageleefd. Dat komt omdat alle persoonlijke gegevens op het apparaat blijven - enkel gemaskeerde resultaten worden naar externe servers gestuurd. Verder is het niet nodig om de updates op te slaan nadat ze het huidige model hebben verbeterd.

In een ziekenhuisomgeving stelt federated learning ziekenhuizen in staat om efficiënt machine learning modellen te trainen met behulp van gegevens over verschillende patiënten uit verschillende ziekenhuizen. Elk ziekenhuis berekent lokaal modelupdates, die worden gecodeerd, gecommuniceerd, geaggregeerd en teruggevoerd naar de desbetreffende modellen van de ziekenhuizen.

Kortom, een ziekenhuis kan voordeel trekken uit de gegevens van vele andere ziekenhuizen - zonder ook maar één wet op de gegevensbescherming te overtreden.

Het overwinnen van dataheterogeniteit

Het handhaven van de privacy en het kunnen leren van de data is duidelijk een groot voordeel van deze aanpak. Maar federated learning heeft ook te kampen met het probleem van dataheterogeniteit. Dat is het geval wanneer verschillende organisaties en instellingen gegevens op verschillende manieren verzamelen en beheren, wat het moeilijk kan maken om de ene dataset met de andere te vergelijken. In dit geval kunnen we transfer learning technieken gebruiken om het dataheterogeniteitsprobleem aan te pakken en de schaal van beschikbare gegevens te vergroten. Kort gezegd, transfer learning past kennis en vaardigheden die zijn geleerd in voorafgaande taken toe op nieuwe gerelateerde taken.

Zo gebruikten onderzoekers al transfer learning technieken om de ziekte van Alzheimer te identificeren. Ze gebruikten een vooraf getraind machine learning model en verfijnden hun model door een dataset met 3D MRI-beelden in te pluggen. Hierdoor konden ze nauwkeurigheidsniveaus behalen die beter presteerden dan traditionele werkwijzen.

Om een ander voorbeeld te geven, stel dat twee ziekenhuizen twee verschillende populaties behandelen (bijv. oudere en jongere burgers) en een data-alliantie willen vormen. Omdat er een verschil is tussen de domeinen van de patiëntengroepen van beide ziekenhuizen, is het mogelijk dat machine learning modellen falen. Gelukkig stellen transfer learning-technieken ons in staat om domeinaanpassingen op te nemen. Verder kunnen modellen worden getraind door federated learning te gebruiken en dus zonder mogelijk gevoelige gegevens bloot te leggen. Kortom, de combinatie van transfer en federated learning, ook wel federated transfer learning (FTL) genoemd, biedt wellicht een oplossing voor ons probleem.

Meer dan geneeskunde

Aangezien gegevensregelgeving, zoals de AVG, meer macht geeft aan klanten en minder aan organisaties, worden organisaties gestimuleerd om cyberbeveiligingsmaatregelen te ontwikkelen en het bewustzijn over gegevensbescherming te versterken. Tijdelijke oplossingen en handmatige processen die zorgen voor de naleving van de regelgeving worden mogelijk onhaalbaar. Dus organisaties zijn verplicht manieren te ontwikkelen om slimmer met gegevens om te gaan en ervan te leren, in overeenstemming met de regelgeving.

Federatief leren heeft een enorm potentieel om machine learning te stimuleren, in een omgeving waar de persoonlijke privacy - terecht - zwaar wordt beschermd. Dit is het geval in de geneeskunde - en het is ook van belang in vele andere sectoren.

In de financiële wereld kan het worden gebruikt om klantgedrag en fraude vast te stellen. In slimme detailhandel zou federated learning het begrip van het gedrag en de behoeften van kopers kunnen verbeteren. Federated learning zou inderdaad een rol kunnen spelen in een hele reeks vakgebieden, gaande van onderwijs tot edge computing, en dat allemaal met behoud van persoonlijke privacy.

Meer leren over de kracht van digitale transformatie? Word lid.

Het Centre for Financial Leadership & Digital Transformation doet actiegericht onderzoek naar de financiële functie van morgen en fungeert tevens als een kennisplatform. Financiële leiders met de ambitie om een concurrerende en effectieve financiële afdeling of boekhoudkantoor te ontwikkelen, die technologie omarmen en die op de hoogte willen blijven van de meest recente technologische ontwikkelingen met invloed op de financiële functie, kunnen profiteren van ons unieke kennisplatform en onderzoek.

Ontdek meer

Neem contact op!

Kristof Stouthuysen

Full Professor of Management Accounting and AI-Driven Finance

kristof.stouthuysen@vlerick.com

+32 16 24 88 43