Generaliseerbaarheid van clustermodellen met verschillende datatypes: twee intensive care cohorten
Auteur(s):
Jip de Kok, Frank van Rosmalen
Afdeling Intensive Care, Maastricht UMC+, Universiteit Maastricht, Maastricht
Correspondentie:
J. de Kok - jip.de.kok@mumc.nl
Generaliseerbaarheid van clustermodellen met verschillende datatypes: twee intensive care cohorten
Samenvatting
Achtergrond
Machine Learning (ML)-modellen worden steeds vaker gebruikt om inzicht te krijgen in IC-patiënten. Een interessante ontwikkeling, maar niet eenvoudig te begrijpen, en nóg uitdagender om aan te tonen of ze echt werken. Clustering is een vorm van ML die subgroepen kan identificeren in data zonder labels (zoals mortaliteit of diagnoses).[1,2] Deze modellen zijn vooral geschikt om complexe gelijkenissen tussen patiënten te vinden, en deze patiënten zodoende onder te verdelen in subgroepen die bijvoorbeeld een verschillend ziekteverloop hebben en andere zorg vereisen. Een bekende uitdaging voor clustermodellen is het combineren van verschillende datatypes, zoals categoriale en numerieke waardes. Bovendien wordt onderzoek naar de generaliseerbaarheid van clusters vaak nagelaten.[3]
Doel van de studie
De hoofddoelen van deze studie zijn tweeledig. Ten eerste, het ontwikkelen van een geavanceerd clustermodel dat meerdere datatypes tegelijkertijd kan verwerken. Ten tweede, het onderzoeken van de validiteit van deze clusters aan de hand van stabiliteit en generaliseerbaarheid naar een tweede intensive care cohort.
Design
Een multicenter observationele studie met volwassen IC-opnames van minstens één ligdag. Patiënten van het UMC Groningen zijn gebruikt voor modelontwikkeling, patiënten van het Maastricht UMC+ voor validatie.
Methode
Clustering werd gedaan op tachtig variabelen verzameld gedurende de eerste 24 uur van opname, waaronder labwaarden, voorgeschiedenis, en andere patiëntkarakteristieken. Om meerdere datatypes te integreren werd een bestaand clustermodel, Deep Embedded Clustering (DEC)[1,2], aangepast naar X-DEC. De stabiliteit van de clusters werd berekend[4], en de generaliseerbaarheid werd bepaald door het model toe te passen op een externe IC-populatie. De clusters werden door zes intensivisten onafhankelijk getypeerd en vergeleken, om vast te stellen of de clusters herkenbaar waren en overeenkwamen in beide populaties. Deze studie is goedgekeurd door de medisch ethische toetsingscommissie van het MUMC+ (METC: 2021-279). Een gedetailleerde omschrijving van deze studie is te vinden in de originele publicatie.[5]
Resultaten
Het X-DEC model was stabiel, patiënten belandden bij herhaling in 85% van de gevallen in hetzelfde cluster. Clusters kwamen goed overeen tussen de twee IC-populaties en waren dus generaliseerbaar, en de zes clusters hadden duidelijk verschillende klinische karakteristieken.
Conclusie
X-DEC produceerde stabiele en generaliseerbare clusters met herkenbare klinische karakteristieken, wat betekent dat het onder andere gebruikt kan worden om patiëntenpopulaties te vergelijken.
Bespreking
Deze studie[5] toont hoe een clustermodel verschillende patiëntenclusters identificeert aan de hand van complexe IC-data. We laten zien dat X-DEC meerdere datatypes kan integreren, en relatief stabiele clusters genereerd. Echter, gaat het uiteindelijk niet alleen om de complexiteit en methodologische validiteit van het model. Juist de gegenereerde inzichten en toepasbaarheid van de uitkomsten zijn belangrijk. Daarom dienen de clusters goed bestudeerd te worden door de fenotypes te omschrijven.
Betekenis
In totaal werden zes clusters geïdentificeerd. Om inzicht te krijgen in de clusters zijn deze onafhankelijk door zes intensivisten getypeerd. Deze stap is belangrijk om inzicht te krijgen in de validiteit en bruikbaarheid van de clusters. Bijvoorbeeld, als een model perfect clusters weet te onderscheiden, maar achteraf blijkt dat het slechts een opsplitsing is van mannen en vrouwen die wél of niet beademd zijn, heeft het model geringe toegevoegde waarde. Wanneer er geen duidelijke verschillen tussen clusters worden gevonden, kunnen er ook geen conclusies aan verbonden worden. Op basis van de interpretatie van de zes intensivisten zagen we dat de X-DEC clusters duidelijk verschillende types patiënten bevatte. Zo zijn er clusters met trauma, nierfalen, transplantatie, shock, cardiovasculaire aandoeningen, en respiratoire aandoeningen getypeerd.
Consequentie
De clusters laten onderling grote verschillen zien in mortaliteit en ligduur (figuur 1). Aangezien clustering is gedaan op variabelen die in de eerste 24 uur van opname zijn verzameld, zouden deze clusters ook gebruikt kunnen worden voor patiëntstratificatie aan de hand van verwachte zorgzwaarte, ligduur, en/of uitkomst. Bovendien zien we dat ondanks systematische verschillen tussen de twee populaties (bijvoorbeeld langere ligduur, hogere mortaliteit, en meer vasoactieve medicatie in het MUMC+), de verdeling van deze uitkomsten goed overeenkomt tussen dezelfde clusters in deze twee populaties, evenals de klinische omschrijvingen. Dit geeft aan dat het model generaliseerbaar is. Daardoor kan het model binnen andere ziekenhuizen worden toegepast, en kunnen populaties vergeleken worden, wat meerdere deuren opent voor toekomstig onderzoek op de IC.
Vragen
Referenties
Identifying and characterizing high-risk clusters in a heterogeneous ICU population with deep embedded clustering. Sci Rep. 2021 Dec;11(1):12109.
- Xie J, Girshick R, Farhadi A. Unsupervised Deep Embedding for Clustering Analysis. arXiv. 2016 May 24;10.
- Luxburg U, Williamson R, Guyon I. Clustering: Science or art? 2009 Dec 10;27.
- Hennig C. Cluster-wise assessment of cluster stability. Comput Stat Data Anal. 2007 Sep;52(1):258–71.
- de Kok JWTM, van Rosmalen F, Koeze J, Keus F, van Kuijk SMJ, Castela Forte J, et al. Deep embedded clustering generalisability and adaptation for integrating mixed datatypes: two critical care cohorts. Sci Rep. 2024 Jan 10;14(1):1045.