Impact
Bayesiaanse heranalyses: De COVID STEROID 2-trial vanuit (te) veel verschillende perspectieven
Inhoud:

    Auteur(s):

    Brittney van der Woude

     

    Intensive Care Centrum, UMC Utrecht, Universiteit Utrecht, Utrecht

    Correspondentie:

    b. vd woude - b.a.vanderwoude@umcutrecht.nl
    Impact

    Bayesiaanse heranalyses: De COVID STEROID 2-trial vanuit (te) veel verschillende perspectieven

    Achtergrond

    De COVID STEROID 2 -trial[1] werd opgezet om te onderzoeken of een hogere dosis dexamethason (12 mg) in vergelijking met de aanbevolen dosis (6 mg) leidt tot betere uitkomsten voor patiënten met ernstige COVID-19. Onder de 1000 gerandomiseerde patiënten was in de primaire frequentistische analyse het aantal days alive without life support at day 28 gemiddeld 1,3 dagen hoger in de interventiegroep dan in de controlegroep (95% betrouwbaarheidsinterval 0 tot 2,6 dagen, p=0,07). De conclusie: geen significant effect.

    Een Bayesiaanse heranalyse

    De auteurs hadden vooraf al gepland om een secundaire Bayesiaanse analyse uit te voeren voor een genuanceerde interpretatie van de resultaten.[2] Deze analyse werd uitgevoerd met zowel een neutrale (weakly informative) als een sceptische (i.e., grote kans op nuleffect) prior. Omdat de keuze van priors enigszins arbitrair kan zijn, moeten de definities en redenering erachter duidelijk beschreven zijn. Hier beginnen de moeilijkheden.

    Als neutrale prior gebruikten de auteurs een normaalverdeling op log-odds-schaal voor relatief effect met een gemiddelde van 0 en een standaarddeviatie van 1. De sceptische prior had een gemiddelde van 0 en een standaarddeviatie van 0,15. Het zal voor de meeste lezers onduidelijk zijn wat dit betekent en waarom precies voor deze getallen gekozen is.[3]

    Daarnaast wordt de lezer geconfronteerd met een overvloed aan berekende posterior probabilities. Voor elke uitkomstmaat (één primair en vijf secundaire eindpunten) wordt de kans gerapporteerd op zowel een relatief als absoluut verschil, elk voor vijf afkappunten (any benefit, any harm, clinically important benefit, clinically important harm, en no clinically important difference) voor zowel de neutrale als sceptische prior. In totaal worden dus 24 verschillende 95% credible intervals en 60 verschillende posterior probabilities voor het behandeleffect gerapporteerd. Welke getallen moet een clinicus nu gebruiken om een behandelbeslissing te nemen? En leidt deze hyperkwantificatie werkelijk tot een andere conclusie dan de frequentistische analyse?

    Voor de primaire uitkomstmaat zijn de Bayesiaanse 95% credible intervals onder de neutrale en sceptische prior bijna identiek aan het oorspronkelijke frequentistische 95% betrouwbaarheidsinterval (respectievelijk [-0,3 tot 2,9 dagen], [-0,2 tot 2,7 dagen] en [0 tot 2,6 dagen]). De lezer blijft daarom vooral achter met het gevoel dat de auteurs tot doel hadden if you can’t convince them, confuse them. Ten onrechte, want de motivatie voor deze secundaire analyse is goed verdedigbaar. De auteurs wilden de resultaten presenteren met meer ruimte voor nuance dan de dichotome boodschap ‘niet statistisch significant.’ Bayesiaanse statistiek is daarvoor bij uitstek geschikt. Maar deze studie laat zien dat het venijn in de details zit.

    Conclusie

    Als het de bedoeling is om met Bayesiaanse analyses betere beslissingen te kunnen maken, dan moeten de methoden begrijpelijk en transparant zijn voor clinici. Enerzijds zullen onderzoekers dus innovatieve oplossingen moeten verzinnen om de betekenis van een prior duidelijk te maken zonder overmatig wiskundig jargon. Anderzijds zullen clinici die zich willen toeleggen op evidence based medicine zich moeten verdiepen in de basics van Bayes. Tenslotte zullen beide groepen moeten samenwerken aan eenvoudige en gestandaardiseerde methodes om dit soort resultaten te kunnen rapporteren en gebruiken.

     

    De auteur verklaart dat er geen sprake is van een belangenconflict. Er is geen financiering of financiële steun ontvangen.

    Referenties

    1. Russell L, Uhre KR, Lindgaard ALS, et al. Effect of 12 mg vs 6 mg of Dexamethasone on the Number of Days Alive Without Life Support in Adults With COVID-19 and Severe Hypoxemia. JAMA. 2021;326(18):1807. doi:10.1001/jama.2021.18295
    2. Granholm A, Munch MW, Myatra SN, et al. Dexamethasone 12 mg versus 6 mg for patients with COVID-19 and severe hypoxaemia: a pre-planned, secondary Bayesian analysis of the COVID STEROID 2 trial. Intensive Care Med. 2022;48(1):45-55. doi:10.1007/s00134-021-06573-1
    3. de Grooth HJ, Elbers P. Pick your prior: scepticism about sceptical prior beliefs. Intensive Care Med. 2022;48(3):374-375. doi:10.1007/s00134-021-06602-z