Onderzoek
Alarmmoeheid op de intensive care: ontwikkeling van een Nederlandstalig klinimetrisch instrument
Inhoud:

    Auteur(s):

    Verona C.A. Gerardu1,2,, Jenny Schoenmakers1, Demy Driesen1, Ronny M. Schnabel1, Ulrich Strauch1, Dennis den Uijl3, Maximilian M. Wunderlich4, Akira-Sebastian Poncette4, Felix Balzer4, Iwan C.C. van der Horst1,5, Bas C.T. van Bussel1,5, Rob G.H. Driessen1,3,5

    Afdelingen 1Intensive Care Geneeskunde, 2Anesthesiologie en 3Cardiologie Maastricht Universitair Medisch Centrum +, Maastricht

    4Instituut voor Medische Informatica, Charité – Universiteitsziekenhuis, Berlijn, Duitsland

    5Cardiovasculair Research Instituut Maastricht (CARIM), Universiteit Maastricht, Maastricht

    Correspondentie:

    R. Driessen - rob.driessen@mumc.nl
    Onderzoek

    Alarmmoeheid op de intensive care: ontwikkeling van een Nederlandstalig klinimetrisch instrument

    Samenvatting

    Achtergrond

    Alarmmoeheid, een relevant probleem op de intensive care (IC), kan leiden tot desensitisatie en gevaar voor patiënten. Een Nederlandstalig meetinstrument om alarmmoeheid te meten onder verpleging en artsen bestaat nog niet. Deze studie beschrijft de vertaling van een gevalideerde, gepubliceerde Duitstalige vragenlijst (Charité Alarm Fatigue Questionnaire, CAFQa) naar een Nederlandse vragenlijst en de pilottest hiervan.

    Methode

    De CAFQa (een vragenlijst uit het Charité Universiteitsziekenhuis met negen items in tweefactorenmodel volgens vijfpunts-Likertschaal) werd naar het Nederlands vertaald middels het TRAPD-model (Translatie, Review, Adjudicatie, Pretest en Documentatie). Forward en backward-vertaling werd door twee onafhankelijke tweetalige intensivisten verricht. Cognitieve interviews werden verricht en resultaten werden besproken in het expertpanel voor de definitieve vertaling. De vragenlijst werd digitaal uitgezet als pilot onder verpleging en artsen van het MUMC+.

    Resultaten

    1. CAFQa werd forward en backward vertaald naar het Nederlands, 2. gereviewd en geaccordeerd in het expertpanel, 3. cognitieve interviews stelden goede indruksvaliditeit vast, 4. pretest werd uitgezet en gedocumenteerd. 112 responses werden ontvangen, waarvan 67% verpleegkundigen, 54% vrouw met een gemiddelde leeftijd van 41 jaar. Interne homogeniteit was voor factor 1 acceptabel (Cronbach’s alpha 0,72) en voor factor 2 lager (0,34). De sterke correlatie tussen de gemiddelde item score en gescoorde alarmmoeheid wees op een goede convergentie(begrip)validiteit. Gemiddeld gescoorde alarmmoeheid (schaal 1-10) was 4,90 (± 2,07).

    Conclusies

    Door klinimetrische vertaling van de CAFQa naar de eerste Nederlandse vragenlijst kan alarmmoeheid gemeten worden bij zorgprofessionals en wordt het mogelijk gezamenlijk onderzoek hiernaar te doen.

    Inleiding

    Op de intensive care (IC) en andere telemetrisch bewaakte afdelingen zijn we afhankelijk van alarmen die verpleegkundigen en artsen informatie geven over de conditie van hun patiënt. Een groot deel van de alarmen (beschreven is 72 tot 99%) is echter foutief en behoeft geen directe actie.[1] Minder dan 6% van de alarmen behoeft het inlichten van een arts. Door veel onjuiste alarmen kan er alarmmoeheid (Engels term: alarm fatigue) optreden. Dit wordt gedefinieerd als een zintuiglijke overbelasting bij zorgprofessionals die aan een overmatig aantal alarmen worden blootgesteld en daardoor desensitisatie ontwikkelen voor alarmen en zelfs alarmen missen.[2]

    Alarmmoeheid is een belangrijk probleem en staat regelmatig in de top 10 Technology Hazards van de Emergency Care Research Institute (ECRI). In de Verenigde Staten zijn overlijdens beschreven als gevolg van niet of niet tijdig reageren op alarmen.[3] Om het probleem in kaart te brengen kunnen vragenlijsten nuttig zijn, waarbij het belangrijk is zowel verpleegkundigen als artsen te bevragen.[4]

    Tot op heden zijn er twee relevante vragenlijsten ontwikkeld voor het meten van alarmmoeheid. De gouden standaard was van Torabizadeh uit 2017[5] , maar heeft als nadeel dat het vertaalproces uit de Iraanse taal (Farsi) onduidelijk is en alleen is ontwikkeld voor verpleegkundigen. De Charité Alarm Fatigue Questionnaire (CAFQa, uitgesproken zoals de schrijver Franz Kafka) van Wunderlich et al. heeft het vertaal- en validatieproces uitgebreid beschreven en gepubliceerd en is voor artsen én verpleegkundigen ontwikkeld.[6] Er is tot op heden geen gevalideerde Nederlandse vragenlijst voor het meten van alarmmoeheid beschikbaar.

    Het doel van deze studie is daarom het beschrijven van het vertaalproces van de CAFQa naar een Nederlandse vragenlijst en deze te valideren op een proefpopulatie van verpleegkundigen en artsen uit het Maastricht Universitair Medisch Centrum (MUMC+). Hiermee willen we een valide en betrouwbaar meetinstrument introduceren om alarmmoeheid op de Nederlandse IC te kwantificeren.

    Methode

    Ethische goedkeuring

    De studie werd voorgelegd aan de Medisch Ethische Toetsingscommissie (METC) (METC 2021-3060) van het MUMC+ en werd als niet-WMO plichtig beoordeeld. Deelname was vrijwillig, anoniem en deelnemers gaven toestemming voor het gebruiken van de geanonimiseerde gegevens voor wetenschappelijk onderzoek.

    CAFQa

    Het Charité Universiteitsziekenhuis Berlijn (MW en FB) ontwikkelde, valideerde en publiceerde eerder de Duitstalige vragenlijst CAFQa om alarmmoeheid te meten.[6] In het kort werden via literatuurstudie 124 items geselecteerd die via cognitieve interviews en een expertpanel teruggebracht werden tot 27 items van belang voor alarmmoeheid. Middels een exploratieve factoranalyse kwam men tot uiteindelijk negen vragen, verwerkt in een tweefactorenmodel (factor 1: een alarmstressschaal, en factor 2: een alarmcopingschaal). De vragen waren ontwikkeld op een vijfpunts-Likertschaal en vragen met een negatieve valentie werden gehercodeerd met reverse scoring (bijlage 1). De vragenlijst leverde 585 responses op met een goede interne homogeniteit vastgesteld middels Cronbach’s alpha, net als een hoge convergentievaliditeit gezien de zelfgerapporteerde alarmmoeheid sterk correleerde met de gemiddelde scores op de vragen. Een belangrijke reden om deze vragenlijst te gebruiken was ook dat CAFQa was ontwikkeld voor zowel verpleegkundigen als artsen in tegenstelling tot andere vragenlijsten als die van Torabizadeh et al[5], aangezien alarmmoeheid bij verpleegkundigen vaak onderbelicht blijft.[4]

    Vertalingsproces

    Voor de vertaling van de CAFQa volgden we de richtlijnen beschreven door Behr et al. en Harkness et al.[7] Eerst werd de inhoud en relevantie van de CAFQa voor de Nederlandse situatie beoordeeld door het expertpanel bestaande uit een psycholoog (MW) en drie intensivisten (AP, BvB en RD).[8] De vertalers zaten vanwege onafhankelijkheid niet in het expertpanel. We volgden het TRAPD-model (acroniem voor Translatie, Review, Adjudicatie, Pretest en Documentatie) en de principes van forward translation (Duits-Nederlands, door US als tweetalig intensivist) en backward translation (Nederlands-Duits, door RS als tweetalig intensivist). De twee versies werden vervolgens besproken in het expertpanel en eventuele inconsistenties werden opgelost. Na vertaling werden er cognitieve interviews afgenomen (door DD) met een zestal IC-verpleegkundigen voor het bepalen van de indruksvaliditeit: de mate waarin respondenten de items geschikt achten voor het beoogde doel van de vragenlijst.[9]. Daarna werd de uiteindelijke vragenlijst vastgesteld door het expertpanel (bijlage 1). De vragenlijst is vervolgens gedigitaliseerd via Google forms en verstuurd met een gekoppelde link met QR-code. Vervolgens, als Pretest uit het TRAPD-model, werd de vragenlijst uitgezet als een preliminaire pilottest onder het IC-personeel (verpleegkundigen en artsen) van het MUMC+.

    Statistische analyse

    Descriptieve statistiek werd gebruikt om demografische en klinische kenmerken van de studiepopulatie te beschrijven. Ten behoeve van validatie van de items werd er voor het bepalen van de interne homogeniteit de Cronbach’s alpha berekend. Deze maat scoort de mate van overeenkomst tussen 0 en 1 en een hogere waarde betekent een betere overeenkomst tussen de items. Convergentievaliditeit werd bepaald door correlatie tussen zelfgerapporteerde alarmmoeheid en de gemiddelde scores bij de items. Gebruik werd gemaakt van SPSS versie 22.0.

    Resultaten

    Vertaalproces

    Het vertaalproces leidde na onafhankelijke forward- en backward-vertaling door de tweetalige intensivisten (US, RS), meermaals bespreken van minimale inconsistenties en de interpretatie door het expertpanel tot een uiteindelijke vertaling van de negen vragenlijst-items (bijlage 1). Tijdens de cognitieve interviews bleek dat de vragen goed te interpreteren en te beantwoorden waren zonder verdere onduidelijkheden. Dit wijst op een goede indruksvaliditeit. Hierna werd de vragenlijst via e-mail en QR-code (posters) verspreid onder de verpleging en artsen van het MUMC+.

    Preliminaire pilot test

    Onderzoekspopulatie

    Voor de pilottest van de uiteindelijke versie van de vragenlijst gebruikten we de data van het MUMC+. In totaal werden 112 responses (24% van alle responsen (n=472)) ontvangen van zorgprofessionals waarvan 75 (67%) van verpleegkundigen waren en 30 (27%) van artsen. Zeven respondenten gaven het onderscheid tussen verpleegkundige of arts niet aan in de vragenlijst. Het merendeel van de respondenten (56%) was vrouw en de gemiddelde leeftijd was 41 jaar (tabel 1).

    Tabel 1 Baselinekarakteristieken van de respondenten van de pilottest (n=112)

    De gemiddelde geschatte mate van alarmmoeheid was 4,90 (± 2,06) op een schaal van 0-10 waarbij een hogere score meer alarmmoeheid betekent. Dit was voor verpleegkundigen hoger dan voor artsen, doch niet significant (5,0 vs. 4,8; p = 0.37) en voor vrouwen hoger dan voor mannen, echter ook niet significant (5,0 vs. 4,7; p = 0.19). Hetzelfde patroon zien we terug voor het aangegeven percentage onjuiste alarmen naar mening van de zorgprofessional (tabel 1). Gemiddeld wordt bijna 60% van de alarmen als onjuist beoordeeld, zonder significante verschillen tussen verpleegkundigen en artsen of geslacht.

    Evaluatie van de items in de vragenlijst

    De overall Cronbach’s alpha (voor alle vragen items) was 0,64 (middelmatig). Meer in detail, was deze voor factor 1 items (alarmstressschaal) 0,72, overeenkomend met een goede interne homogeniteit. Voor factor 2 items (alarmcopingschaal) was de interne overeenkomst slecht, namelijk 0,34.

    De gemiddelde scores op de items van de respondenten correleerden sterk met de zelfgerapporteerde mate van alarmmoeheid (op schaal 1-10) aan het einde van de vragenlijst: r = 0,63 (p< 0.001; 95% BI = 0,50-0,73). Dit komt overeen met een goede convergentie(begrip)validiteit. Bij apart analyseren van de item factoren bleek factor 1 ook een sterke correlatie te tonen met zelfgerapporteerde alarmmoeheid: r = 0,56 (95% BI = 0,42-0,68; p < 0.001) terwijl dit voor factor 2 lager was r = 0,39 (95% BI = 0,22-0,54; p < 0.001).

    Discussie

    Deze studie beschrijft de ontwikkeling van de eerste Nederlandstalige vragenlijst om alarmmoeheid te meten onder verpleegkundigen en artsen op de intensive care. Een gevalideerde en gepubliceerde Duitstalige vragenlijst (CAFQa) (6) werd vertaald naar het Nederlands en als pilot uitgezet onder het IC-personeel van het MUMC+. Interne homogeniteit en begrip van de vragen bleek goed te zijn en de vragenlijst kon in korte tijd (5-10 minuten) worden ingevuld. De vragenlijst kan gebruikt worden om alarmmoeheid te kwantificeren op de Nederlandse IC met meer aandacht voor verpleegkundigen.[4]

    Bij het vertalen van een vragenlijst is het van belang om de doelpopulatie en culturele verschillen tussen de landen van de bron- en doeltaal in acht te nemen. Voor reguliere vertalers is het vaak lastig om medische vaktaal op een goede manier te vertalen.[10] Daarom kozen we voor twee onafhankelijke tweetalige collega-intensivisten als vertalers. Daarnaast is het van belang om beschreven methodes als de TRAPD en forward en backward-vertaling te gebruiken en te testen op validiteit en betrouwbaarheid.[11] Omdat aan backward-vertaling ook nadelen zitten zoals het feit dat het geen oplossingen biedt voor tegenstrijdigheden en een vrij oppervlakkige methode is, hebben we gekozen om ook de TRAPD-methode te gebruiken met expertpanel en pilottest.[7]

    De resultaten qua overall interne homogeniteit waren in lijn met de CAFQa-studie met een Cronbach’s alpha van 0,64 in onze populatie versus 0,74 voor CAFQa.[6] Dit was ook het geval voor factor 1 items (0,72 vs. 0,80). Echter, voor factor 2 items was de interne homogeniteit in onze populatie lager dan in de Duitse populatie (0,34 vs. 0,57). In beide studies was een sterke correlatie tussen de gemiddelde scores op de items en zelfgerapporteerde alarmmoeheid, hoewel ook hier de correlatie voor factor 2 items lager was. Wellicht zou de vragenlijst derhalve nog kunnen worden ingekort voor de Nederlandse praktijk. Hiervoor is echter een confirmatory factor analyse nodig op een grotere populatie.

    Omdat nieuwe data uit een grotere populatie leidt tot meer informatie over de betrouwbaarheid en validiteit van een vragenlijst[7], hebben we de vragenlijst inmiddels als multicenterstudie uitgezet om alarmmoeheid te kwantificeren en een confimatory factor analyse te verrichten.

    Concluderend heeft vertaling van de CAFQa naar het Nederlands volgens een klinimetrische methode geleid tot een voldoende betrouwbare en valide korte Nederlandse vragenlijst om alarmmoeheid te meten onder IC-verpleegkundigen en artsen. Hiermee wordt het mogelijk om gezamenlijk onderzoek te doen naar alarmmoeheid op de IC.

     De auteurs verklaren dat er geen sprake is van een belangenconflict. Er is geen financiering of financiële steun ontvangen

    Referenties

    1. Sendelbach S, Funk M. Alarm fatigue: a patient safety concern. AACN Adv Crit Care. 2013;24(4):378-86; quiz 87-8.
    2. Jones K. Alarm fatigue a top patient safety hazard. CMAJ. 2014;186(3):178.
    3. Agha-Mir-Salim L, McCullum L, Dahnert E, Scheel YD, Wilson A, Carpio M, et al. Interdisciplinary collaboration in critical care alarm research: A bibliometric analysis. Int J Med Inform. 2024;181:105285.
    4. Torabizadeh C, Yousefinya A, Zand F, Rakhshan M, Fararooei M. A nurses’ alarm fatigue questionnaire: development and psychometric properties. J Clin Monit Comput. 2017;31(6):1305-12.
    5. Wunderlich MM, Amende-Wolf S, Krampe H, Kruppa J, Spies C, Weiss B, et al. A brief questionnaire for measuring alarm fatigue in nurses and physicians in intensive care units. Sci Rep. 2023;13(1):13860.
    6. Harkness J. Translation. Guidelines for Best Practice in Cross-Cultural Surveys Full Guidelines. 2011:290–351.
    7. Flaherty JA, Gaviria FM, Pathak D, Mitchell T, Wintrob R, Richman JA, Birz S. Developing instruments for cross-cultural psychiatric research. J Nerv Ment Dis. 1988;176(5):257-63.
    8. Boateng GO, Neilands TB, Frongillo EA, Melgar-Quinonez HR, Young SL. Best Practices for Developing and Validating Scales for Health, Social, and Behavioral Research: A Primer. Front Public Health. 2018;6:149.
    9. Sperber AD. Translation and validation of study instruments for cross-cultural research. Gastroenterology. 2004;126(1 Suppl 1):S124-8.
    10. Tsang S, Royse CF, Terkawi AS. Guidelines for developing, translating, and validating a questionnaire in perioperative and pain medicine. Saudi J Anaesth. 2017;11(Suppl 1):S80-S9.