Home Over het CBOKwaliteitsAcademie NederlandPublicatiesNieuwsbrievenContact

Handleiding EBRO

Bijlage A. Levels of evidence


Indeling van methodologische kwaliteit van individuele studies

.

Interventie

Diagnostisch accuratesse onderzoek

Schade of bijwerkingen, etiologie, prognose*

A1

Systematische review van tenminste twee onafhankelijk van elkaar uitgevoerde onderzoeken van A2-niveau

A2

Gerandomiseerd dubbelblind ver­gelijkend klinisch onderzoek van goede kwaliteit van voldoende omvang

Onderzoek ten opzichte van een referentietest (een ‘gouden standaard’) met tevoren gedefinieerde afkapwaarden en onafhankelijke beoordeling van de resultaten van test en gouden standaard, betreffende een voldoende grote serie van opeenvolgende patiënten die allen de index- en referentietest hebben gehad

Prospectief cohort onderzoek van voldoende omvang en follow-up, waarbij adequaat gecontroleerd is voor ‘confounding’ en selectieve follow-up voldoende is uitgesloten.

B

Vergelijkend onderzoek, maar niet met alle kenmerken als genoemd onder A2 (hieronder valt ook patiënt-controle onderzoek, cohort-onderzoek)

Onderzoek ten opzichte van een referentietest, maar niet met alle kenmerken die onder A2 zijn genoemd

Prospectief cohort onderzoek, maar niet met alle kenmerken als genoemd onder A2 of retrospectief cohort onderzoek of patiënt-controle onderzoek

C

Niet-vergelijkend onderzoek

D

Mening van deskundigen

* Deze classificatie is alleen van toepassing in situaties waarin om ethische of andere redenen gecontroleerde trials niet mogelijk zijn. Zijn die wel mogelijk dan geldt de classificatie voor interventies.

Niveau van conclusie

.

Conclusie gebaseerd op

1

Onderzoek van niveau A1 of tenminste 2 onafhankelijk van elkaar uitgevoerde onderzoeken van niveau A2

2

1 onderzoek van niveau A2 of tenminste 2 onafhankelijk van elkaar uitgevoerde onderzoeken van niveau B

3

1 onderzoek van niveau B of C

4

Mening van deskundigen


Gradering van kwalitatief onderzoek

Niveau

Studie

++

Geloofwaardige meta-synthese (synoniemen: meta-etnografie, kwalitatieve meta-analyse, meta-studie) van kwalitatieve studies

+

Geloofwaardige studie

+/-

Studie waarvan de geloofwaardigheid twijfelachtig is

-

Weinig geloofwaardige studie

Toelichting tabel levels of evidence

Gouden standaard
In de gezondheidszorg worden bij voorkeur diagnostische tests gebruikt die snel, eenvoudig, goedkoop en weinig belastend zijn. Vaak is men er niet helemaal zeker van of dergelijke tests ook werkelijk datgene meten wat ze geacht worden te meten. Om een diagnostische test op zijn merites te kunnen beoordelen, is het noodzakelijk in een bepaalde populatie de met behulp van deze test verkregen uitslagen te vergelijken met de uitkomsten van een an-der meetinstrument. Het moet hierbij gaan om een instrument dat op een objectieve, onaf-hankelijke manier de aanwezigheid of het stadium van dezelfde aandoening meet en waar-van men nagenoeg zeker weet dat het een juist beeld geeft van de werkelijkheid, dat wil zeggen: 100% valide is.

Een diagnostische referentietest met een erkende, ideale mate van validiteit wordt wel aan-geduid met ‘gouden standaard’. Enkele voorbeelden van een gouden standaard zijn de pa-thologisch-anatomische uitslag bij tumoren, echoscopie bij galstenen of anale temperatuur-meting met behulp van een koortsthermometer bij koorts. Voor veel aandoeningen is echter geen geaccepteerde ‘gouden standaard’ beschikbaar die definitief uitsluitsel geeft over de aanwezigheid van de aandoening in kwestie. Denk bijvoorbeeld aan kwalen als angina pec-toris, migraine of psychiatrische ziektebeelden. In dat geval kan vaak worden vergeleken met de best voorhanden zijnde test of kan het lange-termijn beloop van de aandoening als refe-rentietest worden gebruikt. Hierbij is het van belang dat de referentietest de werkelijkheid zo goed mogelijk benadert. Toepassing van een niet-valide referentietest kan leiden tot mis-classificatie van zieken en niet-zieken.

Uitkomsten van diagnostische onderzoeken kunnen onderling verschillen omdat verschillen-de referentietesten zijn gebruikt.

Voldoende grote serie van patiënten
Een vaststaand afkappunt voor ‘voldoende grote serie’ is niet te geven. Of een studie vol-doende patiënten omvat is afhankelijk van de aandoening en de uitgangsvraag. In het alge-meen kan worden gezegd dat een studie een onvoldoende grote serie van patiënten omvat indien het in de rede ligt om een groter aantal te verwachten. Bij een aandoening die veel voorkomt, bijvoorbeeld hart- en vaatziekten, zal een ander aantal voldoende zijn dan bij een zeldzame aandoening, zoals familiaire hypercholesterolaemie. Indien de uitgangsvraag spe-cifiek geldt voor een klein deel van de patiënten (bijvoorbeeld patiënten met hart- en vaat-ziekten voor het 40e levensjaar), dan zullen studies die deze vraag beantwoorden naar ver-wachting minder patiënten bevatten. Dit betekent niet dat de beschikbare studies van minder groot belang zijn.
Een indruk van de nauwkeurigheid van de gevonden effectschatting wordt gegeven door het 95%-betrouwbaarheidsinterval. Dit interval geeft de boven- en benedengrens aan waarbin-nen de werkelijke waarde van het effect of de associatie met 95% aannemelijkheid zal lig-gen.

Diagnostische accuratesse
De term accuratesse verwijst naar de mate van overeenkomst tussen de test die wordt geë-valueerd (de indextest) en de referentietest. Diagnostische accuratesse kan op verschillende manieren worden gekwantificeerd, bijvoorbeeld via de sensitiviteit, specificiteit, likelihood ratio’s, odds ratio’s of de ‘area onder de receiver-operating characteristic (ROC) curve’ (AUC).

Hierbij dient te worden opgemerkt dat een accurate test niet direct inhoudt dat de test ook relevant is voor de klinische praktijk. De vraag of een test relevant is, hangt ook samen met de gevolgen van de test voor de patiënt (hoe invasief is de test) en de verwachte bijdrage van de testuitslag aan de besluitvorming en het te voeren beleid.

Megatrials
Vooralsnog worden de megatrials als een gewone trial beschouwd. Een beknopte studie van de literatuur over megatrials wijst uit dat er geen consensus of een meerderheidsstandpunt bestaat wat het niveau van bewijs van megatrials betreft. Dit is een onderwerp voor verder (literatuur-) onderzoek.

Prognose
Prognostische studies zijn vanwege hun observationele karakter ingedeeld bij etiologische studies. Dit laat onverlet dat er belangrijke verschillen tussen etiologische en prognostische studies zijn. In prognostische studies is het bijvoorbeeld essentieel dat de onderzoeksgroep is samengesteld uit patiënten op een gemeenschappelijk moment in het ziektebeloop. Nader (literatuur-)onderzoek is nodig om een separate indeling voor de methodologische kwaliteit van prognostische studies te onderbouwen.

Om een oordeel te kunnen vormen over de mate waarin een richtlijn toegepast wordt is informatie vanuit de praktijk nodig. Deze informatie kan ondermeer worden verkregen gebruik te maken van indicatoren. Indicatoren zijn meetbare elementen die een aanwijzing geven over de kwaliteit van een bepaald aspect van de zorgverlening. Indicatoren hebben vooral een signalerende functie. Er wordt onderscheid gemaakt in structuur-, proces- en uitkomstindicatoren: - Structuurindicatoren geven informatie over de organisatie van een zorgsysteem of over de omstandigheden die nodig zijn om de gewenste zorg te leveren. Een concreet voorbeeld: ‘Percentage diabetesteams met een podotherapeut’ of ‘aanwezigheid van een stroke unit’. - Procesindicatoren geven informatie over de kwaliteit van het zorgproces. Het gaat om het bepalen van het percentage gevallen waarbij een bepaalde procedure is gevolgd. Om te kijken of een richtlijn in de praktijk wordt toegepast worden vaak procesindicatoren gebruikt. Een concreet voorbeeld: ‘het percentage mensen met diabetes dat jaarlijks een oogheelkundig onderzoek krijgt’. - Uitkomstindicatoren richten zich op de uitkomsten (producten/effecten) van zorg. Een concreet voorbeeld: ‘het percentage mensen met diabetes dat retinopathie heeft’. Uitkomsten van de zorg hangen af van het proces maar ook van de wensen van de patiënt en van het beschikbare budget en zijn soms maar gedeeltelijk te beïnvloeden. Het ontwikkelen van indicatoren is steeds meer een vast onderdeel van het richtlijnontwikkeltraject. Het daadwerkelijk invoeren en meten van de indicatoren valt buiten de verantwoordelijkheid van de richtlijnwerkgroep. Voor concrete informatie over het ontwikkelen van indicatoren wordt verwezen naar de online handleiding indicatorontwikkeling. Voor meer informatie over het evalueren van indicatoren wordt verwezen naar het Appraisal of Indicators through Research and Evaluation (AIRE) instrument (beschikbaar op orde.artsennet.nl). © Kwaliteitsinstituut voor de Gezondheidszorg CBO Handleiding voor werkgroepleden, november 2007