Hoezo, bewijs? prof.dr. Y.M. Smulders - Vitromics
Hoezo, bewijs? prof.dr. Y.M. Smulders - Vitromics
Hoezo, bewijs? prof.dr. Y.M. Smulders - Vitromics
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Hoezo</strong>, <strong>bewijs</strong>?<br />
<strong>prof</strong>.<strong>dr</strong>. Y.M. <strong>Smulders</strong><br />
Rede uitgesproken bij de aanvaarding van het ambt van hoogleraar<br />
Algemene Inwendige Geneeskunde aan de faculteit der Geneeskunde van<br />
de Vrije Universiteit Amsterdam / VU Medisch Centrum op 11 juni 2008
<strong>Hoezo</strong>,
ewijs?<br />
<strong>prof</strong>.<strong>dr</strong>. Y.M. <strong>Smulders</strong>
Mijnheer de Rector, dames en heren<br />
Ik wil u een verhaal vertellen.<br />
Er was eens een jonge vrouw, 29 jaar. Zij was AIOS: arts-in-opleiding tot specialist, in<br />
dit geval internist. Haar voornamen waren Annemarie Josianne en door haar collega’s<br />
werd ze daarom altijd gekscherend “A. Jos” genoemd.<br />
Het is oktober 2006, 8 uur in de ochtend, het VU Medisch Centrum. A. Jos, al in<br />
het derde jaar van haar opleiding, heeft haar nachtdienst er net op zitten. Zij zet<br />
zich achter een microfoon in de over<strong>dr</strong>achtsruimte, die langzaam volstroomt met<br />
co-assistenten, arts-assistenten en internisten.<br />
Haar eerste patiënt presenteert zij vlekkeloos. Maar bij de tweede gaat het mis. Het<br />
betreft een oude man die die nacht is opgenomen met een longembolie. Dit betekent<br />
dat er een bloedstolsel is vastgelopen in de longslagader. De man was kortademig en<br />
had een snelle hartslag. A. Jos wist dat de standaardbehandeling voor longembolie<br />
was te starten met onderhuidse injecties met heparine, een bloedverdunner. Zij wist<br />
echter ook dat het bloedverdunnende effect hiervan pas na enkele uren zou intreden.<br />
Omdat zij niet gerust was op de klinische toestand van de patiënt, zo vertelde zij, had<br />
zij de eerste gift van het medicijn per infuus, dus direct in de bloedbaan, toegediend.<br />
‘Daar is geen enkel <strong>bewijs</strong> voor’, galmt het door de over<strong>dr</strong>achtsruimte. A. Jos kijkt<br />
op. Recht tegenover haar kijkt een van de internisten haar aan. ‘In de klinische trials<br />
is ook niet begonnen met een intraveneuze dosis’, vervolgt hij. ‘Dat is waar’, zegt zij.<br />
‘Maar ik dacht…’. ‘Je mag best denken, maar er is geen enkel <strong>bewijs</strong> en wij doen hier<br />
aan Evidence Based Medicine’. A. Jos weet niet meer wat ze moet zeggen. Ze worstelt<br />
zich zo goed en zo kwaad als het gaat door de rest van de over<strong>dr</strong>acht.<br />
Figuur 1<br />
Tegenwind<br />
5
6<br />
Op de fiets naar huis, er is tegenwind. Zij baalt. Zij kent die onderzoeken ook wel en<br />
weet dat zij iets heeft gedaan wat in die trials niet werd gedaan. Maar het leek haar<br />
domweg logisch dat deze patiënt baat zou kunnen hebben bij het direct intreden van<br />
het bloedverdunnend effect. Is het redelijk daarvoor <strong>bewijs</strong> te eisen? En dat “<strong>bewijs</strong>”<br />
waar om gevraagd wordt, wat is dat eigenlijk? Er werd gesproken over “geen enkel<br />
<strong>bewijs</strong>”. ‘Misschien bedoelde hij wel een helebóel <strong>bewijs</strong> (hij zei immers “geen énkel”)’,<br />
denkt A. Jos glimlachend. Het licht springt op rood en zij stopt.<br />
Van fysiologie naar epidemiologie<br />
Thuisgekomen denkt A. Jos terug aan de beginjaren van haar studie geneeskunde. Het<br />
onderwijs werd gedomineerd door basale en toegepaste fysiologie. Fysiologie kenmerkt<br />
zich vooral doordat het causale verbanden tussen biologische fenomenen probeert te<br />
leggen. Bevlogen docenten bezworen dat gedegen kennis van de fysiologie de sleutel<br />
tot goed dokterschap vormde. Er werd geest<strong>dr</strong>iftig verteld over Claude Bernard, u ziet<br />
zijn afbeelding in figuur 2, die in de eerste helft van de negentiende eeuw de fysiologie<br />
enorme impulsen had gegeven. 1 Fysiologie legde de basis voor pathofysiologie: de kennis<br />
van hoe het lichaam werkt onder abnormale omstandigheden, vooral tijdens ziekte. Ook<br />
was er tijdens de studie ruim aandacht voor basale moleculaire wetenschappen, die de<br />
fysiologie en pathofysiologie in een ongekende stroomversnelling hebben gebracht. Het<br />
denken in termen van oorzaak en gevolg, van complexe maar intelligent gereguleerde<br />
biologische systemen verenigde tijdens de studie het nuttige met het aangename.<br />
Fysiologie vormde het intrumentarium, logica domineerde en teleologie 2 bood een vaak<br />
verleidelijke kijk op de geneeskunde. Het was echt leuk om zo met het vak bezig te zijn.<br />
Figuur 2.<br />
Claude Bernard
Later tijdens de studie ontstond er op bescheiden schaal meer aandacht voor een<br />
andere bron van kennis: het epidemiologisch onderzoek. Dit type onderzoek is<br />
gebaseerd op waarnemingen bij groepen personen. Op verschillende manieren kan<br />
men onderzoek doen onder groepen mensen. Hun eigenschappen of reactie op een<br />
behandeling kunnen achteraf bestudeerd worden, ze kunnen gedurende een bepaalde<br />
periode worden geobserveerd, of ze kunnen bijvoorbeeld door loting een behandeling<br />
toegewezen krijgen, waarbij een tijdje later het verschil in uitkomst wordt vastgelegd.<br />
Dit laatste heet een gerandomiseerde klinische trial en wordt in de hiërarchie van het<br />
epidemiologisch onderzoek doorgaans als het vlaggenschip beschouwd, ook al leidt<br />
het zelden tot echt vernieuwende inzichten. 3<br />
Vooral tijdens het klinische deel van de opleiding merkte A. Jos al snel dat als het woord<br />
‘<strong>bewijs</strong>’ werd gebruikt, men vrijwel uitsluitend doelde op <strong>bewijs</strong> uit epidemiologisch<br />
onderzoek. Dit type <strong>bewijs</strong> vormt het fundament onder wat we Evidence Based<br />
Medicine noemen; een vorm van geneeskunde die de laatste 10 tot 20 jaar feitelijk tot<br />
norm is verheven. Die ontwikkeling heeft vele oorzaken, waaronder een verlangen<br />
naar zogenaamde objectiviteit en “accountability”: rekenschap kunnen afleggen. Maar<br />
ook de opmars van kosten-effectiviteitsvraagstukken en een behoefte tot relativering<br />
van het dogmatische karakter van de fysiologie speelt een rol. 4 De status van fysiologie<br />
als bron van <strong>bewijs</strong> is daarentegen laag. A. Jos voelt zich een beetje belazerd: tijdens de<br />
studie werd zij enthousiast gemaakt met fysiologie, maar in praktijk moet zij de<br />
resultaten van epidemiologische studies uit haar hoofd leren en zich daaraan houden.<br />
Anders is het geen Evidence Based Medicine. En áls zij dan eens teruggrijpt naar de<br />
fysiologie, zoals in deze nachtdienst, dan wordt zij op de vingers getikt. Met een diepe<br />
zucht maakt zij zich op om naar bed te gaan.<br />
7
8<br />
A. Jos slaapt kort en onrustig. Het lijkt alsof de kat van de buren haar opzettelijk<br />
wakker houdt. Gevoelsmatig deugt het niet wat er vanochtend bij de over<strong>dr</strong>acht<br />
gebeurde. Epidemiologisch <strong>bewijs</strong> ver<strong>dr</strong>ingt andere vormen van kennis en kunde. Om<br />
twee uur in de middag is zij alweer op en fietst zij klaarwakker naar het VUmc. Zij is<br />
op weg naar de medische bibliotheek.<br />
Is <strong>bewijs</strong> <strong>bewijs</strong>?<br />
A. Jos wil uitzoeken hoe sterk epidemiologisch <strong>bewijs</strong> eigenlijk is. Al fietsend denkt<br />
zij na over deze vraag. Claude Bernard deed tamelijk absolute uitspraken op grond<br />
van zijn fysiologische experimenten. Resultaten van dit soort experimenten leiden<br />
tot universele hypothesen. Zolang deze hypothesen niet ontkracht worden, kunnen<br />
ze als “waar” worden beschouwd. Epidemiologisch onderzoek daarentegen werkt<br />
anders, realiseert A. Jos zich, terwijl zij haar kansen inschat om in de Leidsestraat tegen<br />
een bekeuring aan te fietsen. Een klinische trial die behandeling A met behandeling<br />
B vergelijkt kan als uitkomst hebben dat behandeling A in 60% van de gevallen tot<br />
genezing leidt tewijl behandeling B dat in 40% van de gevallen doet. Doorgaans<br />
leidt dat tot de conclusie dat A beter is dan B. Dat klinkt alsof het een blootgelegde<br />
natuurwetmatigheid betreft, die voor ieder individu met de bewuste ziekte geldt,<br />
net als fysiologische mechanismen voor iedereen gelden. ‘Onzin’, denkt A. Jos, ‘het<br />
enige <strong>bewijs</strong> dat is geleverd is dat behandeling A wat váker helpt dan behandeling<br />
B. Er is dus alleen <strong>bewijs</strong> geleverd voor de kans op genezing. Dat klinkt als iets<br />
eigenaardigs: “<strong>bewijs</strong> voor een kans”. Hoe dan ook, het is belangrijk te realiseren dat<br />
epidemiologisch onderzoek uitspraken doet over kansen en waarschijnlijkheden,<br />
Figuur 3<br />
Probabilisme van alledag
zogenaamde “probabilistische uitspraken”’. Zij fietst langs een agent die een andere<br />
fietser bekeurt. ‘Al 3 jaar zonder kleerscheuren het Leidseplein bereikt’, mompelt zij.<br />
‘Bewezen veilig, zou ik zeggen.’<br />
‘De vraag hoe sterk epidemiologisch <strong>bewijs</strong> is, is nog niet beantwoord’, denkt A.<br />
Jos terwijl zij de portier groet en de bibiotheek inloopt. Meestal wordt als maat<br />
voor de kracht van epidemiologisch <strong>bewijs</strong> het significantieniveau gebruikt. Dat<br />
significantieniveau wordt uitge<strong>dr</strong>ukt in de zogenaamde p-waarde. Als een onderzoek<br />
bijvoorbeeld laat zien dat behandeling A vaker succesvol is dan B, dan geeft de<br />
p-waarde in essentie aan hoe groot de kans is dat dit verschil op toeval berust<br />
(statistici moeten mij deze formulering voor nu maar vergeven). Als die kans op een<br />
toevalsbevinding minder dan 5% is, dan is de afspraak dat de onderzoeksuitkomst<br />
“statistisch significant” wordt genoemd.<br />
Dat klinkt redelijk en objectief, maar statistische significantie houdt met een groot<br />
aantal factoren geen rekening. Welke zijn die factoren? De auteurs formuleren hun<br />
onderzoeksvraag niet altijd zorgvuldig. Er is een strenge selectie van de deelnemers<br />
aan hun onderzoek. Ze ontwerpen de onderzoeksmethode en analyseren de gegevens<br />
op een wijze die hen het beste uitkomt en vaak wordt maar een klein deel van de<br />
bevindingen gerapporteerd. Als de resultaten tegenvallen, vanuit het perspectief<br />
van de onderzoekers of van de sponsor, dan wordt het onderzoek soms niet eens<br />
ingediend bij een tijdschrift. En als het artikel naar een tijdschrift gaat, dan is de<br />
kans dat het voor publicatie wordt aanvaard veel groter als het onderzoek een<br />
“positief” resultaat heeft. Wat u in de literatuur leest is dus voordien blootgesteld<br />
aan vele bronnen van vertekening die u niet ziet weerspiegeld in de p-waarde. Maar die<br />
9
10<br />
bronnen van vertekening beïnvloeden de kans dat de uitkomst van het onderzoek ook<br />
in de werkelijkheid van de praktijk “waar” is in sterke mate. 5 Het woord “waar” zal nog<br />
vaker vallen. U kunt het in veel gevallen beter vertalen als “reproduceerbaar” dan als<br />
“in overeenstemming met de werkelijkheid”, want het begrip “werkelijkheid” heeft vele<br />
beperkingen, die ik niet zal bespreken.<br />
Een nog niet genoemde, maar belangrijke factor voor het waarheidsgehalte van<br />
het resultaat van een onderzoek is de vraag hoe groot de kans op dit resultaat<br />
was voordat met het onderzoek werd begonnen. Die zogenaamde voorafkans<br />
volgt uit de reeds beschikbare feitenkennis, maar ook uit hoe deze feitenkennis is<br />
verworven. Echter, ook de vraag of de onderzoeksuitkomst op grond van logische<br />
argumenten aannemelijk is speelt een rol. Dat klinkt eigenaardig, maar wellicht helpt<br />
een voorbeeld. Stelt u zich voor dat u een apparaat maakt om te meten waar een<br />
hemellichaam van is gemaakt. Het apparaat werkt niet perfect, maar wel altijd even<br />
goed en wordt als eerste op Mars gericht. ‘Zand en rotsen’, geeft het als uitslag en<br />
we accepteren dat direct, want het is een plausibel resultaat. Maar als het apparaat<br />
op de maan wordt gericht en als uitslag geeft dat deze is gemaakt van kaas, dan<br />
is de kans dat dat waar is een stuk kleiner. Los van de gaten in het oppervlak is<br />
er namelijk niets wat deze bevinding ondersteunt. Met dezelfde test kunnen dus<br />
geloofwaardige en ongeloofwaardige resultaten worden geproduceerd en zo is het<br />
met een onderzoek ook. Een goed onderzoek met een significante uitkomst heeft<br />
een kleinere kans om “waar” te zijn als het resultaat niet plausibel is. En omgekeerd,<br />
een onderzoek met een heel plausibele beginhypothese dat de significantie<strong>dr</strong>empel<br />
niet haalt, kan nog heel goed “waar” zijn. Wat bepaalt die plausibiliteit dan? Behalve<br />
het beschikbare kennisfundament zijn ook argumenten uit de fysiologie hierop van<br />
Figuur 4<br />
De maan is gemaakt van kaas!
invloed. ‘Zouden de “intelligente” fysiologie enerzijds en de “domme” epidemiologie<br />
anderzijds zich dan op deze wijze tot elkaar verhouden?’, denkt A. Jos. ‘Het gezond<br />
verstand dat de “waarheden” die epidemiologisch onderzoek pretendeert te<br />
produceren conditioneel maakt op fysio-logische plausibiliteit? Klinkt aannemelijk,<br />
maar eigenlijk loop ik op de zaken vooruit. Ik was bezig met de kwaliteit van<br />
epidemiologisch <strong>bewijs</strong>’.<br />
De Griekse epidemioloog John Ioannidis heeft uitgerekend hoe groot de kans is<br />
dat gepubliceerd epidemiologisch onderzoek, dat statistisch significante uitkomsten<br />
heeft, ook echt “waar” is. 6 Hij hield daarbij rekening met alle voornoemde<br />
in vloeden van vertekening en plausibiliteit. Het resultaat staat in figuur 5 en is<br />
ontluisterend.<br />
Grote trials met significante uitkomsten hebben gemiddeld slechts 85% kans om<br />
“waar” te zijn. De meta-analyse, zeg maar een optelsom van meerdere grote trials,<br />
is helemaal niet beter. En dat terwijl juist meta-analyses als de hoogste graad van<br />
<strong>bewijs</strong> worden gezien als het gaat om Evidence Based Medicine. 7 En van de overige<br />
typen gepubliceerd onderzoek, zeg maar de bulk van de medische literatuur, is het<br />
grootste deel zelfs “niet waar”. A. Jos is verbijsterd. Bij het lezen van een artikel over<br />
een klinische trial interpreteert zij het significantieniveau als een betrouwbare maat<br />
voor de kans dat de conclusie “waar” is. Een p-waarde van een klinische trial van 1%<br />
betekende voor haar dat er zeker 99% kans is dat behandeling A inderdaad beter is<br />
dan B. Nu blijkt dat die kans gemiddeld 85%, maar vaak zelfs nog lager is. Zij kijkt om<br />
zich heen en ziet ijverige studenten en haastige artsen. ‘Wie zou dit weten? Iedereen<br />
moet dit weten’, denkt zij en zij kan de neiging mensen aan te stoten nauwelijks<br />
onder<strong>dr</strong>ukken.<br />
Figuur 5<br />
Kans op “waar” (lees:<br />
“reproduceerbaar”)<br />
zijn van diverse typen<br />
epidemiologisch<br />
onderzoek, met<br />
verschillende niveau’s van<br />
aannemelijkheid van de<br />
onderzoeks hypothesen<br />
Type onderzoek Aannemelijkheid Kans op ‘waar’ zijn<br />
van de resultaten<br />
Grote gerandomiseerde Hoog 85%<br />
klinische trial (RCT)<br />
Meta-analyse van grote, Zeer hoog 85%<br />
eensgezinde RCT´s<br />
Meta-analyse van kleinere, Gemiddeld 41%<br />
tegenstrijdige onderzoeken<br />
Kleine, maar goed Gemiddeld 23%<br />
uitgevoerde RCT<br />
Klein epidemiologisch Laag 12%<br />
‘exploratief’ onderzoek<br />
11
12<br />
Epidemiologisch <strong>bewijs</strong>: op wie toepasbaar?<br />
Een jaar gaat voorbij. A. Jos is tevreden met het besef dat epidemiologisch <strong>bewijs</strong><br />
vaak lang niet zo sterk is als wordt gesuggereerd. Ze zal haar kennis van de fysiologie<br />
gebruiken om met gezond verstand het “waarheidsgehalte” van uitkomsten van<br />
epidemiologisch onderzoek bij te stellen.<br />
Dan loopt zij een opleidingsstage in het vakgebied Vasculaire Geneeskunde. Als<br />
er ergens veel fysiologische kennis over is en ook nog eens een enorme hoeveelheid<br />
epidemiologisch onderzoek, dan is het wel over vaataandoeningen, weet A. Jos. Als de<br />
geneeskunde dus ergens van een leien dakje zal gaan, dan zal dat hier wel zijn. Maar<br />
dat valt bitter tegen. Tijdens de patiëntenbesprekingen wordt vrijwel over iedere casus<br />
gesteggeld. Soms gaat het er daarbij fel aan toe, terwijl het patiënten betreft met<br />
weinig complexe aandoeningen, bijvoorbeeld hoge bloed<strong>dr</strong>uk.<br />
‘Deze internisten hebben geen fysiologische kennis, kunnen niet logisch denken<br />
of kennen de klinische trials niet’, denkt A. Jos, als zij op een woensdagavond<br />
gefrustreerd naar huis fietst. ‘Immers, de “waarheid” is het product van plausibiliteit<br />
en epidemiologisch <strong>bewijs</strong> en als je het over de “waarheid” niet eens kunt worden<br />
ken je dus of het epidemiologisch <strong>bewijs</strong> niet, of je bent niet in staat plausibiliteit te<br />
waarderen.’ Maar zij kan geen zwakke punten bij de internisten ontdekken. Ze zijn<br />
allemaal slim en zitten vol feitenkennis. Bovendien, zo blijkt bij discussies die niet<br />
over patiënten maar over ziektebeelden gaan, is men het maar zelden oneens over<br />
“de waarheid”. ‘Dan resteert er slechts één mogelijkheid’, concludeert A. Jos, ‘en dat<br />
is dat de problemen ontstaan bij de extrapolatie van algemene waarheden naar<br />
individuele patiënten’. En inderdaad, ook daar wringt de Evidence-Based-Medicineschoen.<br />
Als het uit een epidemiologische onderzoek verkregen <strong>bewijs</strong> al “waar” is,
dan nog geldt dit <strong>bewijs</strong> voor de gemíddelde patiënt in die trial. A. Jos vraagt zich<br />
af of je ooit zo’n “gemiddelde patiënt” in je spreekkamer ziet. Heel soms zie je een<br />
patiënt met een groot aantal karakteristieken die hetzelfde zijn als de gemiddelden<br />
van de trialpatiënten. Maar dan nog kan op een groot aantal andere, deels onbekende<br />
karakteristieken die patiënt wezenlijk anders zijn. Eigenlijk is iedere patiënt een<br />
uitzondering en representeert de uitkomst van epidemiologisch onderzoek het<br />
gemiddelde der uitzonderingen. Je kunt kijken naar het behandeleffect in subgroepen<br />
van trialdeelnemers die voor een deel overeenkomen met de patiënt die voor je zit,<br />
maar ook dat heeft grote beperkingen. 8 Tot overmaat van ramp zouden verreweg de<br />
meeste patiënten die voor je zitten helemaal nooit in een trial zijn geïncludeerd. De<br />
trials sluiten namelijk zoveel mensen om tamelijk triviale redenen uit dat slechts een<br />
kleine minderheid meedoet. 9 ‘Maar ook bij de mensen in mijn spreekkamer die voor<br />
een trial uitgesloten zouden zijn moet ik een beslissing nemen’, denkt A. Jos.<br />
‘De kernvraag is dus: Wat moet ik met de gemiddelde effectiviteit van een behandeling<br />
in een streng geselecteerde groep als ik geïnteresseerd ben in de optimale behandeling<br />
van de patiënt die tegenover mij zit? Kan ooit bewezen worden dat <strong>bewijs</strong> dat voor<br />
de denkbeeldige gemiddelde patiënt is geleverd ook geldt voor mijn patiënt in de<br />
spreekkamer? Nee. Maar als dat <strong>bewijs</strong> ontbreekt, dan kan in de spreekkamer nooit<br />
Evidence Based Medicine worden be<strong>dr</strong>even, tenzij je de spreekkamer zo groot maakt dat<br />
er duizenden patiënten tegelijk inpassen en je een microfoon nodig hebt om iedereen te<br />
bereiken. Eigenlijk is dus alleen iemand als Jomanda, tijdens haar “healing-sessies”, in de<br />
gelegenheid Evidence Based Medicine te be<strong>dr</strong>ijven’, concludeert A. Jos met een glimlach.<br />
Leuk is het allemaal niet. Hoe vertaal je <strong>bewijs</strong> dat in groepen is geleverd naar een<br />
individuele patiënt in de spreekkamer? Recent was er een heftige discussie in de<br />
Figuur 6<br />
Jomanda tijdens een “healingservice”-bijeenkomst<br />
13
14<br />
media over de vraag of <strong>bewijs</strong> dat in specifieke groepen is verkregen mag worden<br />
geëxtrapoleerd naar andere groepen. Cholesterolverlagers verminderen het risico op<br />
hart- en vaatziekten, dat is aangetoond bij jonge mannen. Er zijn mensen die oudere<br />
mannen en vrouwen cholesterolverlagers willen ontzeggen omdat hetzelfde effect<br />
voor die groepen niet aangetoond is. Nu viel deze discussie nog wel te voeren met<br />
kennis over de pathofysiologie van hart- en vaatziekten. Die is bij vrouwen en ouderen<br />
namelijk voor zover bekend vrijwel hetzelfde als bij jonge mannen. Het extrapoleren<br />
van het <strong>bewijs</strong> verkregen bij jonge mannen naar vrouwen en ouderen ligt om die<br />
reden voor de hand. 10<br />
Met gezond verstand en kennis van de fysiologie is het extrapoleren van <strong>bewijs</strong> van<br />
het ene type patiënt naar het andere type patiënt dus niet zo ingewikkeld. Anders is<br />
het als <strong>bewijs</strong> vanuit een gemiddelde patiënt uit een groot onderzoek geëxtrapoleerd<br />
moet worden naar een individuele patiënt. Hoe intelligent moet je daarvoor wel niet<br />
zijn? Dr. House uit de gelijknamige televisieserie staat bekend als extreem intelligent.<br />
Is hij intelligent genoeg om epidemiologisch <strong>bewijs</strong> naar individuen te vertalen?<br />
Misschien wel, maar het opmerkelijke is dat hij bijna stelselmatig van epidemiologisch<br />
<strong>bewijs</strong>, en van de daaruit voorvloeiende richtlijnen, afwijkt. Leidt scherpzinnigheid dan<br />
tot het afwijken van epidemiologisch <strong>bewijs</strong>?<br />
A. Jos zit thuis en zakt na een eenzame maaltijd weg in haar luie stoel. Hoe vertaal<br />
ik epidemiologisch <strong>bewijs</strong> naar een individuele patiënt? Zij denkt terug aan een<br />
jaar geleden. Zij concludeerde toen dat het “waarheidsgehalte” van uitkomsten van<br />
epidemiologisch onderzoek afhankelijk is van de plausibiliteit van die uitkomsten.<br />
‘Als dat voor algemene waarheden geldt, zou het dan ook voor patiëntgebonden<br />
waarheden gelden?’, denkt zij. ‘Als de algemene waarheid voortkomt uit het product<br />
Figuur 7<br />
Doctor House: toonbeeld van<br />
scherpzinnigheid?
van plausibiliteit en epidemiologisch onderzoek, is er dan ook zoiets op individueel<br />
niveau?’ Dit komt dicht bij wat A. Jos ooit heeft geleerd in de context van diagnostiek,<br />
namelijk de regel van Bayes. Die regel stelt dat de kans dat een persoon een bepaalde<br />
aandoening heeft na het verrichten van een “onafhankelijke” test afhankelijk is van de<br />
kans op die aandoening vóórdat die test werd gedaan. Voorbeeld: Als een longfoto<br />
aanwijzingen voor een longontsteking laat zien, dan is de kans dat er echt een<br />
longontsteking is veel groter bij mensen die hoesten en koortsig zijn dan bij mensen die<br />
geen enkele klacht hebben. ‘Waarom zou ik dit principe niet mogen vertalen naar mijn<br />
huidige dilemma?’, denkt A. Jos. ‘De gegevens uit epidemiologisch onderzoek nemen<br />
dan de plaats in van de “onafhankelijke” test en de eigenschappen van de individuele<br />
patiënt nemen de plaats in van de voorafkans. De uitkomst is nu de juistheid van een<br />
klinische handeling’. Zij beseft nu dat Ioannidis feitelijk ook op dit spoor zat, maar het<br />
extrapoleren van dit principe naar een individuele patiënt is wel een stap verder. ‘Een<br />
enge stap’, denkt A. Jos. ‘Hoe kan een arts patiënteigenschappen zo duiden dat hij<br />
daarmee op toetsbare wijze kan afwijken van wat de koele cijfers van epidemiologisch<br />
<strong>bewijs</strong> voorschrijven?’ Eén mogelijkheid zou kunnen zijn om de afwijking van een<br />
specifieke patiënt van de gemiddelde trialpatiënt cijfermatig in kaart te brengen. Daar<br />
blijken inderdaad formules voor te zijn waaronder de formule die u in figuur 8 ziet<br />
afgebeeld. A. Jos begrijpt helemaal niets van deze formule, maar vindt ook dat begrip<br />
niet noodzakelijk is om te concluderen dat iets intuïtief niet deugt. Weg ermee dus.<br />
Hier ligt geen taak voor wiskundigen.<br />
Hoe doen artsen dat? Hoe vertalen ze epidemiologisch <strong>bewijs</strong> naar individuele<br />
patiënten? Althans, hoe zouden ze dat eigenlijk moeten doen? Het is mogelijk dit<br />
soort denkstappen te beschrijven en zelfs te onderzoeken. De term hiervoor is<br />
“heuristiek”. 11 Het is echter een illusie dat je deze denkstappen in maat en getal kunt<br />
Figuur 8<br />
De juistheid van een klinische<br />
handeling weergegeven als<br />
het product van specifieke<br />
patiënteigenschappen en<br />
epidemiologisch <strong>bewijs</strong><br />
15
16<br />
vangen. 12 Het gaat namelijk om weging van het belang van vele afwijkingen van de<br />
zogenaamde “gemiddelde trialpatiënt”. Ook van belang is waardering van verschillen<br />
in context tussen de trials en de voorliggende praktijksituatie. Dat is wát een arts<br />
moet wegen, maar hóe moet hij dat doen? Het instrumentarium van de arts hiervoor<br />
is divers en omvat kennis van de fysiologie, klinische expertise in zijn algemeenheid<br />
en in het bijzonder eerdere ervaringen met gelijkende patiënten of zelfs met dezelfde<br />
patiënt. Misschien is zelfs een beroep op zoiets vaags als intuïtie eigenlijk volstrekt<br />
legitiem. 13 Met andere woorden: het is een veelzijdige optelsom van niet-cijfermatige,<br />
maar uiterst reële overwegingen. Is het daarmee magie? Nee. Is het een spirituele vorm<br />
van kunst, “the art of medicine”? Nee. Het klinisch redeneren onderscheidt vooral<br />
zich van het epidemiologisch <strong>bewijs</strong> door het multidimensionale karakter ervan.<br />
Het voorliggende patiëntprobleem wordt doorgaans in epidemiologische context<br />
vertaald in een enkele vraag, die beantwoord wordt met “ja” of “nee” of, beter gezegd,<br />
met een “ja/nee-verhouding” die als uitkomst van een onderzoek of meta-analyse<br />
de doorslag geeft. Maar de extrapolatie van de uitkomst van deze unidimensionele<br />
vraag naar het individu is intrinsiek múltidimensionaal. Moet een patiënt ouder<br />
dan 60 jaar met boezemfibrilleren antistolling krijgen? Ja, is het antwoord op deze<br />
unidimensionale vraag. En deze 80-jarige man dan, die al 4 jaar boezemfibrilleren heeft<br />
zonder complicaties, die af en toe alcohol <strong>dr</strong>inkt en vaak antibiotica slikt vanwege<br />
chronische bronchitis, die al aspirine gebruikt en die 10 jaar geleden een kleine<br />
hersenbloeding heeft gehad, moet die antistolling krijgen? Voor unidimensionale<br />
vragen kun je makkelijk onderzoek doen, risicoreducties en p-waardes uitrekenen,<br />
je kunt er veel artikelen over schrijven, waardoor je CV groeit, je aanzien stijgt en je<br />
misschien ooit wel hoogleraar kunt worden. Maar het multidimensionale klinisch<br />
redeneren leent zich moeilijk voor wetenschappelijk onderzoek. Type A klinisch
edeneren in een gerandomiseerde trial vergelijken met type B klinisch redeneren<br />
is onmogelijk. Het schaarse onderzoek dat hiernaar bestaat heeft dan ook een laag<br />
aanzien, want het wordt als “soft” en “invalide” beschouwd. Maar de echte vraag is<br />
of deze kennis over<strong>dr</strong>aagbaar is, anders dan via tijdschriften. Het antwoord is mijns<br />
inziens een ondubbelzinnig “ja”, en wel door ervaren klinici, dokters met het hart op<br />
de goede plaats, een gezond stel hersens en tenminste een bepaald minimumniveau<br />
van communicatieve, of eigenlijk meer expressieve vaardigheden.<br />
Epidemiologische <strong>bewijs</strong>: belang voor de praktijk.<br />
Een tijd gaat voorbij en haar conclusies bezinken. ‘Klinisch epidemiologisch onderzoek<br />
heeft ons veel nuttige kennis opgeleverd, maar epidemiologisch <strong>bewijs</strong> is vaak lang<br />
niet zo sterk als men denkt. Dit type <strong>bewijs</strong> bestaat alleen voor groepen patiënten<br />
en past dus prima in richtlijnen, waarin gemiddeld beleid wordt geadviseerd voor<br />
de gemiddelde patiënt. Maar datzelfde <strong>bewijs</strong> heeft een andere betekenis in de<br />
spreekkamer, omdat nooit te bewijzen valt dat het van toepassing is op de patiënt<br />
die tegenover mij zit. Zo moet epidemiologisch <strong>bewijs</strong> meetellen bij handelen bij<br />
individuele patiënten, maar daarbij moet fysiologische kennis, kunde en gezond<br />
verstand eveneens altijd een rol spelen. Zo beschouwd is er helemaal geen sprake van<br />
strijd tussen epidemiologie en fysiologie, of tussen theorie en empirie, maar vullen<br />
ze elkaar juist aan. 14 Daarmee wordt het rücksichtlos toepassen van epidemiologisch<br />
<strong>bewijs</strong> op individuele patiënten een onverstandige, ja zelfs gevaarlijke onderneming.<br />
Voor deze blijk van intellectueel onvermogen zou geen excuus mogen bestaan, ook<br />
niet het excuus “dat de wind nu eenmaal zo waait in de geneeskunde”. Anderzijds<br />
17
18<br />
zou het afwijken van epidemiologisch <strong>bewijs</strong>, althans de altijd aanwezige bereidheid<br />
om dit te doen, juist moeten worden gezien als een teken van deskundigheid. Zo<br />
beschouwd is Dr House inderdaad misschien wel het neusje van de zalm. Vanuit<br />
het oogpunt van morele aansprakelijkheid is het zonder verder nadenken toepassen<br />
van epidemiologisch <strong>bewijs</strong> (of zelfs van algemene aanbevelingen uit een richtlijn)<br />
op een individuele patiënt niet minder afkeurenswaardig dan het beargumenteerd<br />
afwijken van epidemiologsich <strong>bewijs</strong> (of van de richtlijn). Natuurlijk kan men het<br />
hiermee oneens zijn, of men kan aan morele aansprakelijkheid minder belang hechten<br />
dan aan juridische aansprakelijkheid. Maar de stap van morele naar juridische<br />
aansprakelijkheid is niet zo groot als soms lijkt. Wees dus gewaarschuwd.<br />
Epidemiologisch <strong>bewijs</strong> vormt dus een raamwerk voor klinisch handelen. Dient het<br />
ook andere doelen? Jazeker. Het is belangrijk voor toelating van geneesmiddelen<br />
tot de markt, waarbij veiligheid en gemiddelde effectiviteit belangrijke criteria zijn.<br />
Maar epidemiologisch <strong>bewijs</strong> wordt misbruikt als het het enige criterium voor<br />
klinisch handelen wordt, of als het gebruikt wordt als voorwaarde voor bijvoorbeeld<br />
vergoeding van individuele zorg. Heel gevaarlijk is het ontbreken van epidemiologisch<br />
<strong>bewijs</strong> te misbruiken als legitimatie om niet te handelen bij een individuele patiënt, of<br />
geen afspraken te maken over bijvoorbeeld richtlijnen. 15<br />
A. Jos is tevreden over deze conclusies, maar vraagt zich af, een beetje laat misschien,<br />
of dit allemaal geen open deuren zijn en of niet iedereen al op deze wijze denkt en<br />
handelt. Zou de internist die haar kapittelde tijdens de ochtendover<strong>dr</strong>acht er werkelijk<br />
anders over denken? Misschien niet, maar de in<strong>dr</strong>uk werd gewekt dat epidemiologisch<br />
<strong>bewijs</strong> een voorwaarde is voor klinisch handelen. Anderzijds kent zij de internist in<br />
kwestie als een verstandig mens en maakt hij geen brokken in de spreekkamer. Zou<br />
Figuur 9<br />
Afwezigheid van <strong>bewijs</strong><br />
(gebruikt met toestemming<br />
van de tekenaar: <strong>prof</strong>.<strong>dr</strong>.<br />
J.W.M. van der Meer)
zijn opmerking dan te maken hebben met de context van de patiëntenbespreking?<br />
De zogenaamde “zachte” kant van klinische besluitvorming, bestaande uit fysiologie,<br />
expertise en zelfs intuïtie, is veel lastiger communiceerbaar dan de “harde” kant. 16 Het<br />
spreken over epidemiologische waarschijnlijkheden, het over en weer smijten met<br />
risicoreducties, numbers-needed-to-treat en ander epidemiologisch lingo is relatief<br />
eenvoudig, maar het is een ontkenning van wat er zich in werkelijkheid, als het goed<br />
is tenminste, in onze spreekkamers afspeelt. De epidemiologie-soep wordt daarom<br />
wellicht in allerlei overlegsituaties tussen artsen veel heter opgediend dan zij in de<br />
spreekkamer geconsumeerd wordt. Al zou dat begrijpelijk zijn, we moeten er toch<br />
weerstand tegen bieden, anders ontstaat er een dubbele moraal in de geneeskunde.<br />
We belijden dan tegenover elkaar een ander soort geneeskunde dan we bij patiënten<br />
be<strong>dr</strong>ijven. Bij patiëntenbesprekingen, maar feitelijk ook bij opleiding, nascholingen<br />
en symposia moeten wij elkaar daarom spreken over de niet-epidemiologische<br />
argumenten voor een bepaald beleid. Daarmee geven wij ook een goed voorbeeld<br />
aan jonge artsen en studenten. 17 Hierbij moeten wij consideratie met elkaar hebben<br />
ingeval het niet goed lukt deze argumenten te expliciteren, want dat is nu eenmaal<br />
moeilijk.<br />
A. Jos dacht terug aan de casus waarmee haar zoektocht begon. Wat zij deed is nooit<br />
epidemiologisch onderzocht. Waar zulk <strong>bewijs</strong> afwezig is, leggen klinische expertise en<br />
kennis van de pathofysiologie automatisch alle gewicht in de schaal bij het nemen van<br />
een beslissing. Zij snapt ook wel dat in gebieden met zeer veel epidemiologisch <strong>bewijs</strong>,<br />
het aantal vrijheidsgraden relatief beperkter is. 18 Maar ook dan mag epidemiologisch<br />
<strong>bewijs</strong> bij de benadering van een individuele patiënt andere overwegingen nooit<br />
ondergeschikt maken.<br />
19
20<br />
Het evidence-beest; van raamwerk naar traliewerk<br />
Al met al heeft A. Jos toch het gevoel dat het gevaar van een exclusieve na<strong>dr</strong>uk op<br />
epidemiologisch <strong>bewijs</strong> in de dagelijkse klinische geneeskunde nog wel te beteugelen<br />
valt. Dat heeft te maken met het heimelijke besef van artsen dat ze in werkelijkheid<br />
weldegelijk als “dokter” werken en niet als pionnen van het “evidence-beest”. Ook<br />
heeft het veel te maken met gewenning. Naar schatting 75% van ons klinisch handelen<br />
heeft nooit aan epidemiologisch onderzoek blootgestaan. Ten aanzien van veelgebruikte<br />
behandelingen is de situatie nauwelijks anders. U ziet dat in figuur 10. Van<br />
de veel-gebruikte behandelingen is bijna de helft nooit epidemiologisch onderzocht.<br />
Van slechts 13% is gemiddelde effectiviteit bewezen en van een groot deel van<br />
de rest weten we het niet zeker. Ongeveer 10% van wat we vaak doen is bewezen<br />
gemiddeld ineffectief of zelfs schadelijk (figuur 10). 19 We zijn er dus mee vertrouwd<br />
om beslissingen te nemen die niet door epidemiologisch <strong>bewijs</strong> gesteund worden. Het<br />
lijkt ook alsof artsen zich daar gaandeweg meer bewust van worden en dat daarmee<br />
de na<strong>dr</strong>uk op epidemiologisch <strong>bewijs</strong> als enige rechtvaardiging voor klinisch handelen<br />
aan het afnemen is. 20<br />
Heel anders ligt het in de politiek en bij de zorgverzekeraars. De minister van<br />
Volksgezondheid heeft in een brief aan de Tweede Kamer in januari 2008 laten weten<br />
dat wat hem betreft “evidence-based standaarden” de basis worden van zorgcontracten<br />
tussen aanbieders en verzekeraars. Met andere woorden: epidemiologisch <strong>bewijs</strong> voor<br />
een bepaalde behandeling kan een vergoedingscriterium worden. 21 Het College voor<br />
Zorgverzekering heeft hem daarin met een recent rapport gevolgd. In dit rapport stelt<br />
men voor de richtlijn Cardiovasculair Risicomanagement te vertalen in vergoedingscriteria<br />
voor cholesterolverlagende therapie. 22 ‘Beginnersfout’, gromt A. Jos. ‘De richtlijn gaat
over de gemiddelde patiënt. Vergoedingscriteria daarentegen gaan niet over de<br />
behandeling van de gemiddelde patiënt, maar over de réchten van iedere individuele<br />
patiënt. Vergoedingscriteria hebben dus betrekking op wat er telkens opnieuw uit het<br />
samenspel van epidemiologisch <strong>bewijs</strong>, klinische expertise en voorkeur van de patiënt<br />
voortkomt.’ Epidemiologisch <strong>bewijs</strong> en de daaruit voortvloeiende richtlijnen zijn<br />
bedoeld als raamwerk voor klinisch handelen. Het is nooit de bedoeling geweest dat<br />
partijen met een financieel-economisch belang dit raamwerk misbruiken door er tralies<br />
in te plaatsen.<br />
‘Misschien kunnen we de term Evidence Based Medicine maar beter afschaffen’, denkt<br />
A. Jos. ‘In verkeerde handen leidt deze term tot veel ellende’. 23 Evidence Informed<br />
Practice zou een alternatief kunnen zijn’. 24 Dan pakt A. Jos de publicaties van David<br />
Sackett, zeg maar de ‘godfather’ van Evidence Based Medicine, er nog eens bij. Wat<br />
blijkt? In het begin werd inderdaad erg veel na<strong>dr</strong>uk gelegd op epidemiologisch<br />
<strong>bewijs</strong>. Al snel daarna werd de voorkeur van de patiënt geïncorporeerd en later in de<br />
negentiger jaren werd de rol van klinische expertise van de arts ook steeds explicieter<br />
benoemd. Sackett’s gemoderniseerde definitie van Evidence Based Medicine luidt nu:<br />
‘Integratie van individuele klinische expertise met het best beschikbare externe <strong>bewijs</strong><br />
uit wetenschappelijk onderzoek’, en dat onderzoek hoeft volgens Sackett helemaal niet<br />
epidemiologisch te zijn, maar mag ook uit de fysiologie of de basale wetenschappen<br />
komen. 25 Met gemengde gevoelens neemt A. Jos de tekst in zich op. ‘De definitie<br />
van Evidence Based Medicine is aan de hand van haar uitvinders en pleitbezorgers<br />
in gunstige zin geëvolueerd en is inderdaad, volgens deze definitie dan, het beste<br />
wat we als dokters te bieden hebben. 26 Maar zoals Sackett dit nu formuleert, zo is<br />
hedentendage de gemiddelde interpretatie van Evidence Based Medicine helaas niet,<br />
Figuur 10<br />
De epidemiologische onderbouwing<br />
van veel voorkomende therapeutische<br />
handelingen<br />
(http://clinicalevidence.bmj.com/<br />
ceweb/about/knowledge.jsp)<br />
21
22<br />
noch bij critici, noch bij adepten. De na<strong>dr</strong>uk ligt te veel bij het epidemiologische <strong>bewijs</strong>.<br />
Een beetje teleurgesteld is A. Jos ook. Sackett’s gemoderniseerde definitie toont veel<br />
overeenkomsten met wat zij de afgelopen periode, na die ene ochtendover<strong>dr</strong>acht, bij<br />
elkaar heeft gepeinsd. 27 ‘Weer het wiel niet uitgevonden’, mompelt zij, ‘maar onderweg<br />
wel een hoop geleerd’. 28<br />
Het is juni 2008. A. Jos is bijna klaar met haar opleiding tot internist. Gedachtenloos<br />
fietst zij door een ontwakende stad naar het VUmc voor de zoveelste ochtendover<strong>dr</strong>acht.<br />
Wind mee. De nachtdienst bestond uit een jonge AIOS, 29 jaar. Zij had iets, het doet<br />
er eigenlijk niet meer toe wat, gedaan op grond van haar gezond verstand en alleen op<br />
grond daarvan. ‘Daar is geen <strong>bewijs</strong> voor’, klinkt het luid. A. Jos aarzelt geen moment,<br />
buigt zich naar de microfoon voor haar en zegt: ‘<strong>Hoezo</strong>, <strong>bewijs</strong>?’.<br />
Dames en heren,<br />
Het VU Medisch Centrum is een fantastisch ziekenhuis met fantastische mensen.<br />
Ik geef eerlijk toe mij heel af en toe te ergeren aan bijvoorbeeld de neiging tot<br />
verkaveling van patiëntenzorg en koninkrijkjesge<strong>dr</strong>ag, maar de goede wil overheerst<br />
met het nodige gemak. De afdeling Interne Geneeskunde zal de komende jaren<br />
mijn werkterrein zijn. In de eerste plaats voel ik mij internist en patiëntenzorg<br />
verdient het daarom als eerste genoemd te worden bij wat ik komende jaren wil<br />
blijven doen. Daarnaast hoop ik het wetenschappelijk onderzoek in de Vasculaire<br />
Geneeskunde verder te ontwikkelen, zowel door persoonlijke activiteiten, maar<br />
zeker ook door anderen in staat te stellen hierin succesvol te zijn. Onderwijs aan
studenten zal kwantitatief misschien geen groot aandeel hebben, maar kan enorme<br />
voldoening geven en zal daarom altijd deel uitmaken van mijn werk. Als de baas het<br />
goed vindt zal ik mij ook buiten het VUmc blijven inzetten, bijvoorbeeld voor zaken<br />
die de Interne-Geneeskunde-opleiding betreffen, of voor bijvoorbeeld richtlijnen<br />
voor hart- en vaatziekten. Zo nu en dan zal ik mij blijven mengen in het publieke debat.<br />
Het in teamverband opleiden van toekomstige internisten is een van de leukste<br />
aspecten van dit werk. Ik zal mij daar voor inzetten, of het nu gaat om de basisopleiding<br />
of de voortgezette opleiding in het aandachtsgebied Vasculaire Geneeskunde. In de<br />
opleiding van AIOS wil ik iets overbrengen van wat ik in mijn lezing heb bena<strong>dr</strong>ukt.<br />
Beste AIOS: jullie studeren hard om kennis tot je te nemen. Dat is prima, maar<br />
geneeskunde is intrinsiek een onzekere wetenschap. Van alle foute diagnoses die<br />
jullie zullen gaan stellen zal slechts 4% het gevolg zijn van te weinig feitenkennis.<br />
Dat betekent niet dat jullie niets hoeven te weten, integendeel. Maar realiseer je<br />
dat zeer veel fouten het gevolg zijn van tekort aan aandacht, verkeerde aandacht of<br />
onjuiste denkstappen. 29 Denk daarom eens na over zaken als patroonherkenning,<br />
of confirmatiebias. Een andere bron van fouten is miscommunicatie met soms<br />
verscheidene consulenten van andere disciplines, die ter hulp zijn geroepen om in<br />
ieder geval op kennisgebied alles aan het bed te krijgen wat er maar beschikbaar is.<br />
De extra kennis die je mobiliseert weegt vaak niet op tegen de miscommunicatie die<br />
je introduceert.<br />
Met kennis van de epidemiologie alleen ga je het niet redden. Denk kritisch na over<br />
hoe je patiënten benadert, hoe je een diagnose stelt en waarom je voor een bepaalde<br />
behandeling kiest. Koester en ontwikkel subjectiviteit en intuïtie: het zijn geen zonden,<br />
maar deugden. 30<br />
Figuur 11<br />
Raamwerk – traliewerk<br />
(illustrator: E. Timmermans,<br />
www.eriktimmermans.com )<br />
23
24<br />
Ik dank het college van Bestuur van de Vrije Universiteit, de Raad van Bestuur van<br />
het VUmc en collega Sven Danner voor het uitgesproken vertrouwen. Ik dank Mark<br />
Kramer voor zijn belangrijke rol als nieuw afdelingshoofd en opleider.<br />
Zo velen ben ik dank verschuldigd. Na ampel beraad heb ik besloten de namen niet<br />
te noemen: het zijn er te veel en ik zou mensen vergeten. Bovendien ga ik over mijn<br />
tijd heen. Maar weet, vrienden op de afdeling, collega’s van andere afdelingen, mensen<br />
van de research en van het onderwijsinstituut, dat jullie door mij zeer gewaardeerd<br />
worden, al uit ik dat soms niet zo duidelijk en soms zelfs helemaal niet.<br />
Toch maak ik een uitzondering voor <strong>dr</strong>ie mensen. Zij hebben aan mijn <strong>prof</strong>essionele<br />
ontwikkeling de grootste bij<strong>dr</strong>age geleverd. Ik noem ze in omgekeerde chronologische<br />
volgorde. Als eerste Abel Thijs, collega-internist op de afdeling Interne Geneeskunde.<br />
De tweede persoon die ik wil noemen is Coen Stehouwer, voorheen hoogleraar Interne<br />
Geneeskunde aan het VUmc, thans hoogleraar en opleider Interne Geneeskunde in<br />
het AZM te Maastricht. Tenslotte spreek ik mijn grote dank uit aan Bob Silberbusch,<br />
mijn opleider in het Onze Lieve Vrouwe Gasthuis.<br />
Ik heb gezegd.
Noten<br />
1 Claude Bernard, Introduction à la médecine<br />
expérimentale. Parijs, Garnier-Flamaron, 1966<br />
2 Teleologie: benadering waarin het doel (telos)<br />
centraal wordt geplaatst. Men probeert bijvoorbeeld<br />
fysiologische verschijnselen of mechanismen<br />
te begrijpen door zich af te vragen welk doel met<br />
dit mechanisme gediend is.<br />
3 Er is een sterke neiging een hiërarchie aan te<br />
brengen in klinisch epidemiologisch onderzoek,<br />
waarbij de meta-analyse en de gerandomiseerde<br />
klinische trial bovenaan staan, gevolgd door observationeel<br />
onderzoek en onderaan de ranglijst<br />
de casusbeschrijving. Deze hiërarchie moge dan<br />
wel de mate van reproduceerbaarheid weerspiegelen,<br />
in termen van het vermogen vernieuwingen<br />
te introduceren is de volgorde eerder andersom.<br />
Zie o.a. J.P Vandenbroucke, Niveaus van <strong>bewijs</strong>kracht<br />
schieten tekort, Nederlands Tijdschrift voor<br />
Geneeskunde 2006; 150: 2485 en, van dezelfde<br />
auteur, Observational research, randomised trials,<br />
and the two views of medical science, PLoS Medicine<br />
2008; 5: 339-343.<br />
4 Zie ook (1) J.P. Vandenbroucke, Clinical investigation<br />
in the 20 th century: the ascendancy of numerical<br />
reasoning, Lancet 1998; 352: SII-12-16, (2) J. van<br />
der Meer, Ziekten bestaan niet, afscheidsrede<br />
bij zijn aftreden als hoogleraar in de Inwendige<br />
Geneeskunde aan de faculteit der Geneeskunde<br />
van de Vrije Universiteit te Amsterdam, 8 september<br />
2000 en (3) Raad voor de Volksgezondheid<br />
en Zorg, Passend <strong>bewijs</strong>. Ethische vragen bij het<br />
gebruik van evidence in het zorgbeleid, Signalering<br />
ethiek en gezondheid 2007/4. Den Haag: Centrum<br />
voor Ethiek en Gezondheid, 2007.<br />
5 “Waar” moet hier worden gelezen als ‘reproduceerbaar’.<br />
Innovatief onderzoek is overigens vaak<br />
intrinsiek weinig reproduceerbaar, omdat het, in<br />
tegenstelling tot grote gerandomiseerde trials,<br />
hypotheses met een lage prior-kans onderzoekt.<br />
De onderzoeksmethoden met de laagste reproduceerbaarheid<br />
scoren daardoor juist vaak het<br />
hoogst op de schaal van innovatief vermogen.<br />
Zie ook de referenties in noot 3.<br />
6 John P.A. Ioannidis: Why most research findings are<br />
false. PloS Medicine 2005; 2: 696-701.<br />
7 Een pessimistische kijk op de juistheid van de uitkomsten<br />
van meta-analyses wordt ook verwoord<br />
door C.D. Naylor in Meta-analysis and the metaepidemiology<br />
of clinical research, British Medical<br />
Journal 1997; 315: 617-619<br />
8 Zie o.a. P.M. Rothwell et al., From Subgroups to<br />
individuals: general principles and the example of<br />
carotid endarterectomy, The Lancet 2005; 365:<br />
256-265. Een van de problemen die hij benoemd<br />
is het unidimensionale karakter van subgroepen.<br />
Om een behandeleffect te schatten voor een<br />
patiënt die op bijvoorbeeld 5 dimensies tot een<br />
subgroep kan worden gerekend (leeftijd, geslacht,<br />
en bijvoorbeeld een <strong>dr</strong>ietal specifieke ziektekarakteristieken)<br />
zou een trialpopulatie van 200.000<br />
nodig zijn. Rothwell bespreekt in dit artikel ook<br />
een andere wijze waarop epidemiologische<br />
onderzoeksgegevens kunnen worden gebruikt<br />
om een individueel behandeleffect statistisch<br />
te schatten, namelijk het maken van risicopredictiemodellen.<br />
Hierbij worden patiënten op<br />
basis van een aantal kenmerken (meestal 5 tot<br />
10) ingedeeld in categorieën, waarin vervolgens<br />
de verwachte (absolute) behandeleffecten zo<br />
goed mogelijk worden geschat op basis van de<br />
trialgegevens. Deze benadering wordt beschouwd<br />
als een uiterste numerieke manier waarop klinisch<br />
epidemiologisch onderzoek naar een individuele<br />
patiënt kan worden geëxtrapoleerd en komt<br />
overeen met wat in richtlijnenontwikkeling de<br />
“expliciete methode” wordt genoemd (zie ook:<br />
J.G.P Tijssen et al., Landelijke richtlijnen voor het<br />
klinisch handelen, een methodologische beschouwing,<br />
Nederlands Tijdschrift voor Geneeskunde<br />
1998; 142: 2078-2082).<br />
9 Zie P.M. Rothwell, External validity of randomised<br />
trials: to whom do the results of this trial apply?,<br />
Lancet 2005; 365: 82-93. Rothwell schetst een scenario<br />
waarin van alle mensen met een bepaalde<br />
aandoening die in een omschreven gebied wonen<br />
in het gunstigste geval 42%, maar in het ongunstigste<br />
geval slechts 0.001% in een klinische trial<br />
voor diezelfde aandoening wordt geïncludeerd.<br />
De redenen voor exclusie betreffen vaak geslacht<br />
en leeftijd (vrouwen en ouderen worden vaak<br />
geëxcludeerd), maar ook zeer veelvoorkomende<br />
medische omstandigheden zijn vaak een exclusiecriterium<br />
(zie H.G.C. van Spall et al., Eligibility<br />
criteria of randomised controlled trials published<br />
in high-impact general medical journals, Journal<br />
of the American Medical Association 2007; 297:<br />
1233-1240). Hoe dit fenomeen zijn weerslag kan<br />
25
26<br />
vinden in de dagelijkse praktijk is o.a. te lezen in<br />
M.M. Levi et al., Bleeding in patients receiving vitamin<br />
K antagonists who would have been excluded<br />
from trials on which the indication for anticoagulation<br />
was based, Blood 2008; 111: 4471-4476. In dit<br />
artikel wordt beschreven dat de behandeling met<br />
bloedverdunners veel minder gunstig uitpakt bij<br />
personen die vanwege exclusiecriteria buiten de<br />
trials zouden zijn gelaten.<br />
10 Bovendien zouden in gerandomiseerde klinische<br />
trials naar de effectiviteit van cholesterolverlagers<br />
bij deze andere categorieen onderzoek vereisen<br />
waarbij mensen met een hoog risico op hart- en<br />
vaatziekten blootgesteld kunnen worden aan<br />
een nepmedicijn, een placebo. Gegeven de hoge<br />
voorafkans op een gunstig effect van cholesterolverlagende<br />
therapie zou dit zelfs als moreel<br />
verwerpelijk kunnen worden beschouwd.<br />
11 “Heuristiek” betekent “leer van het vinden”. Zie<br />
ook C.J. McDonald, Medical heuristics: the silent<br />
adjucators of medical practice, Annals of Internal<br />
Medicine 1996; 124: 56-62.<br />
12 Een pessimistische versie van deze gedachte werd<br />
al in 1952 verwoord door Austin Bradford Hill:<br />
‘We cannot necessarily, perhaps even rarely, pass<br />
from the overall result of a clinical trial to stating<br />
exactly what effect the treatment will have on a<br />
particular patient. But there is, surely, no way and<br />
no method of deciding that’. A.B. Hill, The Clinical<br />
Trial, New England Journal of Medicine 1952; 247:<br />
113-119<br />
13 Zie ook S.J. Tanenbaum, What physicians know,<br />
New England Journal of Medicine 1993; 329: 1268-<br />
1269, waarin zij zegt: ‘Physicians should assert<br />
the legitimacy -indeed the necessity- of reasoning<br />
about individual patients on the basis of personal<br />
experience and theories of cause and effect as well<br />
as on the basis of statistical knowledge’. Het probabilistische<br />
redeneren wordt door Tanenbaum als<br />
hooguit complementair beschouwd, zeker niet als<br />
superieur. Over het bezwaar dat deze zienswijze<br />
teveel subjectiviteit in de geneeskunde introduceert<br />
zegt zij: ‘The alternative view of subjectivity is that<br />
physicians rely on “personal knowledge”. Their<br />
well-documented regard for personal experience<br />
reflects the role of the senses as a physician accumulates<br />
medical knowledge. These experimental<br />
data are organised by an equally subjective process<br />
of unspoken inference and intuition. The process<br />
is neither arbitrary nor mystical. In essence, it<br />
involves the making of clinical sense. It is more like<br />
deliberation than calculation … The clinical science<br />
of outcomes research, as informative as it is, cannot<br />
substitute for either clinical expertise or clinical<br />
sense. Even the best clinical science is less than all of<br />
what physicians know.’<br />
Klinische handelingen bij een individuele patiënt<br />
worden door Alvan Feinstein in feite als experimenten<br />
beschouwd, waarbij het referentiekader<br />
wordt gevormd door uitkomsten van eerdere<br />
klinische handelingen bij dezelfde patiënt of door<br />
ervaringen met soortgelijke patiënten. Zie A.R.<br />
Feinstein, Clinical judgement revisited: the distraction<br />
of quantitative models, Annals of Internal Medicine<br />
1994; 120: 799-805.<br />
14 Zie ook J.P. Vandenbroucke, Clinical investigation<br />
in the 20 th century: the ascendancy of numerical<br />
reasoning, Lancet 1998; 352: SII-12-16, waarin<br />
hij zegt: ‘...at the bedside, scientific explanations<br />
in medicine are an integration of numerical<br />
(statistical and epidemiological – i.e. probabilistic<br />
and empirical) and mechanistic (deterministic<br />
and explanatory) reasoning. The one cannot exist<br />
without the other’. In Evidence based medicine<br />
and ‘médecine d’observation’ (Journal of Clinical<br />
Epidemiology 1996; 49: 1335-1338) zegt hij: ‘...we<br />
(clinical epidemiologists, red) should not claim any<br />
superiority. Rather, we offer a complementary type<br />
of knowledge, as colleagues and equals in a common<br />
purpose with basic scientists and practicing<br />
physicians.’<br />
15 Richtlijnen dienen een samenvatting te zijn van<br />
alle bestaande kennis binnen een afgegrensd klinisch<br />
domein. Als er veel pathofysiologische kennis<br />
is, of kennis vanuit bijvoorbeeld casuïstische<br />
literatuur, maar geen kennis uit gerandomiseerde<br />
klinische trials en meta-analyses, dan wordt<br />
menigmaal beweerd dat over het betreffende<br />
onderwerp geen richtlijn mag worden gemaakt.<br />
Mijns inziens is het juist de taak van deskundigen<br />
om de leemtes tussen het klinisch epidemiologisch<br />
<strong>bewijs</strong> op te vullen met de best beschikbare<br />
kennis uit andere bronnen (pathofysiologie,<br />
klinische expertise, etc) om zo tot aanbevelingen<br />
te komen in afwachting van nader onderzoek. De<br />
vrijheidsgraden rondom de aanbevelingen dienen<br />
in zulke richtlijnen uiteraard expliciet benoemd te<br />
worden, maar dit geldt evenzeer voor richtlijnen<br />
die wél op grootschalig klinisch epidemiologisch<br />
onderzoek zijn gebaseerd. Dit betekent niet
dat voor alle klinische handelingen richtlijnen<br />
gemaakt kúnnen worden. Vooral handelingen<br />
waarbij vrijwel alleen klinische expertise een rol<br />
speelt zijn ongeschikt voor richtlijnen, die in deze<br />
situaties zelfs schadelijk kunnen zijn, omdat ze<br />
leiden tot “automatische-pilootge<strong>dr</strong>ag” in een<br />
klinisch domein waarin alleen met “handmatige<br />
besturing” ervaring bestaat.<br />
Tenslotte dient ervoor gewaarschuwd te worden<br />
dat in richtlijnen aan elementaire klinische handelingen,<br />
zoals het afnemen van een anamnese<br />
en het verrichten van oriënterend lichamelijk<br />
onderzoek, in termen van <strong>bewijs</strong>last niet dezelfde<br />
eisen worden gesteld als aan aanvullende diagnostiek<br />
of therapeutische interventies. Zo deelde een<br />
huisarts en lid van een richtlijnencommissie mij<br />
ooit eens mee dat hij bij een patiënt met longembolie<br />
geen lichamelijk onderzoek verrichtte<br />
omdat “daar geen evidence voor bestaat”. Anamnese<br />
en lichamelijk onderzoek zijn vaak geen<br />
onderdeel van wat in klinisch epidemiologisch<br />
onderzoek feitelijk onderzocht wordt, maar zijn<br />
bij vrijwel alle patiënten reeds verricht vóórdat<br />
ze in aanmerkingen kwamen voor deelname aan<br />
het onderzoek. Het weglaten ervan met louter<br />
een beroep op “geen <strong>bewijs</strong>” is welbeschouwd een<br />
kunstfout.<br />
16 R.P. Epstein formuleert het in Mindful practice<br />
(Journal of the American Medical Association<br />
1999; 282: 833-839) als volgt: ‘Often, excellent<br />
clinical physicians are less able to articulate what<br />
they do … nor do they appreciate all of the biases<br />
in their own reasoning process’.<br />
17 Het communicatief vullen van de ruimtes tussen<br />
epidemiologisch <strong>bewijs</strong> is tegenover patiënten<br />
overigens evenmin eenvoudig. Artsen blijken<br />
zich hierin ook van geheel verschillende stijlen te<br />
bedienen. Zie o.a. F. Griffiths et al., The nature of<br />
medical evidence and its inherent uncertainty for<br />
the clinical consultation: qualitative study, British<br />
Medical Journal 2005; 330: 511-515.<br />
18 Toch valt er in domeinen met veel klinischepidemiologisch<br />
<strong>bewijs</strong> nog veel eer te behalen<br />
voor pathofysiologisch redeneren bij het<br />
be handelen van patiënten. Een goed voorbeeld<br />
betreft de behandeling van hoge bloed<strong>dr</strong>uk; daar<br />
bestaat een enorme hoeveelheid epidemiologisch<br />
onderzoek naar. Dit heeft veel kennis over de<br />
effectiviteit van verschillende geneesmiddelen<br />
opgeleverd. De Engelse internist Morris Brown<br />
heeft het veld recent toch nog een grote dienst<br />
weten te bewijzen door op grond van pathofysiologische<br />
overwegingen een behandelschema op<br />
stellen waarin bepaalde soorten geneesmiddelen<br />
worden geadviseerd aan bepaalde patiëntencategorien,<br />
welke worden onderscheiden op basis van<br />
leeftijd en ethniciteit (M Brown, Matching the right<br />
<strong>dr</strong>ug to the right patiënt in essential hypertension,<br />
Heart 2001; 86: 113-120). Dit betreft dus een<br />
pathofysiologische aanvulling op epidemiologisch<br />
<strong>bewijs</strong> op ‘mesoniveau’: niet individuele patiëntkarakteristieken,<br />
maar pathofysiologische<br />
groepskarakteristieken vullen het epidemiologische<br />
<strong>bewijs</strong> aan.<br />
19 Hierbij wordt nog voorbij gegaan aan het feit dat<br />
klinisch handelen dat wél aan klinisch epidemiologisch<br />
onderzoek heeft blootgestaan, vaak<br />
onvolledig onderzocht is. Zo zijn bij therapeutisch<br />
onderzoek medicamenten vaak met placebo,<br />
maar niet met elkaar vergeleken, is de optimale<br />
duur van behandeling zelden bestudeerd en is de<br />
mate van ziek zijn waarbij behandeling gestart<br />
moet worden vaak onderbelicht. Zie ook noot 9<br />
voor een opmerking over een andere vorm van<br />
‘incompleetheid’ van epidemiologisch onderzoek:<br />
het bestuderen van slechts een klein, sterk<br />
geselecteerd deel van alle patiënten met een<br />
aandoening.<br />
20 Een deel van het therapeutisch handelen<br />
waarvoor helemaal geen epidemiologisch <strong>bewijs</strong><br />
is zou zich alsnog kunnen lenen voor epidemiologisch<br />
onderzoek, maar de kosten van het maken<br />
van zo’n inhaalslag zouden simpelweg onbetaalbaar<br />
zijn. Tevens speelt een groot deel van ons<br />
klinisch handelen zich af in patiëntengroepen en<br />
zorgdomeinen waarin epidemiologisch <strong>bewijs</strong>, om<br />
technische of om ethische redenen, helemaal niet<br />
verkregen kán worden. Zie ook: Raad voor de<br />
Volksgezondheid en Zorg, Passend <strong>bewijs</strong>. Ethische<br />
vragen bij het gebruik van evidence in het zorg beleid,<br />
Signalering Ethiek en Gezondheid 2007/4. Den<br />
Haag: Centrum voor Ethiek en Gezondheid, 2007.<br />
21 Brief Een Dynamische Eerstelijnszorg van A. Klink<br />
aan de tweede kamer; 25 januari 2008<br />
22 College voor Zorgverzekeringen. Rapport<br />
pakketadvies 2008; aanpassing nadere voorwaarden<br />
cholesterolverlagende medicatie. Diemen:<br />
College voor Zorgverzekeringen, 2008.<br />
23 Een recent rapport van het Centrum voor Ethiek<br />
en Gezondheid, onderdeel van de Raad voor<br />
27
de Volksgezondheid en Zorg, kwam tot dezelfde<br />
overweging. Raad voor de Volksgezondheid en<br />
Zorg. Passend <strong>bewijs</strong>. Ethische vragen bij het gebruik<br />
van evidence in het zorgbeleid. Signalering ethiek<br />
en gezondheid 2007/4. Den Haag: Centrum voor<br />
Ethiek en Gezondheid, 2007.<br />
24 P Glasziou, Evidence Based Medicine: does it make a<br />
difference? British Medical Journal 2005;330:92<br />
25 Voor de evolutie van het begrip Evidence Based<br />
Medicine: zie o.a. (1) Evidence Based Medicine<br />
Working Group, Evidence Based Medicine: a new<br />
approach to teaching the practice of medicine,<br />
Journal of the American Medical Association<br />
1992;268:2420-2425, (2) D.L. Sackett et al., Evidence<br />
Based Medicine: what it is and what it isn’t. British<br />
Medical Journal 1996;312:71-72 en (3) R.B. Haynes<br />
et al., Physicians’ and patients’ choices in evidence<br />
based practice, British Medical Journal 2002;324:1350.<br />
Zeer lezenswaardig is Evidence based medicine and<br />
‘médecine d’observation’ van J.P Vandenbroucke<br />
(Journal of Clinical Epidemiology 1996; 49:<br />
1335-1338), waarin hij historische spanningen<br />
tussen theorie en empirie in de geneeskunde<br />
beschrijft tot in de oude Griekse en Romeinse tijd.<br />
Ongeveer 170 jaar geleden was er een sterk op<br />
Evidence Based Medicine gelijkende beweging in de<br />
geneeskunde, die vanuit Frankrijk opkwam. Deze<br />
‘Médecine d’observation’ ging ten onder aan<br />
bezwaren van clinici, die o.a. betoogden dat<br />
‘geneeskunde niet over groepen, maar over<br />
individuen ging’; een opmerkelijke overeenkomst<br />
28<br />
met de huidige bezwaren tegen Evidence Based<br />
Medicine. Vandenbroucke bena<strong>dr</strong>ukt dat Evidence<br />
Based Medicine, de huidige evenknie van voor -<br />
noemde beweging, in de basale wetenschappen en<br />
moderne pathofysiologie wel een veel sterkere<br />
partner heeft dan ‘Médecine d’observation’, die<br />
vooral streed tegen bijgeloof en magisch denken.<br />
26 Alvan Feinstein wijst op een belangrijke factor die,<br />
ondanks de vooruitgang in basale wetenschappen,<br />
in diagnostische en therapeutische technologieën<br />
en in wetenschappelijke en besliskundige<br />
methodologie, de vooruitgang van de klinische<br />
geneeskunde heeft afgeremd, namelijk het gebrek<br />
aan vernieuwing van klinische methoden van<br />
gegevensverzameling en van klinische taxonomie.<br />
Zie A.R. Feinstein, Clinical judgement revisited: the<br />
distraction of quantitative models, Annals of Internal<br />
Medicine 1994; 120: 799-805.<br />
27 In D.L. Sackett et al., Evidence Based Medicine:<br />
what it is and what it isn’t, British Medical Journal<br />
1996;312:71-72, schrijft hij bijvoorbeeld: External<br />
evidence can inform, but can never replace, individual<br />
clinical expertise, and it is this expertise that<br />
decides whether the external evidence applies to the<br />
individual patiënt at all and, if so, how it should be<br />
integrated into a clinical decision. Verderop vervolgt<br />
hij: Some fear that evidence based medicine will<br />
be hijacked by purchasers and managers to cut<br />
the costs of health care. This would not only be a<br />
misuse of evidence based medicine but suggests<br />
a fundamental misunderstanding of its financial<br />
consequences. Doctors practising evidence based<br />
medicine (volgens de moderne definitie, red.) will<br />
identify and apply the most efficacious interventions<br />
to maximise the quality and quantity of life for<br />
individual patiënts; this may raise rather than lower<br />
the cost of their care.<br />
28 Zie ook J.P. Vandenbroucke, Clinical investigation<br />
in the 20 th century: the ascendancy of numerical<br />
reasoning, Lancet 1998;352:SII-12-16, waarin hij<br />
schrijft: ‘...the objectivity that we expect to find in<br />
some force outside of medicine (either statistics or<br />
chemistry) looks like the proverbial quest for the holy<br />
grail. The white knights riding out to find the grail do<br />
many a glorious and righteous deed on their way.<br />
In their heart of hearts, they may know that their<br />
aim is forever unattainable. Yet they have <strong>prof</strong>ound<br />
consolidation in all the good that was done while<br />
searching for it’.<br />
29 Zie o.a. J. Groopman, How doctors think, Houghton<br />
Mifflin Publisher, New York 2007.<br />
30 In Observational research and evidence-based<br />
medicine: what should we teach young physicians<br />
(Journal of Clinical Epidemiology 1998; 51:<br />
467-472), formuleert J.P. Vandenbroucke o.a. als uitgangspunten<br />
voor onderwijs aan jonge artsen: (1)<br />
The role of argument and counterargument, of which<br />
methodologic rules are only a part, should be shown<br />
to be equally important in the apraisal of evidence<br />
from all types of study design en (2) We should not<br />
be afraid of teaching subjectivity and uncertainty, as<br />
these are unescapable.