Hoezo, bewijs? prof.dr. Y.M. Smulders - Vitromics

Hoezo, bewijs? 

prof.dr. Y.M. Smulders 

Rede uitgesproken bij de aanvaarding van het ambt van hoogleraar 

Algemene Inwendige Geneeskunde aan de faculteit der Geneeskunde van 

de Vrije Universiteit Amsterdam / VU Medisch Centrum op 11 juni 2008

Hoezo,

ewijs? 

prof.dr. Y.M. Smulders

Mijnheer de Rector, dames en heren 

Ik wil u een verhaal vertellen. 

Er was eens een jonge vrouw, 29 jaar. Zij was AIOS: arts-in-opleiding tot specialist, in 

dit geval internist. Haar voornamen waren Annemarie Josianne en door haar collega’s 

werd ze daarom altijd gekscherend “A. Jos” genoemd. 

Het is oktober 2006, 8 uur in de ochtend, het VU Medisch Centrum. A. Jos, al in 

het derde jaar van haar opleiding, heeft haar nachtdienst er net op zitten. Zij zet 

zich achter een microfoon in de overdrachtsruimte, die langzaam volstroomt met 

co-assistenten, arts-assistenten en internisten. 

Haar eerste patiënt presenteert zij vlekkeloos. Maar bij de tweede gaat het mis. Het 

betreft een oude man die die nacht is opgenomen met een longembolie. Dit betekent 

dat er een bloedstolsel is vastgelopen in de longslagader. De man was kortademig en 

had een snelle hartslag. A. Jos wist dat de standaardbehandeling voor longembolie 

was te starten met onderhuidse injecties met heparine, een bloedverdunner. Zij wist 

echter ook dat het bloedverdunnende effect hiervan pas na enkele uren zou intreden. 

Omdat zij niet gerust was op de klinische toestand van de patiënt, zo vertelde zij, had 

zij de eerste gift van het medicijn per infuus, dus direct in de bloedbaan, toegediend. 

‘Daar is geen enkel bewijs voor’, galmt het door de overdrachtsruimte. A. Jos kijkt 

op. Recht tegenover haar kijkt een van de internisten haar aan. ‘In de klinische trials 

is ook niet begonnen met een intraveneuze dosis’, vervolgt hij. ‘Dat is waar’, zegt zij. 

‘Maar ik dacht…’. ‘Je mag best denken, maar er is geen enkel bewijs en wij doen hier 

aan Evidence Based Medicine’. A. Jos weet niet meer wat ze moet zeggen. Ze worstelt 

zich zo goed en zo kwaad als het gaat door de rest van de overdracht. 

Figuur 1 

Tegenwind 

5

6 

Op de fiets naar huis, er is tegenwind. Zij baalt. Zij kent die onderzoeken ook wel en 

weet dat zij iets heeft gedaan wat in die trials niet werd gedaan. Maar het leek haar 

domweg logisch dat deze patiënt baat zou kunnen hebben bij het direct intreden van 

het bloedverdunnend effect. Is het redelijk daarvoor bewijs te eisen? En dat “bewijs” 

waar om gevraagd wordt, wat is dat eigenlijk? Er werd gesproken over “geen enkel 

bewijs”. ‘Misschien bedoelde hij wel een helebóel bewijs (hij zei immers “geen énkel”)’, 

denkt A. Jos glimlachend. Het licht springt op rood en zij stopt. 

Van fysiologie naar epidemiologie 

Thuisgekomen denkt A. Jos terug aan de beginjaren van haar studie geneeskunde. Het 

onderwijs werd gedomineerd door basale en toegepaste fysiologie. Fysiologie kenmerkt 

zich vooral doordat het causale verbanden tussen biologische fenomenen probeert te 

leggen. Bevlogen docenten bezworen dat gedegen kennis van de fysiologie de sleutel 

tot goed dokterschap vormde. Er werd geestdriftig verteld over Claude Bernard, u ziet 

zijn afbeelding in figuur 2, die in de eerste helft van de negentiende eeuw de fysiologie 

enorme impulsen had gegeven. 1 Fysiologie legde de basis voor pathofysiologie: de kennis 

van hoe het lichaam werkt onder abnormale omstandigheden, vooral tijdens ziekte. Ook 

was er tijdens de studie ruim aandacht voor basale moleculaire wetenschappen, die de 

fysiologie en pathofysiologie in een ongekende stroomversnelling hebben gebracht. Het 

denken in termen van oorzaak en gevolg, van complexe maar intelligent gereguleerde 

biologische systemen verenigde tijdens de studie het nuttige met het aangename. 

Fysiologie vormde het intrumentarium, logica domineerde en teleologie 2 bood een vaak 

verleidelijke kijk op de geneeskunde. Het was echt leuk om zo met het vak bezig te zijn. 

Figuur 2. 

Claude Bernard

Later tijdens de studie ontstond er op bescheiden schaal meer aandacht voor een 

andere bron van kennis: het epidemiologisch onderzoek. Dit type onderzoek is 

gebaseerd op waarnemingen bij groepen personen. Op verschillende manieren kan 

men onderzoek doen onder groepen mensen. Hun eigenschappen of reactie op een 

behandeling kunnen achteraf bestudeerd worden, ze kunnen gedurende een bepaalde 

periode worden geobserveerd, of ze kunnen bijvoorbeeld door loting een behandeling 

toegewezen krijgen, waarbij een tijdje later het verschil in uitkomst wordt vastgelegd. 

Dit laatste heet een gerandomiseerde klinische trial en wordt in de hiërarchie van het 

epidemiologisch onderzoek doorgaans als het vlaggenschip beschouwd, ook al leidt 

het zelden tot echt vernieuwende inzichten. 3 

Vooral tijdens het klinische deel van de opleiding merkte A. Jos al snel dat als het woord 

‘bewijs’ werd gebruikt, men vrijwel uitsluitend doelde op bewijs uit epidemiologisch 

onderzoek. Dit type bewijs vormt het fundament onder wat we Evidence Based 

Medicine noemen; een vorm van geneeskunde die de laatste 10 tot 20 jaar feitelijk tot 

norm is verheven. Die ontwikkeling heeft vele oorzaken, waaronder een verlangen 

naar zogenaamde objectiviteit en “accountability”: rekenschap kunnen afleggen. Maar 

ook de opmars van kosten-effectiviteitsvraagstukken en een behoefte tot relativering 

van het dogmatische karakter van de fysiologie speelt een rol. 4 De status van fysiologie 

als bron van bewijs is daarentegen laag. A. Jos voelt zich een beetje belazerd: tijdens de 

studie werd zij enthousiast gemaakt met fysiologie, maar in praktijk moet zij de 

resultaten van epidemiologische studies uit haar hoofd leren en zich daaraan houden. 

Anders is het geen Evidence Based Medicine. En áls zij dan eens teruggrijpt naar de 

fysiologie, zoals in deze nachtdienst, dan wordt zij op de vingers getikt. Met een diepe 

zucht maakt zij zich op om naar bed te gaan. 

7

8 

A. Jos slaapt kort en onrustig. Het lijkt alsof de kat van de buren haar opzettelijk 

wakker houdt. Gevoelsmatig deugt het niet wat er vanochtend bij de overdracht 

gebeurde. Epidemiologisch bewijs verdringt andere vormen van kennis en kunde. Om 

twee uur in de middag is zij alweer op en fietst zij klaarwakker naar het VUmc. Zij is 

op weg naar de medische bibliotheek. 

Is bewijs bewijs? 

A. Jos wil uitzoeken hoe sterk epidemiologisch bewijs eigenlijk is. Al fietsend denkt 

zij na over deze vraag. Claude Bernard deed tamelijk absolute uitspraken op grond 

van zijn fysiologische experimenten. Resultaten van dit soort experimenten leiden 

tot universele hypothesen. Zolang deze hypothesen niet ontkracht worden, kunnen 

ze als “waar” worden beschouwd. Epidemiologisch onderzoek daarentegen werkt 

anders, realiseert A. Jos zich, terwijl zij haar kansen inschat om in de Leidsestraat tegen 

een bekeuring aan te fietsen. Een klinische trial die behandeling A met behandeling 

B vergelijkt kan als uitkomst hebben dat behandeling A in 60% van de gevallen tot 

genezing leidt tewijl behandeling B dat in 40% van de gevallen doet. Doorgaans 

leidt dat tot de conclusie dat A beter is dan B. Dat klinkt alsof het een blootgelegde 

natuurwetmatigheid betreft, die voor ieder individu met de bewuste ziekte geldt, 

net als fysiologische mechanismen voor iedereen gelden. ‘Onzin’, denkt A. Jos, ‘het 

enige bewijs dat is geleverd is dat behandeling A wat váker helpt dan behandeling 

B. Er is dus alleen bewijs geleverd voor de kans op genezing. Dat klinkt als iets 

eigenaardigs: “bewijs voor een kans”. Hoe dan ook, het is belangrijk te realiseren dat 

epidemiologisch onderzoek uitspraken doet over kansen en waarschijnlijkheden, 

Figuur 3 

Probabilisme van alledag

zogenaamde “probabilistische uitspraken”’. Zij fietst langs een agent die een andere 

fietser bekeurt. ‘Al 3 jaar zonder kleerscheuren het Leidseplein bereikt’, mompelt zij. 

‘Bewezen veilig, zou ik zeggen.’ 

‘De vraag hoe sterk epidemiologisch bewijs is, is nog niet beantwoord’, denkt A. 

Jos terwijl zij de portier groet en de bibiotheek inloopt. Meestal wordt als maat 

voor de kracht van epidemiologisch bewijs het significantieniveau gebruikt. Dat 

significantieniveau wordt uitgedrukt in de zogenaamde p-waarde. Als een onderzoek 

bijvoorbeeld laat zien dat behandeling A vaker succesvol is dan B, dan geeft de 

p-waarde in essentie aan hoe groot de kans is dat dit verschil op toeval berust 

(statistici moeten mij deze formulering voor nu maar vergeven). Als die kans op een 

toevalsbevinding minder dan 5% is, dan is de afspraak dat de onderzoeksuitkomst 

“statistisch significant” wordt genoemd. 

Dat klinkt redelijk en objectief, maar statistische significantie houdt met een groot 

aantal factoren geen rekening. Welke zijn die factoren? De auteurs formuleren hun 

onderzoeksvraag niet altijd zorgvuldig. Er is een strenge selectie van de deelnemers 

aan hun onderzoek. Ze ontwerpen de onderzoeksmethode en analyseren de gegevens 

op een wijze die hen het beste uitkomt en vaak wordt maar een klein deel van de 

bevindingen gerapporteerd. Als de resultaten tegenvallen, vanuit het perspectief 

van de onderzoekers of van de sponsor, dan wordt het onderzoek soms niet eens 

ingediend bij een tijdschrift. En als het artikel naar een tijdschrift gaat, dan is de 

kans dat het voor publicatie wordt aanvaard veel groter als het onderzoek een 

“positief” resultaat heeft. Wat u in de literatuur leest is dus voordien blootgesteld 

aan vele bronnen van vertekening die u niet ziet weerspiegeld in de p-waarde. Maar die 

9

10 

bronnen van vertekening beïnvloeden de kans dat de uitkomst van het onderzoek ook 

in de werkelijkheid van de praktijk “waar” is in sterke mate. 5 Het woord “waar” zal nog 

vaker vallen. U kunt het in veel gevallen beter vertalen als “reproduceerbaar” dan als 

“in overeenstemming met de werkelijkheid”, want het begrip “werkelijkheid” heeft vele 

beperkingen, die ik niet zal bespreken. 

Een nog niet genoemde, maar belangrijke factor voor het waarheidsgehalte van 

het resultaat van een onderzoek is de vraag hoe groot de kans op dit resultaat 

was voordat met het onderzoek werd begonnen. Die zogenaamde voorafkans 

volgt uit de reeds beschikbare feitenkennis, maar ook uit hoe deze feitenkennis is 

verworven. Echter, ook de vraag of de onderzoeksuitkomst op grond van logische 

argumenten aannemelijk is speelt een rol. Dat klinkt eigenaardig, maar wellicht helpt 

een voorbeeld. Stelt u zich voor dat u een apparaat maakt om te meten waar een 

hemellichaam van is gemaakt. Het apparaat werkt niet perfect, maar wel altijd even 

goed en wordt als eerste op Mars gericht. ‘Zand en rotsen’, geeft het als uitslag en 

we accepteren dat direct, want het is een plausibel resultaat. Maar als het apparaat 

op de maan wordt gericht en als uitslag geeft dat deze is gemaakt van kaas, dan 

is de kans dat dat waar is een stuk kleiner. Los van de gaten in het oppervlak is 

er namelijk niets wat deze bevinding ondersteunt. Met dezelfde test kunnen dus 

geloofwaardige en ongeloofwaardige resultaten worden geproduceerd en zo is het 

met een onderzoek ook. Een goed onderzoek met een significante uitkomst heeft 

een kleinere kans om “waar” te zijn als het resultaat niet plausibel is. En omgekeerd, 

een onderzoek met een heel plausibele beginhypothese dat de significantiedrempel 

niet haalt, kan nog heel goed “waar” zijn. Wat bepaalt die plausibiliteit dan? Behalve 

het beschikbare kennisfundament zijn ook argumenten uit de fysiologie hierop van 

Figuur 4 

De maan is gemaakt van kaas!

invloed. ‘Zouden de “intelligente” fysiologie enerzijds en de “domme” epidemiologie 

anderzijds zich dan op deze wijze tot elkaar verhouden?’, denkt A. Jos. ‘Het gezond 

verstand dat de “waarheden” die epidemiologisch onderzoek pretendeert te 

produceren conditioneel maakt op fysio-logische plausibiliteit? Klinkt aannemelijk, 

maar eigenlijk loop ik op de zaken vooruit. Ik was bezig met de kwaliteit van 

epidemiologisch bewijs’. 

De Griekse epidemioloog John Ioannidis heeft uitgerekend hoe groot de kans is 

dat gepubliceerd epidemiologisch onderzoek, dat statistisch significante uitkomsten 

heeft, ook echt “waar” is. 6 Hij hield daarbij rekening met alle voornoemde 

in vloeden van vertekening en plausibiliteit. Het resultaat staat in figuur 5 en is 

ontluisterend. 

Grote trials met significante uitkomsten hebben gemiddeld slechts 85% kans om 

“waar” te zijn. De meta-analyse, zeg maar een optelsom van meerdere grote trials, 

is helemaal niet beter. En dat terwijl juist meta-analyses als de hoogste graad van 

bewijs worden gezien als het gaat om Evidence Based Medicine. 7 En van de overige 

typen gepubliceerd onderzoek, zeg maar de bulk van de medische literatuur, is het 

grootste deel zelfs “niet waar”. A. Jos is verbijsterd. Bij het lezen van een artikel over 

een klinische trial interpreteert zij het significantieniveau als een betrouwbare maat 

voor de kans dat de conclusie “waar” is. Een p-waarde van een klinische trial van 1% 

betekende voor haar dat er zeker 99% kans is dat behandeling A inderdaad beter is 

dan B. Nu blijkt dat die kans gemiddeld 85%, maar vaak zelfs nog lager is. Zij kijkt om 

zich heen en ziet ijverige studenten en haastige artsen. ‘Wie zou dit weten? Iedereen 

moet dit weten’, denkt zij en zij kan de neiging mensen aan te stoten nauwelijks 

onderdrukken. 

Figuur 5 

Kans op “waar” (lees: 

“reproduceerbaar”) 

zijn van diverse typen 

epidemiologisch 

onderzoek, met 

verschillende niveau’s van 

aannemelijkheid van de 

onderzoeks hypothesen 

Type onderzoek Aannemelijkheid Kans op ‘waar’ zijn 

van de resultaten 

Grote gerandomiseerde Hoog 85% 

klinische trial (RCT) 

Meta-analyse van grote, Zeer hoog 85% 

eensgezinde RCT´s 

Meta-analyse van kleinere, Gemiddeld 41% 

tegenstrijdige onderzoeken 

Kleine, maar goed Gemiddeld 23% 

uitgevoerde RCT 

Klein epidemiologisch Laag 12% 

‘exploratief’ onderzoek 

11

12 

Epidemiologisch bewijs: op wie toepasbaar? 

Een jaar gaat voorbij. A. Jos is tevreden met het besef dat epidemiologisch bewijs 

vaak lang niet zo sterk is als wordt gesuggereerd. Ze zal haar kennis van de fysiologie 

gebruiken om met gezond verstand het “waarheidsgehalte” van uitkomsten van 

epidemiologisch onderzoek bij te stellen. 

Dan loopt zij een opleidingsstage in het vakgebied Vasculaire Geneeskunde. Als 

er ergens veel fysiologische kennis over is en ook nog eens een enorme hoeveelheid 

epidemiologisch onderzoek, dan is het wel over vaataandoeningen, weet A. Jos. Als de 

geneeskunde dus ergens van een leien dakje zal gaan, dan zal dat hier wel zijn. Maar 

dat valt bitter tegen. Tijdens de patiëntenbesprekingen wordt vrijwel over iedere casus 

gesteggeld. Soms gaat het er daarbij fel aan toe, terwijl het patiënten betreft met 

weinig complexe aandoeningen, bijvoorbeeld hoge bloeddruk. 

‘Deze internisten hebben geen fysiologische kennis, kunnen niet logisch denken 

of kennen de klinische trials niet’, denkt A. Jos, als zij op een woensdagavond 

gefrustreerd naar huis fietst. ‘Immers, de “waarheid” is het product van plausibiliteit 

en epidemiologisch bewijs en als je het over de “waarheid” niet eens kunt worden 

ken je dus of het epidemiologisch bewijs niet, of je bent niet in staat plausibiliteit te 

waarderen.’ Maar zij kan geen zwakke punten bij de internisten ontdekken. Ze zijn 

allemaal slim en zitten vol feitenkennis. Bovendien, zo blijkt bij discussies die niet 

over patiënten maar over ziektebeelden gaan, is men het maar zelden oneens over 

“de waarheid”. ‘Dan resteert er slechts één mogelijkheid’, concludeert A. Jos, ‘en dat 

is dat de problemen ontstaan bij de extrapolatie van algemene waarheden naar 

individuele patiënten’. En inderdaad, ook daar wringt de Evidence-Based-Medicineschoen. 

Als het uit een epidemiologische onderzoek verkregen bewijs al “waar” is,

dan nog geldt dit bewijs voor de gemíddelde patiënt in die trial. A. Jos vraagt zich 

af of je ooit zo’n “gemiddelde patiënt” in je spreekkamer ziet. Heel soms zie je een 

patiënt met een groot aantal karakteristieken die hetzelfde zijn als de gemiddelden 

van de trialpatiënten. Maar dan nog kan op een groot aantal andere, deels onbekende 

karakteristieken die patiënt wezenlijk anders zijn. Eigenlijk is iedere patiënt een 

uitzondering en representeert de uitkomst van epidemiologisch onderzoek het 

gemiddelde der uitzonderingen. Je kunt kijken naar het behandeleffect in subgroepen 

van trialdeelnemers die voor een deel overeenkomen met de patiënt die voor je zit, 

maar ook dat heeft grote beperkingen. 8 Tot overmaat van ramp zouden verreweg de 

meeste patiënten die voor je zitten helemaal nooit in een trial zijn geïncludeerd. De 

trials sluiten namelijk zoveel mensen om tamelijk triviale redenen uit dat slechts een 

kleine minderheid meedoet. 9 ‘Maar ook bij de mensen in mijn spreekkamer die voor 

een trial uitgesloten zouden zijn moet ik een beslissing nemen’, denkt A. Jos. 

‘De kernvraag is dus: Wat moet ik met de gemiddelde effectiviteit van een behandeling 

in een streng geselecteerde groep als ik geïnteresseerd ben in de optimale behandeling 

van de patiënt die tegenover mij zit? Kan ooit bewezen worden dat bewijs dat voor 

de denkbeeldige gemiddelde patiënt is geleverd ook geldt voor mijn patiënt in de 

spreekkamer? Nee. Maar als dat bewijs ontbreekt, dan kan in de spreekkamer nooit 

Evidence Based Medicine worden bedreven, tenzij je de spreekkamer zo groot maakt dat 

er duizenden patiënten tegelijk inpassen en je een microfoon nodig hebt om iedereen te 

bereiken. Eigenlijk is dus alleen iemand als Jomanda, tijdens haar “healing-sessies”, in de 

gelegenheid Evidence Based Medicine te bedrijven’, concludeert A. Jos met een glimlach. 

Leuk is het allemaal niet. Hoe vertaal je bewijs dat in groepen is geleverd naar een 

individuele patiënt in de spreekkamer? Recent was er een heftige discussie in de 

Figuur 6 

Jomanda tijdens een “healingservice”-bijeenkomst 

13

14 

media over de vraag of bewijs dat in specifieke groepen is verkregen mag worden 

geëxtrapoleerd naar andere groepen. Cholesterolverlagers verminderen het risico op 

hart- en vaatziekten, dat is aangetoond bij jonge mannen. Er zijn mensen die oudere 

mannen en vrouwen cholesterolverlagers willen ontzeggen omdat hetzelfde effect 

voor die groepen niet aangetoond is. Nu viel deze discussie nog wel te voeren met 

kennis over de pathofysiologie van hart- en vaatziekten. Die is bij vrouwen en ouderen 

namelijk voor zover bekend vrijwel hetzelfde als bij jonge mannen. Het extrapoleren 

van het bewijs verkregen bij jonge mannen naar vrouwen en ouderen ligt om die 

reden voor de hand. 10 

Met gezond verstand en kennis van de fysiologie is het extrapoleren van bewijs van 

het ene type patiënt naar het andere type patiënt dus niet zo ingewikkeld. Anders is 

het als bewijs vanuit een gemiddelde patiënt uit een groot onderzoek geëxtrapoleerd 

moet worden naar een individuele patiënt. Hoe intelligent moet je daarvoor wel niet 

zijn? Dr. House uit de gelijknamige televisieserie staat bekend als extreem intelligent. 

Is hij intelligent genoeg om epidemiologisch bewijs naar individuen te vertalen? 

Misschien wel, maar het opmerkelijke is dat hij bijna stelselmatig van epidemiologisch 

bewijs, en van de daaruit voorvloeiende richtlijnen, afwijkt. Leidt scherpzinnigheid dan 

tot het afwijken van epidemiologisch bewijs? 

A. Jos zit thuis en zakt na een eenzame maaltijd weg in haar luie stoel. Hoe vertaal 

ik epidemiologisch bewijs naar een individuele patiënt? Zij denkt terug aan een 

jaar geleden. Zij concludeerde toen dat het “waarheidsgehalte” van uitkomsten van 

epidemiologisch onderzoek afhankelijk is van de plausibiliteit van die uitkomsten. 

‘Als dat voor algemene waarheden geldt, zou het dan ook voor patiëntgebonden 

waarheden gelden?’, denkt zij. ‘Als de algemene waarheid voortkomt uit het product 

Figuur 7 

Doctor House: toonbeeld van 

scherpzinnigheid?

van plausibiliteit en epidemiologisch onderzoek, is er dan ook zoiets op individueel 

niveau?’ Dit komt dicht bij wat A. Jos ooit heeft geleerd in de context van diagnostiek, 

namelijk de regel van Bayes. Die regel stelt dat de kans dat een persoon een bepaalde 

aandoening heeft na het verrichten van een “onafhankelijke” test afhankelijk is van de 

kans op die aandoening vóórdat die test werd gedaan. Voorbeeld: Als een longfoto 

aanwijzingen voor een longontsteking laat zien, dan is de kans dat er echt een 

longontsteking is veel groter bij mensen die hoesten en koortsig zijn dan bij mensen die 

geen enkele klacht hebben. ‘Waarom zou ik dit principe niet mogen vertalen naar mijn 

huidige dilemma?’, denkt A. Jos. ‘De gegevens uit epidemiologisch onderzoek nemen 

dan de plaats in van de “onafhankelijke” test en de eigenschappen van de individuele 

patiënt nemen de plaats in van de voorafkans. De uitkomst is nu de juistheid van een 

klinische handeling’. Zij beseft nu dat Ioannidis feitelijk ook op dit spoor zat, maar het 

extrapoleren van dit principe naar een individuele patiënt is wel een stap verder. ‘Een 

enge stap’, denkt A. Jos. ‘Hoe kan een arts patiënteigenschappen zo duiden dat hij 

daarmee op toetsbare wijze kan afwijken van wat de koele cijfers van epidemiologisch 

bewijs voorschrijven?’ Eén mogelijkheid zou kunnen zijn om de afwijking van een 

specifieke patiënt van de gemiddelde trialpatiënt cijfermatig in kaart te brengen. Daar 

blijken inderdaad formules voor te zijn waaronder de formule die u in figuur 8 ziet 

afgebeeld. A. Jos begrijpt helemaal niets van deze formule, maar vindt ook dat begrip 

niet noodzakelijk is om te concluderen dat iets intuïtief niet deugt. Weg ermee dus. 

Hier ligt geen taak voor wiskundigen. 

Hoe doen artsen dat? Hoe vertalen ze epidemiologisch bewijs naar individuele 

patiënten? Althans, hoe zouden ze dat eigenlijk moeten doen? Het is mogelijk dit 

soort denkstappen te beschrijven en zelfs te onderzoeken. De term hiervoor is 

“heuristiek”. 11 Het is echter een illusie dat je deze denkstappen in maat en getal kunt 

Figuur 8 

De juistheid van een klinische 

handeling weergegeven als 

het product van specifieke 

patiënteigenschappen en 

epidemiologisch bewijs 

15

16 

vangen. 12 Het gaat namelijk om weging van het belang van vele afwijkingen van de 

zogenaamde “gemiddelde trialpatiënt”. Ook van belang is waardering van verschillen 

in context tussen de trials en de voorliggende praktijksituatie. Dat is wát een arts 

moet wegen, maar hóe moet hij dat doen? Het instrumentarium van de arts hiervoor 

is divers en omvat kennis van de fysiologie, klinische expertise in zijn algemeenheid 

en in het bijzonder eerdere ervaringen met gelijkende patiënten of zelfs met dezelfde 

patiënt. Misschien is zelfs een beroep op zoiets vaags als intuïtie eigenlijk volstrekt 

legitiem. 13 Met andere woorden: het is een veelzijdige optelsom van niet-cijfermatige, 

maar uiterst reële overwegingen. Is het daarmee magie? Nee. Is het een spirituele vorm 

van kunst, “the art of medicine”? Nee. Het klinisch redeneren onderscheidt vooral 

zich van het epidemiologisch bewijs door het multidimensionale karakter ervan. 

Het voorliggende patiëntprobleem wordt doorgaans in epidemiologische context 

vertaald in een enkele vraag, die beantwoord wordt met “ja” of “nee” of, beter gezegd, 

met een “ja/nee-verhouding” die als uitkomst van een onderzoek of meta-analyse 

de doorslag geeft. Maar de extrapolatie van de uitkomst van deze unidimensionele 

vraag naar het individu is intrinsiek múltidimensionaal. Moet een patiënt ouder 

dan 60 jaar met boezemfibrilleren antistolling krijgen? Ja, is het antwoord op deze 

unidimensionale vraag. En deze 80-jarige man dan, die al 4 jaar boezemfibrilleren heeft 

zonder complicaties, die af en toe alcohol drinkt en vaak antibiotica slikt vanwege 

chronische bronchitis, die al aspirine gebruikt en die 10 jaar geleden een kleine 

hersenbloeding heeft gehad, moet die antistolling krijgen? Voor unidimensionale 

vragen kun je makkelijk onderzoek doen, risicoreducties en p-waardes uitrekenen, 

je kunt er veel artikelen over schrijven, waardoor je CV groeit, je aanzien stijgt en je 

misschien ooit wel hoogleraar kunt worden. Maar het multidimensionale klinisch 

redeneren leent zich moeilijk voor wetenschappelijk onderzoek. Type A klinisch

edeneren in een gerandomiseerde trial vergelijken met type B klinisch redeneren 

is onmogelijk. Het schaarse onderzoek dat hiernaar bestaat heeft dan ook een laag 

aanzien, want het wordt als “soft” en “invalide” beschouwd. Maar de echte vraag is 

of deze kennis overdraagbaar is, anders dan via tijdschriften. Het antwoord is mijns 

inziens een ondubbelzinnig “ja”, en wel door ervaren klinici, dokters met het hart op 

de goede plaats, een gezond stel hersens en tenminste een bepaald minimumniveau 

van communicatieve, of eigenlijk meer expressieve vaardigheden. 

Epidemiologische bewijs: belang voor de praktijk. 

Een tijd gaat voorbij en haar conclusies bezinken. ‘Klinisch epidemiologisch onderzoek 

heeft ons veel nuttige kennis opgeleverd, maar epidemiologisch bewijs is vaak lang 

niet zo sterk als men denkt. Dit type bewijs bestaat alleen voor groepen patiënten 

en past dus prima in richtlijnen, waarin gemiddeld beleid wordt geadviseerd voor 

de gemiddelde patiënt. Maar datzelfde bewijs heeft een andere betekenis in de 

spreekkamer, omdat nooit te bewijzen valt dat het van toepassing is op de patiënt 

die tegenover mij zit. Zo moet epidemiologisch bewijs meetellen bij handelen bij 

individuele patiënten, maar daarbij moet fysiologische kennis, kunde en gezond 

verstand eveneens altijd een rol spelen. Zo beschouwd is er helemaal geen sprake van 

strijd tussen epidemiologie en fysiologie, of tussen theorie en empirie, maar vullen 

ze elkaar juist aan. 14 Daarmee wordt het rücksichtlos toepassen van epidemiologisch 

bewijs op individuele patiënten een onverstandige, ja zelfs gevaarlijke onderneming. 

Voor deze blijk van intellectueel onvermogen zou geen excuus mogen bestaan, ook 

niet het excuus “dat de wind nu eenmaal zo waait in de geneeskunde”. Anderzijds 

17

18 

zou het afwijken van epidemiologisch bewijs, althans de altijd aanwezige bereidheid 

om dit te doen, juist moeten worden gezien als een teken van deskundigheid. Zo 

beschouwd is Dr House inderdaad misschien wel het neusje van de zalm. Vanuit 

het oogpunt van morele aansprakelijkheid is het zonder verder nadenken toepassen 

van epidemiologisch bewijs (of zelfs van algemene aanbevelingen uit een richtlijn) 

op een individuele patiënt niet minder afkeurenswaardig dan het beargumenteerd 

afwijken van epidemiologsich bewijs (of van de richtlijn). Natuurlijk kan men het 

hiermee oneens zijn, of men kan aan morele aansprakelijkheid minder belang hechten 

dan aan juridische aansprakelijkheid. Maar de stap van morele naar juridische 

aansprakelijkheid is niet zo groot als soms lijkt. Wees dus gewaarschuwd. 

Epidemiologisch bewijs vormt dus een raamwerk voor klinisch handelen. Dient het 

ook andere doelen? Jazeker. Het is belangrijk voor toelating van geneesmiddelen 

tot de markt, waarbij veiligheid en gemiddelde effectiviteit belangrijke criteria zijn. 

Maar epidemiologisch bewijs wordt misbruikt als het het enige criterium voor 

klinisch handelen wordt, of als het gebruikt wordt als voorwaarde voor bijvoorbeeld 

vergoeding van individuele zorg. Heel gevaarlijk is het ontbreken van epidemiologisch 

bewijs te misbruiken als legitimatie om niet te handelen bij een individuele patiënt, of 

geen afspraken te maken over bijvoorbeeld richtlijnen. 15 

A. Jos is tevreden over deze conclusies, maar vraagt zich af, een beetje laat misschien, 

of dit allemaal geen open deuren zijn en of niet iedereen al op deze wijze denkt en 

handelt. Zou de internist die haar kapittelde tijdens de ochtendoverdracht er werkelijk 

anders over denken? Misschien niet, maar de indruk werd gewekt dat epidemiologisch 

bewijs een voorwaarde is voor klinisch handelen. Anderzijds kent zij de internist in 

kwestie als een verstandig mens en maakt hij geen brokken in de spreekkamer. Zou 

Figuur 9 

Afwezigheid van bewijs 

(gebruikt met toestemming 

van de tekenaar: prof.dr. 

J.W.M. van der Meer)

zijn opmerking dan te maken hebben met de context van de patiëntenbespreking? 

De zogenaamde “zachte” kant van klinische besluitvorming, bestaande uit fysiologie, 

expertise en zelfs intuïtie, is veel lastiger communiceerbaar dan de “harde” kant. 16 Het 

spreken over epidemiologische waarschijnlijkheden, het over en weer smijten met 

risicoreducties, numbers-needed-to-treat en ander epidemiologisch lingo is relatief 

eenvoudig, maar het is een ontkenning van wat er zich in werkelijkheid, als het goed 

is tenminste, in onze spreekkamers afspeelt. De epidemiologie-soep wordt daarom 

wellicht in allerlei overlegsituaties tussen artsen veel heter opgediend dan zij in de 

spreekkamer geconsumeerd wordt. Al zou dat begrijpelijk zijn, we moeten er toch 

weerstand tegen bieden, anders ontstaat er een dubbele moraal in de geneeskunde. 

We belijden dan tegenover elkaar een ander soort geneeskunde dan we bij patiënten 

bedrijven. Bij patiëntenbesprekingen, maar feitelijk ook bij opleiding, nascholingen 

en symposia moeten wij elkaar daarom spreken over de niet-epidemiologische 

argumenten voor een bepaald beleid. Daarmee geven wij ook een goed voorbeeld 

aan jonge artsen en studenten. 17 Hierbij moeten wij consideratie met elkaar hebben 

ingeval het niet goed lukt deze argumenten te expliciteren, want dat is nu eenmaal 

moeilijk. 

A. Jos dacht terug aan de casus waarmee haar zoektocht begon. Wat zij deed is nooit 

epidemiologisch onderzocht. Waar zulk bewijs afwezig is, leggen klinische expertise en 

kennis van de pathofysiologie automatisch alle gewicht in de schaal bij het nemen van 

een beslissing. Zij snapt ook wel dat in gebieden met zeer veel epidemiologisch bewijs, 

het aantal vrijheidsgraden relatief beperkter is. 18 Maar ook dan mag epidemiologisch 

bewijs bij de benadering van een individuele patiënt andere overwegingen nooit 

ondergeschikt maken. 

19

20 

Het evidence-beest; van raamwerk naar traliewerk 

Al met al heeft A. Jos toch het gevoel dat het gevaar van een exclusieve nadruk op 

epidemiologisch bewijs in de dagelijkse klinische geneeskunde nog wel te beteugelen 

valt. Dat heeft te maken met het heimelijke besef van artsen dat ze in werkelijkheid 

weldegelijk als “dokter” werken en niet als pionnen van het “evidence-beest”. Ook 

heeft het veel te maken met gewenning. Naar schatting 75% van ons klinisch handelen 

heeft nooit aan epidemiologisch onderzoek blootgestaan. Ten aanzien van veelgebruikte 

behandelingen is de situatie nauwelijks anders. U ziet dat in figuur 10. Van 

de veel-gebruikte behandelingen is bijna de helft nooit epidemiologisch onderzocht. 

Van slechts 13% is gemiddelde effectiviteit bewezen en van een groot deel van 

de rest weten we het niet zeker. Ongeveer 10% van wat we vaak doen is bewezen 

gemiddeld ineffectief of zelfs schadelijk (figuur 10). 19 We zijn er dus mee vertrouwd 

om beslissingen te nemen die niet door epidemiologisch bewijs gesteund worden. Het 

lijkt ook alsof artsen zich daar gaandeweg meer bewust van worden en dat daarmee 

de nadruk op epidemiologisch bewijs als enige rechtvaardiging voor klinisch handelen 

aan het afnemen is. 20 

Heel anders ligt het in de politiek en bij de zorgverzekeraars. De minister van 

Volksgezondheid heeft in een brief aan de Tweede Kamer in januari 2008 laten weten 

dat wat hem betreft “evidence-based standaarden” de basis worden van zorgcontracten 

tussen aanbieders en verzekeraars. Met andere woorden: epidemiologisch bewijs voor 

een bepaalde behandeling kan een vergoedingscriterium worden. 21 Het College voor 

Zorgverzekering heeft hem daarin met een recent rapport gevolgd. In dit rapport stelt 

men voor de richtlijn Cardiovasculair Risicomanagement te vertalen in vergoedingscriteria 

voor cholesterolverlagende therapie. 22 ‘Beginnersfout’, gromt A. Jos. ‘De richtlijn gaat

over de gemiddelde patiënt. Vergoedingscriteria daarentegen gaan niet over de 

behandeling van de gemiddelde patiënt, maar over de réchten van iedere individuele 

patiënt. Vergoedingscriteria hebben dus betrekking op wat er telkens opnieuw uit het 

samenspel van epidemiologisch bewijs, klinische expertise en voorkeur van de patiënt 

voortkomt.’ Epidemiologisch bewijs en de daaruit voortvloeiende richtlijnen zijn 

bedoeld als raamwerk voor klinisch handelen. Het is nooit de bedoeling geweest dat 

partijen met een financieel-economisch belang dit raamwerk misbruiken door er tralies 

in te plaatsen. 

‘Misschien kunnen we de term Evidence Based Medicine maar beter afschaffen’, denkt 

A. Jos. ‘In verkeerde handen leidt deze term tot veel ellende’. 23 Evidence Informed 

Practice zou een alternatief kunnen zijn’. 24 Dan pakt A. Jos de publicaties van David 

Sackett, zeg maar de ‘godfather’ van Evidence Based Medicine, er nog eens bij. Wat 

blijkt? In het begin werd inderdaad erg veel nadruk gelegd op epidemiologisch 

bewijs. Al snel daarna werd de voorkeur van de patiënt geïncorporeerd en later in de 

negentiger jaren werd de rol van klinische expertise van de arts ook steeds explicieter 

benoemd. Sackett’s gemoderniseerde definitie van Evidence Based Medicine luidt nu: 

‘Integratie van individuele klinische expertise met het best beschikbare externe bewijs 

uit wetenschappelijk onderzoek’, en dat onderzoek hoeft volgens Sackett helemaal niet 

epidemiologisch te zijn, maar mag ook uit de fysiologie of de basale wetenschappen 

komen. 25 Met gemengde gevoelens neemt A. Jos de tekst in zich op. ‘De definitie 

van Evidence Based Medicine is aan de hand van haar uitvinders en pleitbezorgers 

in gunstige zin geëvolueerd en is inderdaad, volgens deze definitie dan, het beste 

wat we als dokters te bieden hebben. 26 Maar zoals Sackett dit nu formuleert, zo is 

hedentendage de gemiddelde interpretatie van Evidence Based Medicine helaas niet, 

Figuur 10 

De epidemiologische onderbouwing 

van veel voorkomende therapeutische 

handelingen 

(http://clinicalevidence.bmj.com/ 

ceweb/about/knowledge.jsp) 

21

22 

noch bij critici, noch bij adepten. De nadruk ligt te veel bij het epidemiologische bewijs. 

Een beetje teleurgesteld is A. Jos ook. Sackett’s gemoderniseerde definitie toont veel 

overeenkomsten met wat zij de afgelopen periode, na die ene ochtendoverdracht, bij 

elkaar heeft gepeinsd. 27 ‘Weer het wiel niet uitgevonden’, mompelt zij, ‘maar onderweg 

wel een hoop geleerd’. 28 

Het is juni 2008. A. Jos is bijna klaar met haar opleiding tot internist. Gedachtenloos 

fietst zij door een ontwakende stad naar het VUmc voor de zoveelste ochtendoverdracht. 

Wind mee. De nachtdienst bestond uit een jonge AIOS, 29 jaar. Zij had iets, het doet 

er eigenlijk niet meer toe wat, gedaan op grond van haar gezond verstand en alleen op 

grond daarvan. ‘Daar is geen bewijs voor’, klinkt het luid. A. Jos aarzelt geen moment, 

buigt zich naar de microfoon voor haar en zegt: ‘Hoezo, bewijs?’. 

Dames en heren, 

Het VU Medisch Centrum is een fantastisch ziekenhuis met fantastische mensen. 

Ik geef eerlijk toe mij heel af en toe te ergeren aan bijvoorbeeld de neiging tot 

verkaveling van patiëntenzorg en koninkrijkjesgedrag, maar de goede wil overheerst 

met het nodige gemak. De afdeling Interne Geneeskunde zal de komende jaren 

mijn werkterrein zijn. In de eerste plaats voel ik mij internist en patiëntenzorg 

verdient het daarom als eerste genoemd te worden bij wat ik komende jaren wil 

blijven doen. Daarnaast hoop ik het wetenschappelijk onderzoek in de Vasculaire 

Geneeskunde verder te ontwikkelen, zowel door persoonlijke activiteiten, maar 

zeker ook door anderen in staat te stellen hierin succesvol te zijn. Onderwijs aan

studenten zal kwantitatief misschien geen groot aandeel hebben, maar kan enorme 

voldoening geven en zal daarom altijd deel uitmaken van mijn werk. Als de baas het 

goed vindt zal ik mij ook buiten het VUmc blijven inzetten, bijvoorbeeld voor zaken 

die de Interne-Geneeskunde-opleiding betreffen, of voor bijvoorbeeld richtlijnen 

voor hart- en vaatziekten. Zo nu en dan zal ik mij blijven mengen in het publieke debat. 

Het in teamverband opleiden van toekomstige internisten is een van de leukste 

aspecten van dit werk. Ik zal mij daar voor inzetten, of het nu gaat om de basisopleiding 

of de voortgezette opleiding in het aandachtsgebied Vasculaire Geneeskunde. In de 

opleiding van AIOS wil ik iets overbrengen van wat ik in mijn lezing heb benadrukt. 

Beste AIOS: jullie studeren hard om kennis tot je te nemen. Dat is prima, maar 

geneeskunde is intrinsiek een onzekere wetenschap. Van alle foute diagnoses die 

jullie zullen gaan stellen zal slechts 4% het gevolg zijn van te weinig feitenkennis. 

Dat betekent niet dat jullie niets hoeven te weten, integendeel. Maar realiseer je 

dat zeer veel fouten het gevolg zijn van tekort aan aandacht, verkeerde aandacht of 

onjuiste denkstappen. 29 Denk daarom eens na over zaken als patroonherkenning, 

of confirmatiebias. Een andere bron van fouten is miscommunicatie met soms 

verscheidene consulenten van andere disciplines, die ter hulp zijn geroepen om in 

ieder geval op kennisgebied alles aan het bed te krijgen wat er maar beschikbaar is. 

De extra kennis die je mobiliseert weegt vaak niet op tegen de miscommunicatie die 

je introduceert. 

Met kennis van de epidemiologie alleen ga je het niet redden. Denk kritisch na over 

hoe je patiënten benadert, hoe je een diagnose stelt en waarom je voor een bepaalde 

behandeling kiest. Koester en ontwikkel subjectiviteit en intuïtie: het zijn geen zonden, 

maar deugden. 30 

Figuur 11 

Raamwerk – traliewerk 

(illustrator: E. Timmermans, 

www.eriktimmermans.com ) 

23

24 

Ik dank het college van Bestuur van de Vrije Universiteit, de Raad van Bestuur van 

het VUmc en collega Sven Danner voor het uitgesproken vertrouwen. Ik dank Mark 

Kramer voor zijn belangrijke rol als nieuw afdelingshoofd en opleider. 

Zo velen ben ik dank verschuldigd. Na ampel beraad heb ik besloten de namen niet 

te noemen: het zijn er te veel en ik zou mensen vergeten. Bovendien ga ik over mijn 

tijd heen. Maar weet, vrienden op de afdeling, collega’s van andere afdelingen, mensen 

van de research en van het onderwijsinstituut, dat jullie door mij zeer gewaardeerd 

worden, al uit ik dat soms niet zo duidelijk en soms zelfs helemaal niet. 

Toch maak ik een uitzondering voor drie mensen. Zij hebben aan mijn professionele 

ontwikkeling de grootste bijdrage geleverd. Ik noem ze in omgekeerde chronologische 

volgorde. Als eerste Abel Thijs, collega-internist op de afdeling Interne Geneeskunde. 

De tweede persoon die ik wil noemen is Coen Stehouwer, voorheen hoogleraar Interne 

Geneeskunde aan het VUmc, thans hoogleraar en opleider Interne Geneeskunde in 

het AZM te Maastricht. Tenslotte spreek ik mijn grote dank uit aan Bob Silberbusch, 

mijn opleider in het Onze Lieve Vrouwe Gasthuis. 

Ik heb gezegd.

Noten 

1 Claude Bernard, Introduction à la médecine 

expérimentale. Parijs, Garnier-Flamaron, 1966 

2 Teleologie: benadering waarin het doel (telos) 

centraal wordt geplaatst. Men probeert bijvoorbeeld 

fysiologische verschijnselen of mechanismen 

te begrijpen door zich af te vragen welk doel met 

dit mechanisme gediend is. 

3 Er is een sterke neiging een hiërarchie aan te 

brengen in klinisch epidemiologisch onderzoek, 

waarbij de meta-analyse en de gerandomiseerde 

klinische trial bovenaan staan, gevolgd door observationeel 

onderzoek en onderaan de ranglijst 

de casusbeschrijving. Deze hiërarchie moge dan 

wel de mate van reproduceerbaarheid weerspiegelen, 

in termen van het vermogen vernieuwingen 

te introduceren is de volgorde eerder andersom. 

Zie o.a. J.P Vandenbroucke, Niveaus van bewijskracht 

schieten tekort, Nederlands Tijdschrift voor 

Geneeskunde 2006; 150: 2485 en, van dezelfde 

auteur, Observational research, randomised trials, 

and the two views of medical science, PLoS Medicine 

2008; 5: 339-343. 

4 Zie ook (1) J.P. Vandenbroucke, Clinical investigation 

in the 20 th century: the ascendancy of numerical 

reasoning, Lancet 1998; 352: SII-12-16, (2) J. van 

der Meer, Ziekten bestaan niet, afscheidsrede 

bij zijn aftreden als hoogleraar in de Inwendige 

Geneeskunde aan de faculteit der Geneeskunde 

van de Vrije Universiteit te Amsterdam, 8 september 

2000 en (3) Raad voor de Volksgezondheid 

en Zorg, Passend bewijs. Ethische vragen bij het 

gebruik van evidence in het zorgbeleid, Signalering 

ethiek en gezondheid 2007/4. Den Haag: Centrum 

voor Ethiek en Gezondheid, 2007. 

5 “Waar” moet hier worden gelezen als ‘reproduceerbaar’. 

Innovatief onderzoek is overigens vaak 

intrinsiek weinig reproduceerbaar, omdat het, in 

tegenstelling tot grote gerandomiseerde trials, 

hypotheses met een lage prior-kans onderzoekt. 

De onderzoeksmethoden met de laagste reproduceerbaarheid 

scoren daardoor juist vaak het 

hoogst op de schaal van innovatief vermogen. 

Zie ook de referenties in noot 3. 

6 John P.A. Ioannidis: Why most research findings are 

false. PloS Medicine 2005; 2: 696-701. 

7 Een pessimistische kijk op de juistheid van de uitkomsten 

van meta-analyses wordt ook verwoord 

door C.D. Naylor in Meta-analysis and the metaepidemiology 

of clinical research, British Medical 

Journal 1997; 315: 617-619 

8 Zie o.a. P.M. Rothwell et al., From Subgroups to 

individuals: general principles and the example of 

carotid endarterectomy, The Lancet 2005; 365: 

256-265. Een van de problemen die hij benoemd 

is het unidimensionale karakter van subgroepen. 

Om een behandeleffect te schatten voor een 

patiënt die op bijvoorbeeld 5 dimensies tot een 

subgroep kan worden gerekend (leeftijd, geslacht, 

en bijvoorbeeld een drietal specifieke ziektekarakteristieken) 

zou een trialpopulatie van 200.000 

nodig zijn. Rothwell bespreekt in dit artikel ook 

een andere wijze waarop epidemiologische 

onderzoeksgegevens kunnen worden gebruikt 

om een individueel behandeleffect statistisch 

te schatten, namelijk het maken van risicopredictiemodellen. 

Hierbij worden patiënten op 

basis van een aantal kenmerken (meestal 5 tot 

10) ingedeeld in categorieën, waarin vervolgens 

de verwachte (absolute) behandeleffecten zo 

goed mogelijk worden geschat op basis van de 

trialgegevens. Deze benadering wordt beschouwd 

als een uiterste numerieke manier waarop klinisch 

epidemiologisch onderzoek naar een individuele 

patiënt kan worden geëxtrapoleerd en komt 

overeen met wat in richtlijnenontwikkeling de 

“expliciete methode” wordt genoemd (zie ook: 

J.G.P Tijssen et al., Landelijke richtlijnen voor het 

klinisch handelen, een methodologische beschouwing, 

Nederlands Tijdschrift voor Geneeskunde 

1998; 142: 2078-2082). 

9 Zie P.M. Rothwell, External validity of randomised 

trials: to whom do the results of this trial apply?, 

Lancet 2005; 365: 82-93. Rothwell schetst een scenario 

waarin van alle mensen met een bepaalde 

aandoening die in een omschreven gebied wonen 

in het gunstigste geval 42%, maar in het ongunstigste 

geval slechts 0.001% in een klinische trial 

voor diezelfde aandoening wordt geïncludeerd. 

De redenen voor exclusie betreffen vaak geslacht 

en leeftijd (vrouwen en ouderen worden vaak 

geëxcludeerd), maar ook zeer veelvoorkomende 

medische omstandigheden zijn vaak een exclusiecriterium 

(zie H.G.C. van Spall et al., Eligibility 

criteria of randomised controlled trials published 

in high-impact general medical journals, Journal 

of the American Medical Association 2007; 297: 

1233-1240). Hoe dit fenomeen zijn weerslag kan 

25

26 

vinden in de dagelijkse praktijk is o.a. te lezen in 

M.M. Levi et al., Bleeding in patients receiving vitamin 

K antagonists who would have been excluded 

from trials on which the indication for anticoagulation 

was based, Blood 2008; 111: 4471-4476. In dit 

artikel wordt beschreven dat de behandeling met 

bloedverdunners veel minder gunstig uitpakt bij 

personen die vanwege exclusiecriteria buiten de 

trials zouden zijn gelaten. 

10 Bovendien zouden in gerandomiseerde klinische 

trials naar de effectiviteit van cholesterolverlagers 

bij deze andere categorieen onderzoek vereisen 

waarbij mensen met een hoog risico op hart- en 

vaatziekten blootgesteld kunnen worden aan 

een nepmedicijn, een placebo. Gegeven de hoge 

voorafkans op een gunstig effect van cholesterolverlagende 

therapie zou dit zelfs als moreel 

verwerpelijk kunnen worden beschouwd. 

11 “Heuristiek” betekent “leer van het vinden”. Zie 

ook C.J. McDonald, Medical heuristics: the silent 

adjucators of medical practice, Annals of Internal 

Medicine 1996; 124: 56-62. 

12 Een pessimistische versie van deze gedachte werd 

al in 1952 verwoord door Austin Bradford Hill: 

‘We cannot necessarily, perhaps even rarely, pass 

from the overall result of a clinical trial to stating 

exactly what effect the treatment will have on a 

particular patient. But there is, surely, no way and 

no method of deciding that’. A.B. Hill, The Clinical 

Trial, New England Journal of Medicine 1952; 247: 

113-119 

13 Zie ook S.J. Tanenbaum, What physicians know, 

New England Journal of Medicine 1993; 329: 1268- 

1269, waarin zij zegt: ‘Physicians should assert 

the legitimacy -indeed the necessity- of reasoning 

about individual patients on the basis of personal 

experience and theories of cause and effect as well 

as on the basis of statistical knowledge’. Het probabilistische 

redeneren wordt door Tanenbaum als 

hooguit complementair beschouwd, zeker niet als 

superieur. Over het bezwaar dat deze zienswijze 

teveel subjectiviteit in de geneeskunde introduceert 

zegt zij: ‘The alternative view of subjectivity is that 

physicians rely on “personal knowledge”. Their 

well-documented regard for personal experience 

reflects the role of the senses as a physician accumulates 

medical knowledge. These experimental 

data are organised by an equally subjective process 

of unspoken inference and intuition. The process 

is neither arbitrary nor mystical. In essence, it 

involves the making of clinical sense. It is more like 

deliberation than calculation … The clinical science 

of outcomes research, as informative as it is, cannot 

substitute for either clinical expertise or clinical 

sense. Even the best clinical science is less than all of 

what physicians know.’ 

Klinische handelingen bij een individuele patiënt 

worden door Alvan Feinstein in feite als experimenten 

beschouwd, waarbij het referentiekader 

wordt gevormd door uitkomsten van eerdere 

klinische handelingen bij dezelfde patiënt of door 

ervaringen met soortgelijke patiënten. Zie A.R. 

Feinstein, Clinical judgement revisited: the distraction 

of quantitative models, Annals of Internal Medicine 

1994; 120: 799-805. 

14 Zie ook J.P. Vandenbroucke, Clinical investigation 


reasoning, Lancet 1998; 352: SII-12-16, waarin 

hij zegt: ‘...at the bedside, scientific explanations 

in medicine are an integration of numerical 

(statistical and epidemiological – i.e. probabilistic 

and empirical) and mechanistic (deterministic 

and explanatory) reasoning. The one cannot exist 

without the other’. In Evidence based medicine 

and ‘médecine d’observation’ (Journal of Clinical 

Epidemiology 1996; 49: 1335-1338) zegt hij: ‘...we 

(clinical epidemiologists, red) should not claim any 

superiority. Rather, we offer a complementary type 

of knowledge, as colleagues and equals in a common 

purpose with basic scientists and practicing 

physicians.’ 

15 Richtlijnen dienen een samenvatting te zijn van 

alle bestaande kennis binnen een afgegrensd klinisch 

domein. Als er veel pathofysiologische kennis 

is, of kennis vanuit bijvoorbeeld casuïstische 

literatuur, maar geen kennis uit gerandomiseerde 

klinische trials en meta-analyses, dan wordt 

menigmaal beweerd dat over het betreffende 

onderwerp geen richtlijn mag worden gemaakt. 

Mijns inziens is het juist de taak van deskundigen 

om de leemtes tussen het klinisch epidemiologisch 

bewijs op te vullen met de best beschikbare 

kennis uit andere bronnen (pathofysiologie, 

klinische expertise, etc) om zo tot aanbevelingen 

te komen in afwachting van nader onderzoek. De 

vrijheidsgraden rondom de aanbevelingen dienen 

in zulke richtlijnen uiteraard expliciet benoemd te 

worden, maar dit geldt evenzeer voor richtlijnen 

die wél op grootschalig klinisch epidemiologisch 

onderzoek zijn gebaseerd. Dit betekent niet

dat voor alle klinische handelingen richtlijnen 

gemaakt kúnnen worden. Vooral handelingen 

waarbij vrijwel alleen klinische expertise een rol 

speelt zijn ongeschikt voor richtlijnen, die in deze 

situaties zelfs schadelijk kunnen zijn, omdat ze 

leiden tot “automatische-pilootgedrag” in een 

klinisch domein waarin alleen met “handmatige 

besturing” ervaring bestaat. 

Tenslotte dient ervoor gewaarschuwd te worden 

dat in richtlijnen aan elementaire klinische handelingen, 

zoals het afnemen van een anamnese 

en het verrichten van oriënterend lichamelijk 

onderzoek, in termen van bewijslast niet dezelfde 

eisen worden gesteld als aan aanvullende diagnostiek 

of therapeutische interventies. Zo deelde een 

huisarts en lid van een richtlijnencommissie mij 

ooit eens mee dat hij bij een patiënt met longembolie 

geen lichamelijk onderzoek verrichtte 

omdat “daar geen evidence voor bestaat”. Anamnese 

en lichamelijk onderzoek zijn vaak geen 

onderdeel van wat in klinisch epidemiologisch 

onderzoek feitelijk onderzocht wordt, maar zijn 

bij vrijwel alle patiënten reeds verricht vóórdat 

ze in aanmerkingen kwamen voor deelname aan 

het onderzoek. Het weglaten ervan met louter 

een beroep op “geen bewijs” is welbeschouwd een 

kunstfout. 

16 R.P. Epstein formuleert het in Mindful practice 

(Journal of the American Medical Association 

1999; 282: 833-839) als volgt: ‘Often, excellent 

clinical physicians are less able to articulate what 

they do … nor do they appreciate all of the biases 

in their own reasoning process’. 

17 Het communicatief vullen van de ruimtes tussen 

epidemiologisch bewijs is tegenover patiënten 

overigens evenmin eenvoudig. Artsen blijken 

zich hierin ook van geheel verschillende stijlen te 

bedienen. Zie o.a. F. Griffiths et al., The nature of 

medical evidence and its inherent uncertainty for 

the clinical consultation: qualitative study, British 

Medical Journal 2005; 330: 511-515. 

18 Toch valt er in domeinen met veel klinischepidemiologisch 

bewijs nog veel eer te behalen 

voor pathofysiologisch redeneren bij het 

be handelen van patiënten. Een goed voorbeeld 

betreft de behandeling van hoge bloeddruk; daar 

bestaat een enorme hoeveelheid epidemiologisch 

onderzoek naar. Dit heeft veel kennis over de 

effectiviteit van verschillende geneesmiddelen 

opgeleverd. De Engelse internist Morris Brown 

heeft het veld recent toch nog een grote dienst 

weten te bewijzen door op grond van pathofysiologische 

overwegingen een behandelschema op 

stellen waarin bepaalde soorten geneesmiddelen 

worden geadviseerd aan bepaalde patiëntencategorien, 

welke worden onderscheiden op basis van 

leeftijd en ethniciteit (M Brown, Matching the right 

drug to the right patiënt in essential hypertension, 

Heart 2001; 86: 113-120). Dit betreft dus een 

pathofysiologische aanvulling op epidemiologisch 

bewijs op ‘mesoniveau’: niet individuele patiëntkarakteristieken, 

maar pathofysiologische 

groepskarakteristieken vullen het epidemiologische 

bewijs aan. 

19 Hierbij wordt nog voorbij gegaan aan het feit dat 

klinisch handelen dat wél aan klinisch epidemiologisch 

onderzoek heeft blootgestaan, vaak 

onvolledig onderzocht is. Zo zijn bij therapeutisch 

onderzoek medicamenten vaak met placebo, 

maar niet met elkaar vergeleken, is de optimale 

duur van behandeling zelden bestudeerd en is de 

mate van ziek zijn waarbij behandeling gestart 

moet worden vaak onderbelicht. Zie ook noot 9 

voor een opmerking over een andere vorm van 

‘incompleetheid’ van epidemiologisch onderzoek: 

het bestuderen van slechts een klein, sterk 

geselecteerd deel van alle patiënten met een 

aandoening. 

20 Een deel van het therapeutisch handelen 

waarvoor helemaal geen epidemiologisch bewijs 

is zou zich alsnog kunnen lenen voor epidemiologisch 

onderzoek, maar de kosten van het maken 

van zo’n inhaalslag zouden simpelweg onbetaalbaar 

zijn. Tevens speelt een groot deel van ons 

klinisch handelen zich af in patiëntengroepen en 

zorgdomeinen waarin epidemiologisch bewijs, om 

technische of om ethische redenen, helemaal niet 

verkregen kán worden. Zie ook: Raad voor de 

Volksgezondheid en Zorg, Passend bewijs. Ethische 

vragen bij het gebruik van evidence in het zorg beleid, 

Signalering Ethiek en Gezondheid 2007/4. Den 

Haag: Centrum voor Ethiek en Gezondheid, 2007. 

21 Brief Een Dynamische Eerstelijnszorg van A. Klink 

aan de tweede kamer; 25 januari 2008 

22 College voor Zorgverzekeringen. Rapport 

pakketadvies 2008; aanpassing nadere voorwaarden 

cholesterolverlagende medicatie. Diemen: 

College voor Zorgverzekeringen, 2008. 

23 Een recent rapport van het Centrum voor Ethiek 

en Gezondheid, onderdeel van de Raad voor 

27

de Volksgezondheid en Zorg, kwam tot dezelfde 

overweging. Raad voor de Volksgezondheid en 

Zorg. Passend bewijs. Ethische vragen bij het gebruik 

van evidence in het zorgbeleid. Signalering ethiek 

en gezondheid 2007/4. Den Haag: Centrum voor 

Ethiek en Gezondheid, 2007. 

24 P Glasziou, Evidence Based Medicine: does it make a 

difference? British Medical Journal 2005;330:92 

25 Voor de evolutie van het begrip Evidence Based 

Medicine: zie o.a. (1) Evidence Based Medicine 

Working Group, Evidence Based Medicine: a new 

approach to teaching the practice of medicine, 

Journal of the American Medical Association 

1992;268:2420-2425, (2) D.L. Sackett et al., Evidence 

Based Medicine: what it is and what it isn’t. British 

Medical Journal 1996;312:71-72 en (3) R.B. Haynes 

et al., Physicians’ and patients’ choices in evidence 

based practice, British Medical Journal 2002;324:1350. 

Zeer lezenswaardig is Evidence based medicine and 

‘médecine d’observation’ van J.P Vandenbroucke 

(Journal of Clinical Epidemiology 1996; 49: 

1335-1338), waarin hij historische spanningen 

tussen theorie en empirie in de geneeskunde 

beschrijft tot in de oude Griekse en Romeinse tijd. 

Ongeveer 170 jaar geleden was er een sterk op 

Evidence Based Medicine gelijkende beweging in de 

geneeskunde, die vanuit Frankrijk opkwam. Deze 

‘Médecine d’observation’ ging ten onder aan 

bezwaren van clinici, die o.a. betoogden dat 

‘geneeskunde niet over groepen, maar over 

individuen ging’; een opmerkelijke overeenkomst 

28 

met de huidige bezwaren tegen Evidence Based 

Medicine. Vandenbroucke benadrukt dat Evidence 

Based Medicine, de huidige evenknie van voor - 

noemde beweging, in de basale wetenschappen en 

moderne pathofysiologie wel een veel sterkere 

partner heeft dan ‘Médecine d’observation’, die 

vooral streed tegen bijgeloof en magisch denken. 

26 Alvan Feinstein wijst op een belangrijke factor die, 

ondanks de vooruitgang in basale wetenschappen, 

in diagnostische en therapeutische technologieën 

en in wetenschappelijke en besliskundige 

methodologie, de vooruitgang van de klinische 

geneeskunde heeft afgeremd, namelijk het gebrek 

aan vernieuwing van klinische methoden van 

gegevensverzameling en van klinische taxonomie. 

Zie A.R. Feinstein, Clinical judgement revisited: the 

distraction of quantitative models, Annals of Internal 

Medicine 1994; 120: 799-805. 

27 In D.L. Sackett et al., Evidence Based Medicine: 

what it is and what it isn’t, British Medical Journal 

1996;312:71-72, schrijft hij bijvoorbeeld: External 

evidence can inform, but can never replace, individual 

clinical expertise, and it is this expertise that 

decides whether the external evidence applies to the 

individual patiënt at all and, if so, how it should be 

integrated into a clinical decision. Verderop vervolgt 

hij: Some fear that evidence based medicine will 

be hijacked by purchasers and managers to cut 

the costs of health care. This would not only be a 

misuse of evidence based medicine but suggests 

a fundamental misunderstanding of its financial 

consequences. Doctors practising evidence based 

medicine (volgens de moderne definitie, red.) will 

identify and apply the most efficacious interventions 

to maximise the quality and quantity of life for 

individual patiënts; this may raise rather than lower 

the cost of their care. 

28 Zie ook J.P. Vandenbroucke, Clinical investigation 


reasoning, Lancet 1998;352:SII-12-16, waarin hij 

schrijft: ‘...the objectivity that we expect to find in 

some force outside of medicine (either statistics or 

chemistry) looks like the proverbial quest for the holy 

grail. The white knights riding out to find the grail do 

many a glorious and righteous deed on their way. 

In their heart of hearts, they may know that their 

aim is forever unattainable. Yet they have profound 

consolidation in all the good that was done while 

searching for it’. 

29 Zie o.a. J. Groopman, How doctors think, Houghton 

Mifflin Publisher, New York 2007. 

30 In Observational research and evidence-based 

medicine: what should we teach young physicians 

(Journal of Clinical Epidemiology 1998; 51: 

467-472), formuleert J.P. Vandenbroucke o.a. als uitgangspunten 

voor onderwijs aan jonge artsen: (1) 

The role of argument and counterargument, of which 

methodologic rules are only a part, should be shown 

to be equally important in the apraisal of evidence 

from all types of study design en (2) We should not 

be afraid of teaching subjectivity and uncertainty, as 

these are unescapable.

Hoezo, bewijs? prof.dr. Y.M. Smulders - Vitromics

Create successful ePaper yourself

Delete template?

Save as template?