Statistiek: belangrijke begrippen voor zorgprofessionals
Statistiek is een onmisbare pijler van wetenschappelijk onderzoek, vooral binnen de medische wetenschappen. Het biedt onderzoekers instrumenten om gegevens te verzamelen, analyseren en interpreteren. Met statistische methoden kunnen onderzoekers de effectiviteit van diagnostische en therapeutische interventies beoordelen, betrouwbare conclusies trekken en reproduceerbare resultaten verkrijgen. Deze gids bevat een overzicht van belangrijke statistische begrippen en methoden, gericht op het begrijpen van wetenschappelijke literatuur en het beoordelen van onderzoekskwaliteit.
Statistische begrippen en methoden
Hypothesen en fouten
- H0-hypothese (nulhypothese): er is géén verschil of effect tussen twee variabelen of behandelingen (bijvoorbeeld: therapie A en therapie B hebben dezelfde uitkomst).
H1-hypothese (alternatieve hypothese): er is wél een verschil of effect (bijvoorbeeld: therapie A leidt tot significant beter herstel dan therapie B). - Type-1 fout (alpha): ten onrechte verwerpen van de nulhypothese, wat leidt tot een fout-positief resultaat; concluderen dat er een effect is terwijl dat niet zo is.
- Type-2 fout (beta): ten onrechte accepteren van de nulhypothese, wat leidt tot een fout-negatief resultaat; concluderen dat er geen effect is terwijl dat wel zo is.
Statistische power en betrouwbaarheid
- Power (statistische power): de kans dat een studie een daadwerkelijk bestaand effect detecteert, wat de kans op een type-2 fout verkleint.
- Betrouwbaarheid: de mate waarin een meetinstrument consistente resultaten oplevert bij herhaalde metingen.
- Interbeoordelaarsbetrouwbaarheid: de mate van overeenstemming tussen verschillende beoordelaars die dezelfde meting uitvoeren.
- Intrabeoordelaarsbetrouwbaarheid: de mate van consistentie van een enkele beoordelaar over herhaalde metingen.
- Reproduceerbaarheid: het vermogen om dezelfde resultaten te verkrijgen bij herhaalde metingen onder dezelfde omstandigheden.
Validiteit en bias
- Validiteit (geldigheid): de mate waarin een meetinstrument meet wat het beoogt te meten.
- Interne validiteit: de mate waarin de resultaten van een studie daadwerkelijk het effect van de onderzochte interventie weergeven, zonder verstoringen door confounders.
- Externe validiteit (generaliseerbaarheid): de mate waarin de resultaten van een studie toepasbaar zijn op andere populaties, settings of tijden.
- Criteriumvaliditeit: de mate waarin de resultaten van een meetinstrument overeenkomen met een gouden standaard of criteriummaatstaf.
- Face validiteit: de mate waarin een test op het eerste gezicht valide lijkt, beoordeeld op basis van oppervlakkige beoordeling.
- Constructvaliditeit: de mate waarin een meetinstrument daadwerkelijk het theoretische construct meet dat het beweert te meten.
- Inhoudvaliditeit: de mate waarin een meetinstrument alle relevante aspecten van het bedoelde construct dekt, vaak beoordeeld door experts.
- Confounding: een verstorende factor die een schijnbaar verband tussen twee variabelen veroorzaakt, wat kan leiden tot een verkeerde interpretatie van de resultaten.
- Bias (vertekening): systematische fout in een studie die leidt tot een vervorming van de resultaten, zoals selectiebias en informatiebias.
- Adjusteren: het proces van het corrigeren voor de effecten van confounders om de relatie tussen onafhankelijke en afhankelijke variabelen nauwkeuriger te bepalen.
- Hawthorne-effect: deelnemers passen hun gedrag aan omdat ze zich bewust zijn van observatie, wat de resultaten kan beïnvloeden.
- Publicatiebias: de neiging om vooral positieve of significante onderzoeksresultaten te publiceren, waardoor negatieve of niet-significante bevindingen onderbelicht blijven. Dit verstoort het overzicht van bestaand bewijs en kan leiden tot een overschatting van effecten.
Onderzoeksmethoden
- Cross-sectioneel onderzoek: een type observationeel onderzoek waarbij gegevens op één enkel moment worden verzameld. Dit biedt een momentopname van een populatie, bijvoorbeeld om de prevalentie van diabetes op een bepaald moment te meten.
- Longitudinaal onderzoek: een onderzoekstype waarbij gegevens over een langere periode van dezelfde individuen worden verzameld om veranderingen over tijd te bestuderen.
- Cohortonderzoek: een langdurig onderzoek waarbij een groep mensen over tijd wordt gevolgd om het effect van een risicofactor te bestuderen, bijvoorbeeld de invloed van roken op het risico op longkanker.
- Patiëntcontroleonderzoek (case control onderzoek): vergelijkt personen met een bepaalde aandoening met een controlegroep om risicofactoren te identificeren.
- Systematic review: een grondige samenvatting van alle relevante onderzoeken over een bepaald onderwerp, systematisch verzameld en beoordeeld.
- Meta-analyse: een statistische techniek die de resultaten van meerdere studies combineert om een algemeen effect te schatten.
- RCT (Randomized Controlled Trial): een experimentele studie waarin deelnemers willekeurig worden toegewezen aan een behandelings- of controlegroep om de effectiviteit van een interventie te testen.
- Niet-experimenteel onderzoek: onderzoek dat geen gebruik maakt van een gecontroleerde setting, zoals waarnemingen in een natuurlijke setting of retrospectieve studies.
- Experimenteel onderzoek: onderzoek waarbij interventies op een gecontroleerde manier worden uitgevoerd om causale relaties te onderzoeken.
- Intention-to-treat analyse: een analytische benadering waarbij alle deelnemers worden meegenomen in de analyse zoals ze oorspronkelijk zijn gerandomiseerd, ongeacht hun daadwerkelijke deelname aan of voltooiing van de interventie.
- Good clinical practice (GCP): een internationale standaard die richtlijnen biedt voor het uitvoeren van klinisch onderzoek om de veiligheid van de deelnemers en de betrouwbaarheid van de onderzoeksresultaten te waarborgen.
- Concealment of allocation: het proces van het verbergen van de toewijzing van deelnemers aan verschillende onderzoeksgroepen om bias te minimaliseren, vaak toegepast in gerandomiseerde gecontroleerde onderzoeken.
Statistische analyse
- P-waarde: de kans dat een gevonden effect of verschil puur door toeval kan zijn ontstaan; een lage p-waarde (< 0,05) suggereert statistische significantie.
- Statistische significantie: een maat die aangeeft of een waargenomen effect waarschijnlijk echt is en niet door toeval kan worden verklaard.
- Klinische relevantie: de praktische betekenis van onderzoeksresultaten in de zorg, wat betekent dat ze daadwerkelijk impact hebben op de zorg of behandeling van patiënten.
- Effectmodificatie: het fenomeen waarbij het effect van een behandeling of risicofactor verschilt tussen subgroepen, bijvoorbeeld een medicijn dat beter werkt bij mannen dan bij vrouwen.
- Heterogeniteit: de mate van variatie of verschil tussen de resultaten van verschillende studies of onderzoeksuitkomsten, vaak onderzocht in meta-analyses.
- Funnel-plot: een grafiek gebruikt om publicatiebias te identificeren, vooral nuttig in meta-analyses.
- Kaplan-Meier analyse: een statistische methode gebruikt om de overlevingskansen in de tijd te schatten, vooral nuttig bij klinische studies met tijd-tot-gebeurtenis data.
- ROC-curve (receiver operating characteristic): een grafiek die de prestatie van een diagnostische test weergeeft door de relatie tussen sensitiviteit en specificiteit bij verschillende afkappunten te tonen.
- Cox-proportional hazards model: een statistisch model gebruikt in survival analyse om te schatten hoe verschillende variabelen de overlevingstijd beïnvloeden.
- Regressie-analyse: een techniek om de relatie tussen een afhankelijke variabele en één of meer onafhankelijke variabelen te modelleren en te analyseren.
- Logistische regressie: een statistische techniek om de relatie tussen een binaire afhankelijke variabele (bijvoorbeeld ziek/niet ziek) en één of meer onafhankelijke variabelen te modelleren.
- Enkelvoudige regressieanalyse: een regressieanalyse waarbij slechts één onafhankelijke variabele wordt gebruikt om de afhankelijke variabele te voorspellen.
Beschrijvende statistiek
- Modus: de meest voorkomende waarde in een dataset.
- Mediaan: de middelste waarde wanneer alle data gesorteerd zijn.
- Gemiddelde (mean): het totaal van alle waarnemingen gedeeld door het aantal waarnemingen; een maat voor centrale tendentie.
- Interquartile range (IQR): het verschil tussen het eerste en derde kwartiel van de data, gebruikt om de spreiding van de middelste 50% van de waarnemingen weer te geven.
- Standaarddeviatie (σ, sigma): een maat voor de spreiding van waarden rond het gemiddelde, geeft de mate van variabiliteit of dispersie in een dataset aan.
- Normale verdeling: een symmetrische verdeling van gegevens rond het gemiddelde, vaak weergegeven als een klokvormige curve.
- Scheefheid (skewness): een maat die de asymmetrie van een verdeling beschrijft, waarbij scheefheid naar links of rechts wijst op respectievelijk negatieve of positieve scheefheid.
Grafische weergaven
- Histogram: een grafische weergave van de frequentie van continue gegevens; toont hoe vaak waarden binnen bepaalde intervallen voorkomen.
- Staafdiagram: visualisatie voor nominale of ordinale gegevens; de balken vertegenwoordigen verschillende categorieën en raken elkaar niet aan.
- Boxplot: een grafische weergave die de verdeling van data laat zien, inclusief mediaan, kwartielen en mogelijke uitschieters.
- Frequentietabel: een tabel die de frequentie van elke categorie toont, vooral nuttig voor categorische gegevens.
- Cumulatieve frequentie: het aantal waarnemingen dat kleiner of gelijk is aan een bepaalde waarde in een dataset.
- Limits of agreement: een statistische maat die de mate van overeenkomst tussen twee verschillende meetmethoden aangeeft, vaak weergegeven in een Bland-Altman-plot.
Schalen en variabelen
- Nominale schaal: een meetschaal die enkel categorieën zonder rangorde onderscheidt, zoals geslacht of haarkleur.
- Ordinale schaal: een schaal die zowel categorieën als een rangorde onderscheidt, maar zonder gelijke intervallen tussen de categorieën, zoals opleidingsniveaus.
- Intervalschalen: een meetschaal met gelijke intervallen tussen de waarden, zonder een absoluut nulpunt, zoals temperatuur in graden Celsius.
- Ratioschaal: een meetschaal met gelijke intervallen en een absoluut nulpunt, zoals lengte of gewicht.
- Binaire (dichotome) variabelen: variabelen met twee mogelijke categorieën, zoals ja/nee of ziek/gezond.
- Continue variabele: een variabele die een oneindig aantal waarden kan aannemen binnen een bepaald bereik, zoals lengte, gewicht of temperatuur.
- Discrete variabele: een variabele die slechts een beperkt aantal specifieke waarden kan aannemen, zoals het aantal kinderen in een gezin.
Statistische toetsen en technieken
- T-toets: een toets om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen.
- F-toets: een toets die wordt gebruikt om te bepalen of de varianties van twee of meer groepen significant van elkaar verschillen.
- One-way ANOVA: een variantie-analyse die kijkt naar verschillen tussen de gemiddelden van drie of meer groepen.
- Two-way ANOVA: een variantie-analyse die de effecten van twee onafhankelijke variabelen op één afhankelijke variabele test, inclusief de interactie tussen de twee variabelen.
- One-sample t-test: een toets om te bepalen of het gemiddelde van een steekproef significant verschilt van een bekende waarde of norm.
- Independent-samples t-test: een toets die vergelijkt of de gemiddelden van twee onafhankelijke groepen significant van elkaar verschillen.
- Dependent t-test (paired-samples t-test): een toets die vergelijkt of de gemiddelden van twee gekoppelde of gerelateerde groepen significant van elkaar verschillen, zoals voor- en nametingen bij dezelfde groep.
- Chi-kwadraattoets: een toets die gebruikt wordt om te bepalen of er een significant verschil is tussen de verwachte en waargenomen frequenties in categorische gegevens.
- Kolmogorov-Smirnov-toets: een statistische toets die wordt gebruikt om te bepalen of een steekproef afkomstig is uit een specifieke verdeling, meestal gebruikt om normaliteit te testen.
- Non-parametrische toetsen: statistische toetsen die geen aannames maken over de verdeling van de data, zoals de Wilcoxon-test of de Mann-Whitney U-test.
- Parametrische toets: statistische toets die aannames maakt over de verdeling van de data, meestal normaal verdeeld, zoals de t-toets of ANOVA.
Diagnostische testen en effectmaten
- Sensitiviteit (SENS): het vermogen van een test om correct positieve resultaten te identificeren onder personen met de aandoening.
- Specificiteit (SPEC): het vermogen van een test om correct negatieve resultaten te identificeren onder personen zonder de aandoening.
- Positief voorspellende waarde (PVW): de kans dat personen met een positieve testuitslag daadwerkelijk de ziekte hebben.
- Negatieve voorspellende waarde (NVW): de kans dat personen met een negatieve testuitslag daadwerkelijk geen ziekte hebben.
- Likelihood ratio (LR): een maat die aangeeft hoe waarschijnlijk een bepaalde testuitslag is bij personen met de aandoening vergeleken met personen zonder de aandoening.
- LR+ (positieve waarschijnlijkheidsratio): de kansverhouding dat een test positief is bij zieken versus gezonden.
- LR- (negatieve waarschijnlijkheidsratio): de kansverhouding dat een test negatief is bij gezonden versus zieken.
- Voorafkans: de kans op aanwezigheid van een ziekte vóór het uitvoeren van een test, gebaseerd op bekende gegevens.
- Odds ratio (OR): de verhouding van de kans op een bepaalde uitkomst tot de kans op het niet optreden van die uitkomst, vaak gebruikt in case-control studies.
- Relatief risico (RR): de verhouding van het risico op een uitkomst in de blootgestelde groep versus de niet-blootgestelde groep.
- Relatieve risico reductie (RRR): de proportionele vermindering van het risico tussen de behandelingsgroep en de controlegroep.
- Absolute risicoreductie (ARR): het absolute verschil in risico tussen de behandelingsgroep en de controlegroep.
- Number needed to treat (NNT): het aantal patiënten dat behandeld moet worden om één extra gunstige uitkomst te bereiken in vergelijking met de controlegroep.
- Number needed to harm (NNH): het aantal patiënten dat behandeld moet worden voordat één extra schadelijk effect optreedt.
Meten van veranderingen en overeenstemming
- Smallest detectable change (SDC): het kleinste meetbare verschil in score dat kan worden onderscheiden van meetfouten, vaak gebruikt om minimale veranderingen te detecteren die klinisch relevant zijn.
- Minimal important change (MIC): de kleinste verandering in een score die door patiënten of clinici als belangrijk genoeg wordt beschouwd om een verandering in het behandelplan te rechtvaardigen.
- Standard error of measurement (SEM): de mate van meetfout in herhaalde metingen, geeft de betrouwbaarheid van een meetinstrument aan.
- Intraclass correlatiecoëfficiënt (ICC): een statistische maat voor de overeenkomst tussen metingen van dezelfde variabele uitgevoerd door verschillende beoordelaars of bij herhaalde metingen.
- Kappa (Cohen's kappa): een maat voor de mate van overeenstemming tussen twee of meer beoordelaars die dezelfde data categoriseren, gecorrigeerd voor toeval.
- Cronbach's α (alfa): een maat voor de interne consistentie van een test of vragenlijst, die aangeeft hoe goed de verschillende items van een schaal met elkaar correleren.
- Pearson’s r (Pearson correlatiecoëfficiënt): een maat voor de lineaire relatie tussen twee continue variabelen, variërend van -1 (perfecte negatieve correlatie) tot +1 (perfecte positieve correlatie).
- Spearman’s rho (Spearman's rangcorrelatiecoëfficiënt): een niet-parametrische maat voor de sterkte en richting van de associatie tussen twee ordinale variabelen.