Sample Size Berekening voor Non–Inferiority Studies Don van Ravenzwaaij

Sample Size Berekening voor Non–Inferiority Studies
Don van Ravenzwaaij
DonStat
8 November 2010
In onderstaand document zal ik (beknopt) uiteenzetten welke stappen ondernomen
moeten worden voor het berekenen van een geschikte sample size voor non–inferiority studies
in het algemeen, waar het specifieke probleem onder valt.
Het Probleem
Doel is het onderzoeken of de testgroep niet slechter scoort dan de controle groep.
Hiervoor is geen specifieke voorkennis over de scores van de controle groep noodzakelijk.
Wel is het nodig dat de onderzoeker a priori een keuze maakt over de ondergrens van non–
inferiority. De onderzoeker moet daarnaast overtuigd zijn dat de steekproefvariantie van de
testgroep en de controle groep bij benadering gelijk zullen zijn.
De Analyse
Er zijn twee groepen die in een between–design met elkaar vergeleken worden, in
principe wordt gebruik gemaakt van een non–paired T–test (paired is mogelijk, maar geeft
een hoop extra werk). In dit geval gaat het erom dat het steekproefgemiddelde van de
testgroep, µt niet inferieur is aan dat van de controle groep, µc . In statistische termen: als
µt significant hoger is dan µc − δ is er sprake van non–inferiority (zie Figuur 1).
De keuze van δ hangt hierbij af van de keuze van de onderzoeker. Hoe kleiner de
gekozen δ, des te lager zal de power zijn (of anders gezegd, des te groter moet de sample
size zijn voor dezelfde power). Cohen geeft als richtlijnen bij δ = 0.2 te spreken van een
kleine afwijking, bij δ = 0.5 te spreken van een middelmatige afwijking en bij δ = 0.8 te
spreken van een grote afwijking.
Na het kiezen van de δ kunnen we aan de slag. Om de power van de T–test te kunnen
berekenen is de niet–centrale T–verdeling noodzakelijk. Deze kansverdeling is helaas te
complex om een directe berekening van de bewuste kans mogelijk te maken. In plaats
daarvan gebruiken we een standaardnormale benadering van de non–centrale T–verdeling
(Zelen & Severo, 1979):
"
−.5 #
1
t2
P (Tν,λ < t) = P Z < t 1 −
−λ 1+
.
(1)
4ν
2ν
√
met λ = δ n. Met deze formule kun je voor een gegeven δ en n de power berekenen, je
moet dit echter wel voor iedere n opnieuw doen. Hoewel het (met de juiste statistische
DONSTAT
δ
2
µc
Figure 1. Steekproefverdeling van de gemiddelde score van de controle groep. µt dient significant
hoger te zijn dan µc − δ voor non–inferiority.
tabellen) zeker mogelijk is dit allemaal handmatig uit te rekenen, valt de computer toch te
adviseren. Figuur 2 bevat drie panels met de power voor verschillende steekproefgroottes
voor respectievelijk δ = 0.2, 0.5 en 0.8.
De figuur toont dat wanneer gekozen wordt voor een power van 1 − β = 0.8, de
steekproefgrootte 150 moet zijn voor δ = 0.2. Voor δ = 0.5 is een steekproefgrootte van 26
voldoende en voor δ = 0.8 is een steekproefgrootte van 11 al genoeg.
3
DONSTAT
Power for δ = .8
1.0
1.0
0.8
0.8
Power
Power
Power for δ = .2
0.6
0.4
0.2
0.6
0.4
0.2
0.0
0.0
0
50
100
150
200
n
0
10
20
30
40
50
n
Power for δ = .5
1.0
Power
0.8
0.6
0.4
0.2
0.0
0
10
20
30
40
50
n
Figure 2. Power voor verschillende steekproefgroottes voor δ = 0.2 (linksboven), δ = 0.5 (linksonder) en δ = 0.8 (rechtsboven).
DONSTAT
4
References
Zelen, M., & Severo, N. C. (1979). Probability functions. In M. Abramowitz & I. A. Stegun (Eds.),
Handbook of mathematical functions. New York: Dover.