Sample Size Berekening voor Non–Inferiority Studies Don van Ravenzwaaij DonStat 8 November 2010 In onderstaand document zal ik (beknopt) uiteenzetten welke stappen ondernomen moeten worden voor het berekenen van een geschikte sample size voor non–inferiority studies in het algemeen, waar het specifieke probleem onder valt. Het Probleem Doel is het onderzoeken of de testgroep niet slechter scoort dan de controle groep. Hiervoor is geen specifieke voorkennis over de scores van de controle groep noodzakelijk. Wel is het nodig dat de onderzoeker a priori een keuze maakt over de ondergrens van non– inferiority. De onderzoeker moet daarnaast overtuigd zijn dat de steekproefvariantie van de testgroep en de controle groep bij benadering gelijk zullen zijn. De Analyse Er zijn twee groepen die in een between–design met elkaar vergeleken worden, in principe wordt gebruik gemaakt van een non–paired T–test (paired is mogelijk, maar geeft een hoop extra werk). In dit geval gaat het erom dat het steekproefgemiddelde van de testgroep, µt niet inferieur is aan dat van de controle groep, µc . In statistische termen: als µt significant hoger is dan µc − δ is er sprake van non–inferiority (zie Figuur 1). De keuze van δ hangt hierbij af van de keuze van de onderzoeker. Hoe kleiner de gekozen δ, des te lager zal de power zijn (of anders gezegd, des te groter moet de sample size zijn voor dezelfde power). Cohen geeft als richtlijnen bij δ = 0.2 te spreken van een kleine afwijking, bij δ = 0.5 te spreken van een middelmatige afwijking en bij δ = 0.8 te spreken van een grote afwijking. Na het kiezen van de δ kunnen we aan de slag. Om de power van de T–test te kunnen berekenen is de niet–centrale T–verdeling noodzakelijk. Deze kansverdeling is helaas te complex om een directe berekening van de bewuste kans mogelijk te maken. In plaats daarvan gebruiken we een standaardnormale benadering van de non–centrale T–verdeling (Zelen & Severo, 1979): " −.5 # 1 t2 P (Tν,λ < t) = P Z < t 1 − −λ 1+ . (1) 4ν 2ν √ met λ = δ n. Met deze formule kun je voor een gegeven δ en n de power berekenen, je moet dit echter wel voor iedere n opnieuw doen. Hoewel het (met de juiste statistische DONSTAT δ 2 µc Figure 1. Steekproefverdeling van de gemiddelde score van de controle groep. µt dient significant hoger te zijn dan µc − δ voor non–inferiority. tabellen) zeker mogelijk is dit allemaal handmatig uit te rekenen, valt de computer toch te adviseren. Figuur 2 bevat drie panels met de power voor verschillende steekproefgroottes voor respectievelijk δ = 0.2, 0.5 en 0.8. De figuur toont dat wanneer gekozen wordt voor een power van 1 − β = 0.8, de steekproefgrootte 150 moet zijn voor δ = 0.2. Voor δ = 0.5 is een steekproefgrootte van 26 voldoende en voor δ = 0.8 is een steekproefgrootte van 11 al genoeg. 3 DONSTAT Power for δ = .8 1.0 1.0 0.8 0.8 Power Power Power for δ = .2 0.6 0.4 0.2 0.6 0.4 0.2 0.0 0.0 0 50 100 150 200 n 0 10 20 30 40 50 n Power for δ = .5 1.0 Power 0.8 0.6 0.4 0.2 0.0 0 10 20 30 40 50 n Figure 2. Power voor verschillende steekproefgroottes voor δ = 0.2 (linksboven), δ = 0.5 (linksonder) en δ = 0.8 (rechtsboven). DONSTAT 4 References Zelen, M., & Severo, N. C. (1979). Probability functions. In M. Abramowitz & I. A. Stegun (Eds.), Handbook of mathematical functions. New York: Dover.
© Copyright 2025