Sample size calculation and how to prepare for analysis? รุงทิวา หมืน่ ปา กลุมงานเภสัชกรม โรงพยาบาลลําปาง ………………………………………………………………………………………………………………… ประชากร (Population) หมายถึง สิง่ ตางๆ ทัง้ หมดที่ผวู ิจัยสนใจ ซึง่ อาจเปนกลุมของสิ่งของ คน หรือ เหตุการณตางๆ หนวยวิเคราะห (Unit of Analysis) หนวยของประชาการที่จะศึกษา ที่ใชสําหรับคํานวณขนาดตัวอยาง เชน จํานวนผูปวย จํานวนใบสั่งยา จํานวนครั้งที่สั่งใชยา จํานวนครั้งที่ฉีดยา จํานวนแผลผาตัด ตัวอยาง (Sample) หมายถึง หนวยของขอมูลบางสวนที่ผูวิจัยเลือกมาเพื่อใชเปนตัวแทนของประชากรที่ นํามาศึกษา โดยกลุมตัวอยางที่ดีประกอบไปดวย การเปนตัวแทนที่ดีมีลักษณะตางๆที่สําคัญครบถวน เหมือนประชากร มีขนาดและวิธีการสุมตัวอยางที่เหมาะสม การคํานวณขนาดตัวอยาง (Sample size calculation) การคํานวณขนาดตัวอยางเปนขั้นตอนที่สําคัญในการศึกษาวิจัย เนื่องจากถาขนาดตัวอยางนอยไป จะทําใหสรุปผลการวิจัยไมได ถามากไปก็จะสิ้นเปลืองโดยใชเหตุ ขนาดตัวอยางยังมีผลโดยตรงตอความ นาเชื่อถือของการสรุปผลงานวิจัย การคํานวณขนาดตัวอยางลวงหนากอนทําวิจัยจะชวยใหผูวิจัยสามารถ ตัดสินใจและเตรียมการตางๆไดลวงหนาไวกอนลงมือ องคประกอบสําคัญที่ใชประกอบการกําหนดขนาด ตัวอยาง โดยสรุปคือ 1. ตองทราบวา end point หรือ คําตอบที่ผูวิจัยตองการ คืออะไร เชน ตองการทราบคาเฉลี่ย หรือ คารอยละ (สัดสวน หรือ อัตรา) 2. ลั ก ษณะประชากร ความเป น เอกพั น ธ (Homogenous) และความเป น เอนกพั น ธ (Heterogenous) ของประชากร ทราบขนาดประชากรหรือไม ขนาดเล็ก หรือ ขนาดใหญ 3. สถิติที่ใชวิเคราะหขอมูล 4. ประเภทการวิจัยหรือแบบแผนงานวิจัย เชน กรณีที่เปนแบบแผนการวิจัยแบบไมทดลอง กลุม ตัวอยางตองมีขนาดใหญกวาแบบแผนการวิจัยแบบทดลองหรือแบบกึ่งทดลอง 5. ระดับนัยสําคัญของสมมติฐานที่ทดสอบ type I error, คา confident interval 6. ประเภทสมมติฐานที่ทดสอบ one tailed หรือ two -tailed 7. ขนาดอิทธิพล (Effect Size) หมายถึง ขนาดความแตกตางของผลลัพธที่คาดวาจะเกิดขึ้น ระหวางกลุม ควบคุม และกลุมทดลอง 8. อํานาจการทดสอบ (Power), type II error 9. ทรัพยากรสนับสนุนการวิจัย ไดแก งบประมาณและกําลังคน การประชุม R2R 2552 ครั้งที่ 1 เรื่อง การพัฒนางานประจําเปนงานวิจัย วันที่ 14 พฤศจิกายน 2551 ณ หองประชุมศูนยแพทยศาสตรศึกษา โรงพยาบาลลําปาง แนวทางการคํานวณขนาดตัวอยาง I ประมาณการคราวๆ จากขนาดประชากร เชน - จํานวนประชากรหลักรอยใชกลุมตัวอยาง 15 – 30% - จํานวนประชากรหลักพันใชกลุมตัวอยาง 10 – 15% - จํานวนประชากรหลักหมืน่ ใชกลุมตัวอยาง 5 – 10 % II คํานวณโดยใชสูตรคํานวณ 2.1 งานวิจัยเชิงสํารวจ (Survey) ก. กรณีไมทราบจํานวนปะชากร ใชสูตรของ W.G.cochran n= P(1 − P)Z 2 d2 เมื่อ n คือ จํานวนกลุมตัวอยางที่ตองการ P คือ สัดสวนของประชากรที่ผูวิจยั ตองการสุม (โดยทัว่ ไปนิยมใชสัดสวน 30% หรือ 0.30) Z คือ ระดับความมัน่ ใจทีก่ ําหนด หรือระดับนัยสําคัญทางสถิติ เชน Z ที่ระดับนัยสําคัญ 0.10 เทากับ 1.65 (ความเชื่อมัน่ 90%) >> Z = 1.65 Z ที่ระดับนัยสําคัญ 0.05 เทากับ 1.96 (ความเชื่อมัน่ 95%) >> Z = 1.96 Z ที่ระดับนัยสําคัญ 0.01 เทากับ 2.58 (ความเชื่อมัน่ 99%) >> Z = 2.58 d คือ สัดสวนความคลาดเคลื่อนที่ยอมใหเกิดขึ้นได (จะตองสอดคลองกับคา Z ที่ระดับความ เชื่อมัน่ นัน้ ๆ) เชน ระดับความเชือ่ มั่น 90% สัดสวนความคลาดเคลื่อนเทากับ 0.10 ระดับความเชือ่ มั่น 95% สัดสวนความคลาดเคลื่อนเทากับ 0.05 ระดับความเชือ่ มั่น 99% สัดสวนความคลาดเคลื่อนเทากับ 0.01 ข. กรณีทราบจํานวนประชากร แตประชากรไมมาก (ตาราง Morgan) ใชสูตร n= เมื่อ P(1 − P) E P(1 − P) + 2 N Z 2 n คือ จํานวนกลุมตัวอยางที่ตองการ N คือ ขนาดประชากร P คือ สัดสวนของประชากรที่ผูวิจยั ตองการสุม (โดยทัว่ ไปนิยมใชสัดสวน 30% หรือ 0.30) Z คือ ระดับความมัน่ ใจทีก่ ําหนด หรือระดับนัยสําคัญทางสถิติ เชน Z ที่ระดับนัยสําคัญ 0.10 เทากับ 1.65 (ความเชื่อมัน่ 90%) >> Z = 1.65 2 Z ที่ระดับนัยสําคัญ 0.05 เทากับ 1.96 (ความเชื่อมัน่ 95%) >> Z = 1.96 (ปกตินิยม ระดับความเชื่อมั่น 95%) Z ที่ระดับนัยสําคัญ 0.01 เทากับ 2.58 (ความเชื่อมัน่ 99%) >> Z = 2.58 E คือ คลาดคลาดเคลื่อนของกลุมตัวอยาง เชน ระดับความเชือ่ มั่น90% สัดสวนความคลาดเคลื่อนเทากับ 0.10 ระดับความเชือ่ มั่น95% สัดสวนความคลาดเคลื่อนเทากับ 0.05 (ปกตินิยมระดับความ เชื่อมัน่ 95%) ระดับความเชือ่ มั่น99% สัดสวนความคลาดเคลื่อนเทากับ 0.01 ค. กรณีทราบจํานวนประชากร และประชากรจํานวนมาก (ตาราง Yamane) ใชสูตรของ Taro Yamane n= เมื่อ N 1 + Ne 2 n คือ ขนาดกลุมตัวอยาง N คือ ขนาดประชากร e คือ คลาดคลาดเคลื่อนของกลุมตัวอยาง เชน ระดับความเชือ่ มั่น 90% สัดสวนความคลาดเคลื่อนเทากับ 0.10 ระดับความเชือ่ มั่น 95% สัดสวนความคลาดเคลื่อนเทากับ 0.05 (ปกตินิยมระดับความ เชื่อมัน่ 95%) ระดับความเชือ่ มั่น 99% สัดสวนความคลาดเคลื่อนเทากับ 0.01 2.2 งานวิจัยเชิงวิเคราะห ก. วัตถุประสงคของงานวิจัยตองการหา Incidence หรือ Prevalence ใชสูตร N = Z2α/2 PQ e2 เมื่อ n คือ ขนาดกลุมตัวอยาง Z α/2 คือ The reliability coefficient (= 1.96) P คือ Incidence หรือ Prevalence ของกลุมอางอิง Q คือ 1-P e คือ The margin of error (นิยมใช 0.05) 3 ข. วัตถุประสงคของงานวิจัยตองการเปรียบเทียบคาเฉลี่ย ใชสูตร n= 2 ( Z α Zβ ) 2 S 2 ( X1 − X 2 ) 2 เมื่อ n = ขนาดตัวอยางตอกลุม X 1 แทน คาเฉลี่ยตัวอยางกลุม ที่ 1 X 2 แทน คาเฉลี่ยตัวอยางกลุม ที่ 2 Zα เมื่อ α = 0.05 จะเทากับ 1.96 Zβ เมื่อ β = 0.2 จะเทากับ 0.84 S2 คํานวณจากสูตร S2 = ( n 1 − 1) 2 S12 + ( n 2 − 1)S 22 n1 + n 2 − 2 ค. วัตถุประสงคของงานวิจัยตองการเปรียบเทียบคาสัดสวน ใชสูตร n= ( Z α 2 P1 Q 1 + Z β P2 Q 2 + P1 ( Q 1 ) 2 ( P1 − P2 ) 2 เมื่อ n = ขนาดตัวอยางตอกลุม P1 แทน สัดสวนการเกิดเหตุการณทสี่ นใจในกลุม ที่ 1 P2 แทน สัดสวนการเกิดเหตุการณทสี่ นใจในกลุม ที่ 2 Q1 และ Q2 เทากับ 1- P1 และ 1- P2 ตามลําดับ Zα เมื่อ α = 0.05 จะเทากับ 1.96 Zβ เมื่อ β = 0.2 จะเทากับ 0.84 III คํานวณขนาดตัวอยางโดยใชโปรแกรมสําเร็จรูป 3.1 ใชโปรแกรม Stata ก. Two-sample comparison of mean1 to mean2. Compute sample sizes with n2/n1 = 2 ปอนคําสั่ง sampsi 132.86 127.44, p(0.8) r(2) sd1(15.34) sd2(18.23) สิ่งที่ได Estimated sample size for two-sample comparison of means Test Ho: m1 = m2, where m1 is the mean in population 1 and m2 is the mean in population 2 Assumptions: 4 alpha = 0.0500 (two-sided) power = 0.8000 m1 = 132.86 m2 = 127.44 sd1 = 15.34 sd2 = 18.23 n2/n1 = 2.00 Estimated required sample sizes: n1 = 108 n2 = 216 ข. One-sample comparison of mean to hypothesized value = 180. Compute sample size ปอนคําสั่ง sampsi 180 211, sd(46) onesam สิ่งที่ได Estimated sample size for one-sample comparison of mean to hypothesized value Test Ho: m = 180, where m is the mean in the population Assumptions: alpha = 0.0500 (two-sided) power = 0.9000 alternative m = 211 sd = 46 Estimated required sample size: n = 24 ค. Two-sample comparison of proportions. Compute sample size with n1 = n2 (i.e., ratio = 1, the default) and power = 0.9 (the default) ปอนคําสั่ง sampsi 0.25 0.4 สิ่งที่ได Estimated sample size for two-sample comparison of proportions Test Ho: p1 = p2, where p1 is the proportion in population 1 and p2 is the proportion in population 2 Assumptions: alpha = 0.0500 (two-sided) power = 0.9000 5 p1 = 0.2500 p2 = 0.4000 n2/n1 = 1.00 Estimated required sample sizes: n1 = 216 n2 = 216 ง. One-sample comparison of proportion to hypothesized value = 0.5 ปอนคําสั่ง sampsi 0.5 0.75, power(0.8) onesample สิ่งที่ได Estimated sample size for one-sample comparison of proportion to hypothesized value Test Ho: p = 0.5000, where p is the proportion in the population Assumptions: alpha = 0.0500 (two-sided) power = 0.8000 alternative p = 0.7500 Estimated required sample size: n = 29 3.2 ใชโปรแกรม PS การไดมาซึ่งกลุมตัวอยาง มักไดจากการสุมตัวอยางจากกลุมประชากร ซึ่งมีวธิ ีสุมได 2 แบบ 1. สุมโดยไมคํานึงถึงความนาจะเปน การเลือกกลุม ตัวอยางแบบนี้จะมีลกั ษณะเปนอัตวิสยั (subjective) ซึ่งมักจะทําใหการประมาณ คาพารามิเตอรขาดความแมนยํา จะเลือกใชเมื่อไมตองการอางอิงถึงลักษณะประชากร สวนใหญจะใชกับ งานวิจยั สํารวจขอเท็จจริง (Exploration research) กับกลุมที่มีลกั ษณะเฉพาะและไมตองการเปรียบเทียบ กับกลุมอืน่ ๆ มีขอจํากัดเรื่องคาใชจายและเวลา เพราะการเลือกตัวอยางแบบนี้จะมีคาใชจายและใชเวลา นอยกวาการเลือกแบบอาศัยความนาจะเปน สามารถทําการสุมแบบนี้ ได 5 วิธี คือ 1.1 การสุมโดยบังเอิญ (Accidental sampling) เปนการสุมจากสมาชิกของประชากรเปาหมายที่ เปนใครก็ไดทสี่ ามารถใหขอมูลไดครบถวน การสุมโดยวิธีนี้ไมสามารถรับประกันความแมนยําได ซึ่งการ เลือกวิธนี ี้เปนวิธีที่ดอยที่สุด เพราะเปนการเลือกตัวอยางที่มีลักษณะสอดคลองกับนิยามของประชากรที่ สามารถพบไดและใชเปนตัวอยางไดทนั ที 1.2 การสุมแบบโควตา (Quota sampling) เปนการสุมตัวอยางโดยจําแนกประชากรออกเปนสวนๆ กอน (strata) โดยมีหลักจําแนกวาตัวแปรที่ใชในการจําแนกนัน้ ควรจะมีความสัมพันธกับตัวแปรที่จะ 6 รวบรวม หรือตัวแปรที่สนใจ และสมาชิกทีอ่ ยูแตละสวนมีความเปนเอกพันธ ในการสุมแบบโควตา นี้มี ขั้นตอนการดําเนินการดังนี้ 1.2.1 พิจารณาตัวแปรที่สัมพันธกับลักษณะของประชากรที่คําถามการวิจัยตองการที่จะ ศึกษา เชน เพศ ระดับการศึกษา 1.2.2 พิจารณาขนาดของแตละสวน (segment) ของประชากรตามตามตัวแปร 1.2.3 คํานวณคาอัตราสวนของแตละสวนของประชากร กําหนดเปนโควตาของตัวอยางแต ละกลุมที่จะเลือก 1.2.4. เลือกตัวอยางในแตละสวนของประชากรใหไดจํานวนตามโควตา 1.3 การสุมตัวอยางเฉพาะเจาะจง (purposive sampling) หรือบางครั้งเรียกวาการสุม แบบ พิจารณา (judgment sampling) เปนการสุมตัวอยางโดยใชดุลพินิจของผูวิจัยในการกําหนดสมาชิกของ ประชากรทีจ่ ะมาเปนสมาชิกในกลุมตัวอยาง วามีลักษณะสอดคลองหรือเปนตัวแทนที่จะศึกษาหรือไม ขอจํากัดของการสุมตัวอยางแบบนี้คือไมสามารถระบุไดวาตัวอยางที่เลือก จะยังคงลักษณะดังกลาวหรือไม เมื่อเวลาเปลี่ยนไป 1.4 การสุมกลุม ตัวอยางตามสะดวก (convenience sampling) การเลือกกลุม ตัวอยางโดยถือเอาความสะดวกหรือความงายตอการรวบรวมขอมูล ขอจํากัดของการสุมแบบนี้จะมี ลักษณะเหมือนกับการสุมโดยบังเอิญ 1.5 การสุมตัวอยางแบบสโนวบอลล (snowball sampling) เปนการเลือกตัวอยางในลักษณะการ สรางเครือขายขอมูล เรียกวา snowball sampling โดยเลือกจากหนวยตัวอยางกลุม แรก (จะใชหรือไมใช ความนาจะเปนก็ได) และตัวอยางกลุมนี้เสนอบุคคลอื่นทีม่ ีลักษณะใกลเคียงตอๆไป ขอจํากัดของการสุมโดยไมอาศัยความนาจะเปน 1. ผลการวิจยั ไมสามารถอางอิงไปสูประชากรทั้งหมดได จะสรุปอยูในขอบเขตของกลุมตัวอยาง เทานัน้ ขอสรุปนั้นจะสรุปไปหาประชากรไดตอเมื่อกลุมตัวอยางมีลักษณะตางๆที่สาํ คัญๆ เหมือนกับประชากร 2. กลุมตัวอยางที่ไดนั้นขึน้ อยูก ับการตัดสินใจของผูวิจัยและองคประกอบบางตัวที่ไมสามารถควบคุม ได และไมมีวิธกี ารทางสถิติอยางไรทีจ่ ะมาคํานวณความคลาดเคลื่อนที่เกิดจากการสุม (sampling error) 2. สุมโดยคํานึงถึงความนาจะเปน (probability sampling) หลักการเลือกกลุมตัวอยางเพื่อใหเปนตัวแทนที่ดีของประชากร ทําได 5 วิธี คือ 2.1 การสุมตัวอยางอยางงาย (Simple random sampling) เปนการสุม ตัวอยางทีเ่ ปดโอกาสใหแต ละตัวอยางมีโอกาสถูกเลือกเทาๆกันนั่นแสดงวา ลักษณะของประชากรมีการกระจายกันดีอยูแลว การที่จะ สุมโดยปกติกจ็ ะไดตัวแทนของประชากรอยูแลว 7 2.2 การสุมตัวอยางแบบมีระบบ (Systematic random sampling) ใชในกรณีกลุมประชากรที่จะ ทําการสุม ไดถูกจัดไวเปนระบบอยูแลว เชน เรียงตาม HN เรียงลําดับตามบัญชีรายชื่อในการเขารับการ รักษา หรือ ครัวเรือนตามบานเลขที่ เราสามารถจัดระบบโดยนําทุกๆลําดับที่ 5 หรือ 10 มาเปนตัวอยาง โดย พื้นฐานความเชื่อที่วา ประชากรคละกันอยูในระบบทีถ่ ูกจัดไวอยูแลว 2.3 การสุมตัวอยางแบบกลุม (Cluster random sampling) โดยสุมตัวอยางจากแตละกลุม เพราะ เชื่อวาแตละกลุมเปนตัวแทนของประชากรอยูแลว เชน จะสุมตัวอยางจากแตละหอผูปวย สุม ตามหนวย บริการ เชื่อไดวาผูปว ยในแตละหอนาจะเปนตัวแทนของประชากรไดโดยตรงอยูแลว แตแบง ออกเปนกลุม เพื่อใหกระจายจํานวนตัวอยางออกไปตามหนวยตางๆ ใหครอบคลุมลักษณะประชากร 2.4 การสุมตัวอยางแบบแบงชั้น (Stratify random sampling) โดยแบงออกเปนชัน้ (strata) เสียกอนเพราะมีความเชื่อวาประชากร มีความแตกตางกันมากตามตัวแปรคุณลักษณะ ไดแก เพศ อายุ ระดับการศึกษา ระดับความรุนแรงของโรค ฯลฯ ดังนัน้ การแยกตัวแปรเหลานี้ออกมาเปนชัน้ เพื่อกระจายให ตัวอยางที่ไดรับเลือกมีโอกาสเปนตัวแทนของทุกชัน้ ก็จะทําใหไดตัวแทนที่ดียงิ่ ขึ้น 2.5 การสุมตัวอยางแบบหลายขัน้ (Multi-stage random sampling) เปนการนําเอาวิธกี ารสุม ตัวอยางทุกแบบมาประยุกตใชโดยแบงการสุมตัวอยางออกเปนหลายขั้นตอนตางๆ เชน ขั้นตอนที่ 1 การสุมตัวอยางแบบแบงชั้น ขั้นตอนที่ 2 การสุมตัวอยางอยางงาย ขั้นตอนที่ 3 การสุมตัวอยางแบบกลุม ขั้นตอนที่ 4 การสุมตัวอยางแบบมีระบบ ในการสุม ตัวอยางแบบหลายขั้นไมจําเปนจะตองใชการสุมตัวอยางทุกวิธีเพียงแตหมายความวา ใชวิธีการสุมเปนขั้นหลายครั้งตั้งแต 2 ขั้นขึ้นไป และในแตละขั้นจะใชวิธีการสุมแบบใด ๆ ก็ได การเตรียมการวิเคราะห (Prepare for analysis) 1. เตรียมขอมูล (Data) อาศัยขอมูลจากแบบเก็บขอมูล แลวนําตัวแปรตางๆ มาจัดทํารหัสสําหรับการ วิเคราะห 2. การลงขอมูลในโปรแกรมวิเคราะห (Data filling) ขึ้นกับการเลือกใชโปรแกรมที่นาํ มาวิเคราะห ซึง่ โปรแกรมสวนใหญ จะวิเคราะห ไดงายขึ้น ถาลงขอมูลเปนตัวเลข 3. การวิเคราะหขอมูล (Data analysis) สวนใหญอาศัยโปรแกรมสําเร็จรูปในการวิเคราะหขอมูลที่ซับซอน (ดูตัวอยาง การเตรียมขอมูลสําหรับการวิเคราะห จากเอกสารที่แนบมาดวย) ……………………………………………………………………………………………………………………………………………………………………………………………………………………………………. 8
© Copyright 2026