מבוא לניתוח שונות חד כיווני

‫‪ONE WAY ANOVA‬‬
‫)‪(ANALYSIS OF VARIANCE‬‬
‫אנובה חד כיוונית‬
‫האם קיים שוני מובהק בין מספר קבוצות‬
‫ביחס למשתנה התלוי?‬
‫מבחן אנובה חד כיוונית‬
‫במבחן זה נשתמש כאשר נרצה לגלות האם קיימים הבדלים בין כמה קבוצות (‪ 3‬קבוצות‬
‫ומעלה) ביחס למשתנה תלוי‪.‬‬
‫למשל‪ ,‬האם קיימים הבדלי משקל (משתנה תלוי) בין תושבים באריאל‪ ,‬בתל אביב ובחיפה‬
‫(מקום מגורים – משתנה בלתי תלוי)‪.‬‬
‫כלומר משתנה בלתי תלוי אחד בעל ‪ 3‬רמות (ערכים) או יותר (‪ 2‬רמות (ערכים) זה מבחן ‪t‬‬
‫וניתוח שונות זה הרחבה של ‪ )t‬ומשתנה תלוי אחד‪.‬‬
‫השערת המחקר‪:‬‬
‫יימצא הבדלים מובהקים בין המשתנים הבלתי תלויים בממוצע המשתנה התלוי‬
‫למשל‪ :‬יימצא הבדל מובהק בהישגי המבחן הפסיכומטרי בין תלמידים בהתאם לסוג המוסד‬
‫בו למדו (אולפנא‪ ,‬ישיבה‪ ,‬תיכון‪ ,‬ממלכתי)‪.‬‬
‫בכל ניתוחי השונות‪:‬‬
‫המשתנה הבלתי תלוי הוא בדיד – קטיגוריאלי‬
‫המשתנה התלוי הוא רציף בסולם רווחי או מנה‬
‫הנתונים לניתוח‬
‫מסלול פקודות ה‪ SPSS-‬ל‪ANOVA-‬‬
‫לכאן יוכנסו‬
‫המשתנים התלויים‬
‫לכאן יוכנס‬
‫המשתנה הבלתי‬
‫תלוי‬
‫בקשת ממוצעים‬
‫בקשת‬
POST-HOC
Scheffe
Continue+ Ok
‫הפלט‬
‫סטטיסטיקה תיאורית‬
‫סטיית התקן‬
‫של כל המדגם‬
‫‪S=2.06706‬‬
‫מושגי ניתוח שונות‬
‫•מושגי ניתוח שונות מבוססים על שלבי חישוב סטיית התקן‪.‬‬
‫א‪ .‬שוני = סכום רבועים ‪ -‬שלב ראשון בחישוב סטיית תקן (‪ )SS‬לאחר הפחתת הממוצע‬
‫מכל ציון העלאה בריבוע של כל הפחתה‪ .‬הסכום שלהם הוא סכום הרבועים‬
‫ב‪ .‬שונות = ממוצע סכום ריבועים – שלב שני בחישוב סטיית תקן (‪)MS‬‬
‫ג‪ .‬סטיית תקן= שורש ממוצע סכום הריבועים‬
‫•דרגת חופש (‪ =)df‬מספר התצפיות (הנבדקים) שעליו מבוסס ניתוח סטטיסטי (כמו‪:‬‬
‫חישוב ממוצע‪ ,‬שונות וכד') פחות מספר (ההגבלות המוטלות עליהן לפי מספר) המדדים‬
‫(המשתנים או הקבוצות במשתנה) המחושבים‪.‬‬
‫על כל חישוב אני "מקריבים" מספר נבדקים‪ :‬למשל‪ :‬במבחן ‪ T‬שני נבדקים‬
‫ובניתוח שונות חד כיווני מספר הקבוצות פחות ‪1‬‬
‫‪dft=N-1‬‬
‫•דרגת חופש כללית תמיד שווה‬
‫סטטיסטיקה היסקית‬
‫מובהקות‬
‫‪p‬‬
‫ממוצע סכום‬
‫ריבועים =שונות‬
‫דרגות‬
‫חופש‬
‫סכום ריבועים‬
‫= שוני‬
‫משתנה‬
‫תלוי‬
‫מקור השונות‬
‫=‪MSB‬‬
‫=‪dfb‬‬
‫=‪dfw‬‬
‫=‪MSW‬‬
‫=‪dft‬‬
‫=‪SSB‬‬
‫=)‪SSW(sse‬‬
‫=‪SST‬‬
‫‪SSB +SSW =SST‬‬
‫‪42.000+5.000=47.000‬‬
‫‪Dfb +Dfw =Dft‬‬
‫‪2.000+9.000=11.000‬‬
‫חלק המוסבר‬
‫החלק הלא‬
‫מוסבר‬
‫כללי‬
‫טבלת ניתוח שונות ‪ANOVA‬‬
‫‪Sig.‬‬
‫‪.000‬‬
‫‪F‬‬
‫‪Mean Square‬‬
‫‪df‬‬
‫‪Sum of Squares‬‬
‫ממוצע סכום הרבועים‬
‫(שונות)‬
‫דרגות חופש‬
‫סכום הרבועים‬
‫=‪F=MSB/MSW‬‬
‫=‪MSB=SSB/dfb‬‬
‫=‪21.000/0.556‬‬
‫=‪42.000/2‬‬
‫‪37.800‬‬
‫‪21.000‬‬
‫(שוני)‬
‫"בין קבוצות"‬
‫‪dfb =k-1= 2‬‬
‫‪SSB = 42.000‬‬
‫החלק המוסבר‬
‫‪Between Groups‬‬
‫"בתוך הקבוצות"‬
‫=‪MSW=SSW/dfb‬‬
‫=‪5.000/9‬‬
‫ציון בעברית‬
‫מקור השונות‬
‫‪dfw=N-k= 9‬‬
‫‪SSW (SSE) = 5.000‬‬
‫‪= .556‬‬
‫החלק הלא מוסבר‬
‫(שגיאה או שארית‬
‫ההבדלים‬
‫האידיבידואליים)‬
‫‪Within Groups‬‬
‫=‪MST=SST/dft‬‬
‫=‪47.000/11‬‬
‫‪4.273‬‬
‫(שורש של ‪ MST‬הוא‬
‫סטיית התקן של כל‬
‫המדגם‬
‫‪) s=2.067‬‬
‫‪dft =N-1=11‬‬
‫‪SST = 47.000‬‬
‫סך הכל במדגם‬
‫‪Total‬‬
‫מפתחות‪:‬‬
‫‪ dfb‬דרגות חופש מוסברת ‪k-1‬‬
‫‪ SSB‬סכום ריבועים=שוני‬
‫מספר הקבוצות (רמות‪ ,‬ערכי המשתנה)‬
‫מוסבר‬
‫פחות ‪1‬‬
‫‪ SSW‬סכום ריבועים=שוני לא ‪ dfw‬דרגות חופש לא מוסברת ‪N-k‬‬
‫מספר הנבדקים פחות מספר הקבוצות‬
‫מוסבר‬
‫‪ dft‬דרגות חופש כלליות ‪N-1‬‬
‫‪ SST‬סכום ריבועים=שוני‬
‫מספר נבדקים פחות ‪1‬‬
‫כללי‬
‫‪ MSB‬שונות מוסבר‬
‫‪ MSW‬שונות לא‬
‫מוסבר‬
‫‪ MST‬שונות כללית‬
‫•ערך ‪= F‬שונות מוסברת (בין קבוצות) (‪ )MSB‬חלקי שונות לא מוסברת (בתוך קבוצות) (‪.)MSW‬‬
‫בדוגמה ‪ 21 :‬לחלק ל‪ 9-‬שווה ‪37.80‬‬
‫• יחס שוני מוסבר אטא בריבוע (כמו ‪ =) R2‬סכום רבועים מוסבר (‪ )SSB‬חלקי סכום ריבועים כללי‬
‫(‪ .)SST‬בדוגמה‪ 42 :‬לחלק ל‪ 47-‬שווה ‪ . 0.89‬כלומר‪:‬‬
‫ההבדלים בין קבוצות הגיל (משתנה בלתי תלוי) מסבירים ‪ 89%‬מהשוני (מההבדלים) הקיים בין‬
‫הנבדקים בציוני העברית (המשתנה התלוי)‪.‬‬
Multiple Comparisons
Dependent Variable: ‫ציון בעברית‬
Scheffe
(I) ‫( קבוצות גיל‬J) ‫קבוצות‬
Mean
‫גיל‬
Difference (I-J)
‫צעירים‬
‫מתבגרים‬
‫מבוגרים‬
Std.
Error
Sig.
95% Confidence Interval
Lower Bound Upper Bound
‫מתבגרים‬
1.50000
.52705
.056
-.0378
3.0378
‫מבוגרים‬
-3.00000*
.52705
.001
-4.5378
-1.4622
‫צעירים‬
-1.50000
.52705
.056
-3.0378
.0378
‫מבוגרים‬
-4.50000*
.52705
.000
-6.0378
-2.9622
‫צעירים‬
3.00000*
.52705
.001
1.4622
4.5378
‫מתבגרים‬
4.50000*
.52705
.000
2.9622
6.0378
*. The mean difference is significant at the 0.05 level.
Homogeneous Subsets
‫ציון בעברית‬
Scheffe
‫קבוצות גיל‬
N
Subset for alpha = 0.05
1
2
‫מתבגרים‬
4
2.5000
‫צעירים‬
4
4.0000
‫מבוגרים‬
4
Sig.
7.0000
.056
1.000
Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 4.000.
‫הדיווח‪:‬‬
‫‪ ‬על מנת לבחון האם קיימים הבדלים בין נבדקים משלוש‬
‫קבוצות גיל נערך ניתוח שונות חד כיווני שהעלה תוצאה‬
‫מובהקת‪.F(2,9)=37.800, p<.001 ,‬‬
‫‪( ‬דגם הכתיבה ‪(F(dfb, dfw)=f, p><0.001‬‬
‫‪ ‬לבדיקת מקור ההבדלים נערך ניתוח המשך ‪Post Hoc‬‬
‫מסוג ‪ Scheffe‬שהראה כי ההישגים בעברית בקרב‬
‫המבוגרים (‪ (M=7.00 SD=1.15‬גבוה יותר מההישגים‬
‫של המתבגרים (‪ ,(M=2.50, SD=0.58‬ומההישגים של‬
‫הצעירים (‪ (M=4.00, SD=0.00‬באופן מובהק‬
‫(‪ . (p<.05‬לעומת זאת קבוצות הצעירים והמתבגרים לא‬
‫נבדלו זה מזה באופן מובהק בהישגיהם‪.‬‬