ממודל למסקנות , מתיאוריה להשערות : מפגש ראשון חזרה

‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫מפגש ראשון‪ :‬מתיאוריה להשערות‪ ,‬ממודל למסקנות‬
‫חזרה על עקרונות המחקר האמפירי הכמותי והיכרות עם ‪SPSS‬‬
‫שעה ‪ – 0‬חשיבה כמותית‪ ,‬שיטות מחקר כמותיות‪ ,‬רקע‪ ,‬כלי מחקר‪ ,‬מגבלות‪.‬‬
‫שעה ‪ - 2‬שיטות דגימה‪ ,‬דגימה אקראית‪ ,‬דגימה שיטתית ויעילות הדגימה‪.‬‬
‫שעה ‪ – 3‬ארגון נתונים‪ ,‬מסד הנתונים‪ ,‬מבנהו ומרכיביו‪ ,‬היכרות עם ‪SPSS‬‬
‫שעה ‪ - 4‬הצגה תיאורית של הנתונים‪ SPSS ,‬ניתוח תיאורי‪ SPSS ,‬בונה איורים‬
‫מטלה‪ :‬הצגת נתוני מדגם‬
‫‪..........‬‬
‫תיאור התופעה‪-‬‬
‫השיטה המדעית אומרת כי מצב המוצא‪ ,‬כלומר השערת האפס‪ ,‬היא ההשערה שיש לדחות‪.‬‬
‫כאשר אנו מדברי על מדרג אנו מדברים על אפשרות לחריגות פרמטרית‪ ,‬בגלל שאנו מדברים על‬
‫מדרג (מבחן ‪ -)ANOVA ,t‬ניתן לסדר אותם לפי מדרג‪ ,‬והמדע תמיד כופה עלינו להיות שונים במחקר‬
‫שעשינו על‪-‬מנת שנוכל לדווח על משהו חריג‪.‬‬
‫רגרסיה‪-‬‬
‫יכולת חיזוי‪ -‬אחד הכלים החשובים ביותר במודל הוא שהמודל מייצר חיזוי‪ .‬החיזוי הוא חשוב‪ :‬אם יש‬
‫אדם ששכרו מסוים‪ ,‬וידועים לי נתונים נוספים לגביו‪ ,‬נוכל לבצע חיזוי לגבי גורמים נוספים בזכות‬
‫אותם משתנים ידועים (לאיזו קבוצה הוא שייך‪ ,‬מהי האידיאולוגיה הפוליטית‪ -‬ומה המודל מניח לגבי‬
‫אותו פרט בעל מאפיינים אלה)‪.‬‬
‫ניתוח מדיניות‪ -‬לוקחים את אותה אקסטרפולציה (אותה אינדוקציה) ומשליכים ומיישמים על אחרים‪.‬‬
‫אם בנינו מודל על הקשר בין חינוך לתוצר‪ ,‬נוכל לנתח מדיניות הבוחנת שיפור תנאי חינוך כתנאי‬
‫לשיפור בתעסוקה‪.‬‬
‫בפרק הדיון והמסקנות צריך תמיד לזכור שאנחנו פיתחנו כלי שחשוב לבדוק אותו‪ -‬מה יקרה אם‬
‫נעשה מדיניות שיהיו בה ערכים קצת שונים? האם הכלי מספק חיזוי מושלם? לא‪ ,‬אבל הוא מספק‬
‫חלק מן התמונה‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫מהנקודה של ניסוח השערות‪ ,‬בו מסכמים למעשה את החלק התיאורטי‪ .‬השערת מחקר היא מחוברת‬
‫לתיאוריה‪ ,‬משהו שדנים בו ברמה התיאורטית‪ ,‬ומבוססת על התיאוריה ולכן היא הבסיס לכל העבודה‬
‫שלנו‪ .‬לאחר שסיימנו לנסח את ההשערות‪ ,‬סיימנו את התיאוריה ומתחילים לנסח את החלק‬
‫האמפירי‪:‬‬
‫‪‬‬
‫מה אנו רוצים לאסוף (אילו נתונים?)‪,‬‬
‫‪‬‬
‫איך (מהו מערך המחקר?)‬
‫מרגע שיש לנו מערך מחקר אנו מתחילים לתרגם את ההשערות‪ ,‬הכוללות את הקשר בין המשתנים‪,‬‬
‫לרמה האופרציונלית‪:‬‬
‫‪‬‬
‫איך אנו מודדים זאת? מערך המחקר מתאר כיצד אנו רוצים למדוד‪.‬‬
‫לשם כך עלינו‪ ,‬ראשית כל‪ ,‬להגדיר מהי אוכלוסיית היעד? יש תחומים שיש בהם מעט מאוד תיאוריה‬
‫וסביר להניח שיהיה לנו קשה להגדיר מהי אוכלוסיית המחקר כי אין לנו תיאוריה להתבסס עליה‪.‬‬
‫אוכלוסיית המחקר היא האוכלוסייה שתספק עבורנו את התשובות לשאלות ששאלנו‪.‬‬
‫מספר מערכי מחקר מעניינים‪....‬‬
‫שלב התרגום מתיאוריה למחקר אמפירי ‪ -‬מערכי מחקר אפשריים‪:‬‬
‫‪‬‬
‫מדידות על‪-‬פני זמן‬
‫‪‬‬
‫ניסוי במעבדה (ניסוי מבוקר בו אנו יכולים לשלוט בתגובות של התצפית)‬
‫‪‬‬
‫‪ -Cross section‬כשלוקחים תצפית ובוחנים אותה על גבי חתך של כל המימדים המעניינים‬
‫אותנו עבור אותה תצפית‪.‬‬
‫עדיין בשלב תכנון המחקר‪ -‬עלינו לדעת כמה תצפיות עלינו לאסוף?‬
‫עבור התשובה לגבי כמה צריך לדגום יש לפנות למשפט הגבול המרכזי‪:‬‬
‫משפט הגבול המרכזי‪ -‬כל ההסקה הסטטיסטית מבוססת על משפט הגבול המרכזי‪ :‬משפט הגבול‬
‫המרכזי מאפשר לנו להסיק מהפרט אל הכלל‪ .‬אנו מבצעים מדגם המייצג את האוכלוסייה‪ .‬יש לנו‬
‫כמה מרכיבים במשפט הגבול המרכזי בהם אנו יכולים לשלוט ובעזרתם אנו יכולים לומר שאם אנו‬
‫מעוניינים שתצא רמת מובהקות גבוהה עלינו להשתמש ביותר תצפיות‪.‬‬
‫עלינו לבחור קריטריונים שיספקו את הקהילה המדעית בתחום בו אנו עוסקים‪.‬‬
‫אנו רוצים לדגום ‪ n‬נדגמים‪ -‬תוספת מידע=תוספת מהימנות‪.‬‬
‫גודל המדגם מבוסס על רווח בר‪-‬סמך‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪( Z2X‬להשלים את הנוסחה מהדף)‬
‫לאמוד שונות באוכלוסייה הינה יותר אמינה מאשר אמידת ממוצע האוכלוסייה‪.‬‬
‫כאשר המשתנה שלנו ‪..‬‬
‫יש פעמים שמשתנה המחקר או משתנה המחקר מנוסחים בפרופורציות‪:‬‬
‫כשמשתנה מחקר הוא דיכוטומי הוא מתפלג נורמלית בקירוב טוב מאוד ולכן משתמשים ב ‪ Z‬הנורמלי‬
‫הרגיל שאנו מכירים‪.‬‬
‫אם בפועל דגמנו ‪....‬‬
‫כאשר יצאנו לשוק ודגמנו שם‪ ,‬אבל אנו רוצים לחקור סטודנטים‪ ,‬אז אנו בבעיה‪ -‬עלינו להתמקד‬
‫באוכלוסיית המחקר‪ .‬ניתן להשתמש בשני כלים מאוד מקובלים להתמקד באוכ המחקר‪:‬‬
‫‪‬‬
‫מדגם שכבות‪ :‬אם אנו רוצים שהמדגם יהיה פחות או יותר בהתאם למדגם האוכלוסייה (אשר‬
‫למשל‪ ,‬כוללת ‪ 31%‬סטודנטים‪ 21% ,‬קשישים ו‪ 01%‬בין הגילאים ‪.)41-01‬‬
‫‪‬‬
‫מדגם אשכולות‪ :‬לדוגמה אם אנו מעוניינים באוכ' סטודנטים‪ ,‬נלך לאוניברסיטה‪ ,‬נדגום שם‬
‫אשכול העונה על אוכ' המדגם שלנו ונדגום אותו‪.‬‬
‫‪‬‬
‫מדגם שיטתי‪ :‬כל בניין רביעי‪ ,‬למשל‪.‬‬
‫הרבה פעמים מומלץ להיות אינטואיטיביים בהתאם לאוכלוסיית המחקר שבחרנו ואיזו שיטת דגימה‬
‫הטובה ביותר לשם כך‪.‬‬
‫סוגי משתנים‬
‫איך אנו רוצים לתרגם ולדגום את ההשערות? דרך המשתנים‬
‫שם משתנה‬
‫תלוי‬
‫בלתי‪-‬תלוי‬
‫נומינאלי‬
‫אורדינאלי‬
‫רציף‬
‫**טבלאות מוכרות‪ -‬מומלץ להשתמש בהן במחקר‬
‫מדידות‪ -‬האופרציה של המשתנים‪:‬‬
‫בקרה‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪‬‬
‫מדידה ישירה‪ :‬למשל‪ ,‬כששמים אדם על משקל ומציינים את המשקל‪ ,‬גובה באמצעות מטר‪,‬‬
‫טמפ' באמצעות מד‪-‬טמפ'‬
‫‪‬‬
‫מדידה עקיפה‪ :‬יש משהו שבעקיפין מצביע על המדד הזה‪ :‬לדוג'‪ ,‬מה רמת התוצר באיזור‬
‫מסוים? הולכים לחברת החשמל ומבקשים מדד זרימת חשמל באיזור התעשייה‪ .‬המדד שלי‬
‫על סריאוטיפיזציה ותפיסות שחיתות הוא מדד של מדידה עקיפה‪.‬‬
‫‪‬‬
‫מדידה מקורבת‪ :‬כמה מכוניות יש בבית‪ -‬כדי לשהליך על רמת ההכנסה‬
‫עקרונות של ניהול מידע ותיעוד‬
‫כאשר אנו מתחילים לאסוף את הנתונים‪ ,‬להקליד אותם‪ ,‬ויש ים של גרסאות והולכים לאיבוד‪ :‬יש‬
‫דרך לשמור על כל הנתונים והיא באמצעות יומן מעקב הכולל את הנתונים הבאים‪:‬‬
‫‪ .0‬לקודד משתנים‪ -‬לדאוג שיש לנו מפתח קודים לכל משתנה‪ :‬גם לגבי שם המשתנה‪ ,‬כותרת‬
‫המשתנה‪ ,‬מה הסקאלה (‪ ,)1-0 ,0-0‬אם זה קטגוריות‪ :‬מה התכונה של כל קטגוריה? בסוף‬
‫היום לדאוג ולוודא שכל העבודה מקודדת‬
‫‪ .2‬כל הפעולות שעשינו דרך ה‪ ,SPSS-‬לשמור את הפעולות‪ :‬יש דרך לשמור את הפעולות הללו‬
‫ואנו חייבים לשמור את הפעולות בקובץ סינטקס‪ .‬תיעוד של העבודה המעשית שלנו חייב‬
‫להיות מושלם‪.‬‬
‫‪ .3‬הפרוטוקול הוא כלי עבודה‪ -‬יש לשמור על סדר כרונולוגי כדי לזכור מה עשינו מתי‪ .‬וחשוב‬
‫תמיד לעבוד על אותו מחשב כדי לא לדרוס נתונים!‬
‫**קובץ בשם ‪ -GNL‬שומר את כל העבודה וההיסטוריה של העבודה שלנו (במידה ועבדנו על‬
‫אותו מחשב)‪.‬‬
‫‪Output‬‬
‫יוצר לנו פלט‪ -‬ושומר את הנתונים של הפקודות שביקשנו ממנו‪ .‬ניתן לשמור את זה אבל זה עולה‬
‫לנו בהרבה זיכרון‪ .‬יעיל יותר לשמור את קובץ הסינטקס‪.‬‬
‫‪- File- New – Syntax‬‬
‫‪ -Koro problem set for ANOVA‬דוגמה לאיך לעשות מעקב על כל הפעולות שעשינו ב‪SPSS‬‬
‫‪http://psych.colorado.edu/~carey/Courses/PSYC7291/DataSets/Documentation/koro.ht‬‬
‫‪m‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫שני סוגי ערכים‪:‬‬
‫‪Numeric‬‬
‫‪String‬‬
‫יש לעבור על הכול ולוודא שאין מקרים של ברירת מחדל שאינה מתאימה לנו‬
‫בכל פקודה‪ ,‬יש לנו המון תפריטים והמון אפשרויות וכל פקודה ניתן להריץ באמצעות סרגל הכלים או‬
‫לעשות קופי פייסט מהסינטקס‪.‬‬
‫במקום לעשות ‪ ,Run‬כלומר‪ ,‬להריץ את סט הפקודות שיצרנו‪ ,‬יש ללחוץ על ‪ Paste‬במקום ‪,OK‬‬
‫ולהעתיק לסינטקס ומשם אנו נריץ את הפקודה מתי שאנו רוצים‪.‬‬
‫אם רוצים להכניס הערות שלנו יש להכניס * ואז המידע‪ ,‬למשל‪ ,‬תאריך ‪ +‬המידע של מה שעשינו‪ ,‬ואז‬
‫לתעד‪ ,‬לתעד לתעד‪ ,‬ואחרי זה להריץ‪.‬‬
‫איך מריצים? מסמנים את הפקודה בסינטקס ואז לוחצים פליי ירוק (משולש ירוק)‪.‬‬
‫כיום‪ ,‬מגרסה ‪ 01‬ומעלה‪ ,‬יש את האופציה הזאת‪ .‬מה המידע שהוא מספק לנו?‬
‫‪ .0‬איזה ‪ Dataset‬פעיל עכשיו?‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪.2‬‬
‫קשר בצורת ‪ -Log‬כשאנחנו בודקים רגרסיות אנו בודקים מבנה מצרפי‪ ,‬ונניח רוצים לבנות מודל‬
‫מעריכי‪ ,‬אז עלינו ליצור טרנספורמציה‪.‬‬
‫פקודות שגויות ניתן לשנות בתוך בסינטקס עצמו במקום להריץ אותן מחדש‪ Copy :‬ולתקן בפעם‬
‫השנייה שמעתיקים‪.‬‬
‫כשמריצים מהסינטקס הוא מריץ את כל הפקודה עד שהוא מגיע לנקודה‪.‬‬
‫‪Skewness‬‬
‫‪Analyze -‬‬
‫האושר הממוצע מוטה לכיוון הלא מאושרים‪ :‬זוהי א‪-‬סימטריה‪ ,‬כלומר שהמשתנה אינו מתפלג‬
‫נורמאלי ואם אנו משערים כי האושר מתפלג נורמאלית תוצאות הסקר שלנו העלו כי אין הדבר כך‪.‬‬
‫כשאנו עושים רגרסיה ליניארית אנו מניחים שהמשתנים המסבירים מתפלגים נורמלית ואם אנו מגלים‬
‫שהם אינם מתפלגים נורמאלית אז יש לנו הטיות‪ .‬ניתן לתקן את ההטיות באמצעות תקנון אבל צריך‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫לחזור לנתונים‪ .‬הרבה פעמים מתקננים באמצעות ‪ .Log‬במחקר שלי אני צריכה שוב לבדוק אם‬
‫המשתנה מתפלג נורמלית‪ .‬אם ה ‪ skewness‬שונה מאפס אז קיימת הטייה‪.‬‬
‫ניתן לחתוך משתנה רציף לקטגוריות‪Transform -Visual Binning:‬‬
‫מעבירים את המשתנה הרציף‪ ,‬הוא מראה לי את כל הערכים של המשתנה הרציף ואז אני יכולה‬
‫לומר לו באילו נקודות לחתוך את המשתנה הרציף לקטגוריות‪.‬‬
‫‪ -Make cutpoints‬וניתן לבחור שנקודות החיתוך יהיו בסטיות התקן ואז אנו הופכים את המשתנה‬
‫הרציף לקטגוריאלי ולראות אילו נתונים איבדנו\הפסדנו (זה יותר טוב מה‪ recode‬הרגיל(‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫ניתוח רב‪-‬מימדי‪-‬‬
‫למשל‪ ,‬אם רוצים חתך של לבנים‪ ,‬שחורים ואחרים‪ ,‬המחולקים בין שני איזורים‪ :‬צפון ודרום‪ ,‬כולל‬
‫חתך של הגיל‪.‬‬
‫גרפים‬
‫מה ההבדל בין היסטוגרמה ל‪?bars-‬‬
‫היסטוגרמה‪ -‬משתנה רציף‪ ,‬כלומר שהציר המודד את הערכים הוא רציף מנקודה מסוימת לנקודה‬
‫הבאה‪ ,‬ומהנקודה הבאה לנקודה שאחרי‪.‬‬
‫‪ -Bars‬מראה מעל קטגוריה מסוימת‪ -‬מעין סף של קטגוריה‪ Bar charts .‬בד"כ מראה שכיחות‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪ -Boxplot‬נותן אפשרות לרכז בצורה גרפית‬
‫מפגש שני‪ :‬טיפול וטיפול מתקדם בנתונים‬
‫השימוש ב‪ SPSS-‬לטיפול בנתוני מדגם‪ ,‬בניית מדדים וריבוד‬
‫שעה ‪ – 0‬קידוד מחדש של משתנים לפי סוגי משתנים‪ SPSS ,‬טרנספורמציות‪.‬‬
‫שעה ‪ – 2‬ניתוחי שונות וניתוחי המשך‪ SPSS ,‬ניתוח שונות חד‪-‬גורמי ורב גורמי‪.‬‬
‫שעה ‪ – 3‬ניתוח גורמים‪ SPSS ,‬ניתוח גורמים‪.‬‬
‫שעה ‪ – 4‬ניתוח אשכולות‪ SPSS ,‬ניתוח אשכולות‪.‬‬
‫מטלה‪ :‬ניתוח נתוני מדגם‬
‫היום אנו עוברים מהשלב בו בדקנו את הנתונים שלנו מבחינה תיאורית‪ ,‬איך המשתנים מתנהגים‬
‫וכו'‪.‬היום נעשה שני דברים‪:‬‬
‫‪ .1‬נראה סוגים של מתאמים (משתנים רציפים‪ ,‬קטגוריאלים ואורדינאליים) וכלים לבחינת‬
‫המתאמים הללו‪ .‬בסדנה אנו מסבירים את התוצאות שהמחשב מחשב מבלי לנסות להבין‬
‫איך הוא עושה זאת‪ ,‬כך נוכל לבחור בכלים המתאימים לנו מבלי להסביר את החישובים‬
‫הסטטיסטיים ולבזבז זמן‪.‬‬
‫‪ .2‬ניתוח שונות‪ ,‬מבחני ‪ ,t‬מבחנים מזווגים‪ ANOVA ,‬וכו'‪ .‬נעבוד על איסוף נתונים וניתוח‬
‫הגורמים שבשאלון‪ ,‬התוצאות והנתונים‬
‫מבחינה מדעית ההיגיון אומר‪ :‬קודם לחפש מסגרת תיאורטית להסביר את הבעיה בה אנו דנים‬
‫ולאחר‪-‬מכן‪ ,‬דרך אותה מסגרת תיאורטית נשער השערות לגבי הבעיה ונבחן אותן‪.‬‬
‫דרך אחרת אומרת כך שניתן לבצע קודם גישושים ולאחר‪-‬מכן לכתוב את ההשערות‪ :‬כאשר לוקחים‬
‫כמה היגדים ובודקים אותם כמדד אחד – אז ניתן ליישם פקטור אנאליסיס‪ ,‬ואז מגששים לגבי כמה‬
‫קומבינציות‪ ,‬מה מהן ומי מהן חזקה יותר ויציבה יותר ותואמת יותר את ההיגיון‪.‬‬
‫כיום רבים משלבים ביניהם‪ :‬כלומר שילוב של מחקר מאשש ומחקר מגשש‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫כאשר אנו אוספים נתונים אנו למעשה אוספים את המידע בו נשתמש לבצע תחזיות ולהסביר‬
‫התנהגויות‪ ,‬אבל חשוב לזכור שמדובר במדידות סובייקטיביות ולכן חשוב להסביר איך מדדנו ומדוע‬
‫השתמשנו במדדים שבחרנו במסגרת הצגת מערך המחקר‪.‬‬
‫‪ .1‬כאשר אנו בודקים מתאמים אנו חייבים לדעת מהם המתאמים‪ .‬מבחן חי בריבוע‪ ,‬למשל‪ ,‬אינו‬
‫בודק מתאם‪.‬‬
‫אנו מתחילים בפקודת מתאם‪:‬‬
‫מתאם זה תמיד בין שני משתנים‪ :‬כלומר ניתוח דו‪-‬מימדי המצביע על קשר‪ ,‬על כיוון ועלינו להיות‬
‫מאוד זהירים כי לא תמיד הצורה בה אנו חושבים על המשתנה מתאימה למתאם שאנו מציעים‪.‬‬
‫‪‬‬
‫משתנה רציף‪ -‬יכול לקבל את כל הערכים (גובה‪ ,‬משקל) ולרוב יהיה להם טווח ערכים מוגדר‬
‫וברור (אין גובה נמוך מ‪ 1-‬ס"מ)‪ .‬את טווח הערכים נגדיר כהתנהגות נורמלית‪ :‬גובה ‪0.21‬‬
‫למשל עד ‪ 2.31‬ס"מ‪ .‬אנו צריכים לתקנן את המשתנה שמצאנו בשטח שהוא מקרה פרטי של‬
‫התפלגות נורמלית‪ .‬ההתפלגות הנורמלית הסטדנטרטית‪ :‬בה הממוצע הוא ‪ 1‬והשונות היא‬
‫‪.0‬‬
‫‪‬‬
‫יש לנו ציר של סטיות תקן מימים ומשמאל לאפס‪ ,‬אנו מסתכלים על התפלגות אליה אנו‬
‫מתייחסים‪ .‬פירסון מניח התפלגות רציפה ונורמלית‪ .‬אם פירסון מניח התפלגות נורמלית ואנו‬
‫מריצים מתאם בין שני משתנים או יותר (זוגות)‪ ,‬ואנו מודאגים לגבי יחידות המדידה‬
‫(בדידות) או ההתפלגות (אינה נורמלית)‪ -‬מה הסיכוי שנקבל את השערת המחקר? אם נריץ‬
‫אץ אותו המתאם בפירסון ונריץ אותו בספירמן המניח שהמדידות הן בדידות‪ .‬אם אנו מודדים‬
‫בהנחת הרציפות של המשתנה ולאחר מכן הולכים להנחה זהירה יותר‪ ,‬ובודקים ספירמן‪,‬‬
‫פירסון יהיה יותר מובהק כי הוא נותן לנו דרגת חופש גדולה יותר‪ .‬אם לא הצלחנו בפירסון‬
‫לא נצליח באחר‪.‬‬
‫‪‬‬
‫כאשר מוצאים מתאם חיובי אז כשאחד עולה השני עולה‪ ,‬ולהיפך‪.‬‬
‫‪‬‬
‫אם אין בעיה בהתפלגות (‪ )Skewness‬ניתן להתייחס לליקרט כמשתנה רציף‪ .‬צריך לבדוק‬
‫את ההתפלגות של המשתנה‪ ,‬איך היא נראית‪ .‬טיפ‪ :‬אם ראינו שהמשתנה לא עובד כרציף‬
‫כדאי לנו לצמצם את הקטגוריות (מ‪ 4-‬לשלוש‪ ,‬למשל) ולאפיין את המשתנה מחדשף במקום‬
‫כרציף כאורדינאלי או אפילו כנומינאלי‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫העברנו לימין שני משתנים‪:‬‬
‫‪General happiness‬‬
‫?‪Is life exciting‬‬
‫ואז יש שני מבחנים שסימנו‪ :‬פירסון וספירמן‪ .‬במקרה הזה דווקא ספירמן מתאים יותר כי מדובר‬
‫בקטגוריות ‪.1-0-2‬‬
‫‪‬‬
‫כל התצפיות שיש להן ערכים חסרים הן מחוץ ולכן כאשר מדווחים על ניסיון לבצע חתכים‬
‫חשוב מאוד לדווח גם על ה‪ .N-‬יכול להיות שה‪ 011-‬התצפיות שנחתכו יש להן חשיבות ולכן‬
‫חשוב לדווח עליהן‪ .‬כאשר המודל הולך ומתרחב ונרצה לבצע רגרסיות אנו צריכים לצמצמם‬
‫את הדיווח אל תוך הנתונים שהם ‪ valid‬בהתאם לניתוח הממוצע‪ ,‬החציון והשכיח‪.‬‬
‫‪‬‬
‫אם שיערנו כיוון של קשר ניתן לבצע ‪ -one-tailed‬כך למשל אם שיערנו קשר הפוך‪ .‬אם‬
‫מצאנו מובהקות ב‪ two-tailed‬אז בטוח קיימת מובהקות ב‪ .one tailed‬חשוב להבין כי‬
‫ההנחיה לגבי כיוון דורשת מחיר מסוים‪.‬‬
‫‪‬‬
‫המתאם יכול לנוע בין ‪ -0‬ל‪ ,0-‬ויכול להיות קשרה מובהק אך חלש‪.‬‬
‫אם ‪ R=0 -H0‬ו‪( H1-‬השערת החוקר) היא ‪,R≠0‬‬
‫‪‬‬
‫אם הקשר לא ליניארי‪ -‬צריך לשחק עם המשתנה‪ ,‬בו המשתנים לא מתנהגים בצורה‬
‫נורמלית‪ ,‬נראה למשל‪ ,‬בדרגת האושר‪ ,‬מעין ענן‪ ,‬אנו נראה את מה שנקרא תפוקה שולית‬
‫פוחתת (התועלת כשיש הרבה היא נמוכה יותר מאשר כשיש לנו מעט)‪ .‬לכן כדאי לקחת‬
‫טרנספורמוציה מונוטונית שלוקחת את הערכים הגבוהים ומורידה מהם ואת הנמוכים‬
‫ומורידה מהם (נניחו ‪ )log‬ואז נבצע ביניהם קשר וזו דוגמה למשחק כזה‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪‬‬
‫כשאנו באים לדווח על‪-‬כך כן חשובה לנו העובדה שלא הצלחנו למצוא קשר ליניארי ראשון‪,‬‬
‫אך אם אנו מניחים שהקשר אינו ליניארי או שאנו רואים שהתנהגות הקשר הולכת ופוחתת‬
‫ככל שעולים‪ ,‬אז אפשר לשחק כדי לפתח תשובה מעניינת יותר למדוע לא מצאנו קשר‬
‫ליניארי‪.‬‬
‫כלי נוסף לחיפוש אחר קשר הוא ‪ -crosstabs‬זהו כלי דו‪-‬מימדי עבור ניתוח קטגוריאלי לחלוטין‪.‬‬
‫אנו מבצעים מדידה מתוך הנחה שיש שלוש קטגוריות לאושר ושלוש קטגוריות להתרגשות ואנו‬
‫רוצים לראות מה ניתן לדווח‪ .‬זהו לא דיווח עיתונאי‪ ,‬אלא דיווח בהתאם להשערות ולכ"א‬
‫מהמבחנים עומדת מאחוריו השערה מסוימת‪.‬‬
‫‪ -Kappa‬מודד את מידת ההסכמה‪ -‬כלי יעיל במקרים של מטריצה ריבועית (אותו מספר קטגוריות‬
‫בשני המשתנים) וכאשר אנו רוצים למדוד באיזורי זמן שונים (למשל‪ ,‬לפני ואחרי)‪ .‬בודקים‬
‫באמצעות השכיחות המופיעה באלכסון המרכזי (אלכסון ההסכמה) לאורך הטבלה‪ .‬אם השכיחות‬
‫באלכסון הולכת וגדלה אז זה אומר שיש קורלציה קטגוריאלית‪.‬‬
‫חי בריבוע מציין כי קיימת תלות בין השורות לעמודות‪ -‬כלומר‪ ,‬האם כל שורה מתנהגת כמו כלל‬
‫האוכ' או שהיא שונה ממנה‪ .‬בחרנו ספר מבחנים העשויים להעיד על קיומו של קשר‪:‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫חשוב שכל המשתנים יהיו בעלי מספר זהה של ערכים (קטגוריות)‪ ,‬לא עבור חי בריבוע אבלך‬
‫עבור השאר‪.‬‬
‫‪‬‬
‫לא לשכוח לסמן ב‪.Rows & Columns cells -‬‬
‫הערה‪ :‬כאשר יש תאים שיש בהם פחות מחמישה ‪ %‬תאים‪ :‬יש לחשוד בהם‪.‬‬
‫‪ -Koro problem set for ANOVA‬דוגמה לאיך לעשות מעקב על כל הפעולות שעשינו ב‪SPSS‬‬
‫‪http://psych.colorado.edu/~carey/Courses/PSYC7291/DataSets/Documentation/koro.ht‬‬
‫‪m‬‬
‫חלק שני של השיעור‬
‫‪‬‬
‫מדגם השוואתי‪ :‬השוואה בין קבוצות‪ ,‬יש לנו שתי אפשרויות‪ :‬אפשרות להשוות בין קבוצה‬
‫לקבוצה (בין גברים לנשים) אז אנו מניחים שאלה שתי קבוצות בלתי‪-‬תלויות ויש לנו אפשרות‬
‫להשוות בין חזרות‪ ,‬שכ"א נמדד בשתי נקודות או אירועים שונים (למשל‪ ,‬מדידת לחץ דם‬
‫בשתי נקודות זמן שונות)‪.‬‬
‫‪‬‬
‫אם התייחסנו בשאלון לסקאלה של עמדות פוליטיות באמצעות סדרת שאלות אחת ובסדרת‬
‫שאלות אחרת שאלנו שאלות עקיפות הקשורות לעמדות פוליטיות‪ .‬אנו רוצים לדעת האם שני‬
‫המדדים הללו אינם בעלי פער (הפרש)‪ ,‬מי שימני תמיד נמדוד בצד הימני של המפה ומי‬
‫ששמאלי בשמאל‪ .‬זה מבחן ‪ t‬מזווג‪.‬‬
‫‪‬‬
‫השוואה בין קבוצות כמבחן ‪-T‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪‬‬
‫‪ -One sample T test‬השוואה מול תוחלת‪ :‬נגיד שמחיר הדלק ‪ ,₪ 1‬ואנו רוצים לבדוק האם‬
‫באזור הצפון הערך של הדלק שונה מ‪.1-‬‬
‫‪‬‬
‫‪ -Independent‬השוואה בין שתי קבוצות (נשים‪-‬גברים‪ ,‬זקנים‪-‬צעירים)‬
‫‪‬‬
‫‪ -Paired‬מבחנים מזווגים כמו לחץ דם‬
‫‪‬‬
‫כאשר אותה תצפית חוזרת בבדיקות שונות אנו מניחים שיש מתאם בין הבדיקות‪ -‬למשל אם‬
‫אותו נבדק מופיע עבור משתנה אחד וגם עבור אחר‪.‬‬
‫‪‬‬
‫יותר תצפיות‪ -‬דורשות הבדל קטן יחסית‪ 01 ,‬תצפיות אינן דבר שניתן להסתמך עליו‪.‬‬
‫‪‬‬
‫מבחן לוין‪ :‬כאשר ‪ sig‬גדול מ‪ 1.10‬אז בודקים את השורה הראשונה‪ .‬יש מקרים בהם הוא לא‬
‫נותן רמת מובהקות‪ ,‬ניתן להסתכל בטור האחרון (‪ )50%‬ונראה שה‪ 1-‬נמצא בין ה‪ Lower‬ל‪-‬‬
‫‪ .Upper‬אותו דבר אמרנו לגבי ה‪ Skewness-‬אתמול‪ :‬לא יכול להיות שייצא לנו ‪ 1‬מושלם ולכן‬
‫יש להגדיר את תחום הערכים ההגיוני של ההפרשים בין הקבוצות ביחס ל‪ .1-‬אם התחום‬
‫הזה כולל את האפס זה אומר שכל הערכים המופיעים בטור האחרון כוללים את ה‪ 1-‬אז‬
‫ההפרש ביניהם כולל את ה‪ .1-‬אם מגדילים את אזור אי‪-‬הדחייה ל‪ ,55%-‬כלומר‪ ,‬מצמצמים‬
‫ל‪ ,1.10-‬אנו מקטינים טעות מסוג ‪ ,0‬כלומר שאמרנו שיש משהו מובהק במחקר שלנו אבל‬
‫המצב הטבעי הוא אקראי לחלוטין‪ ,‬כלומר הגדלת אזור אי‪-‬הדחייה‪ .‬הטעות ההפוכה היא‬
‫טעות מסוג ‪ -2‬נדווח שלא מצאנו‪ ,‬אבל דווקא אבל הוא לא בא לידי ביטוי כשאנחנו קשיחים‬
‫מדיי‪.‬‬
‫‪‬‬
‫‪ -One way ANOVA‬בו מודדים רק אפקט עיקרי‪ ,‬על יותר משתי קבוצות‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪‬‬
‫מבחני פוסט הוק‪ -‬לאחר מעשה‪ ,‬כאשר מצאנו הבדלים בין קבוצות‪ ,‬אנו רוצים לדעת בין אלו‬
‫קבוצות‪ :‬יש לנו אפשרות דירוג‪ ,‬השוואה בין זוגות בכלים יותר מתקדמים‪.‬‬
‫‪‬‬
‫‪ -Duncan‬מבצע דירוג‪ ,‬מי הראשון והאם השני קרוב אליו‪ ,‬מצרף אותו וכן הלאה‬
‫‪‬‬
‫‪ -Tukey‬בודק בין זוגות‬
‫‪‬‬
‫ניתן לבחור מספר סוגים של מבחנים המתאימים ביותר להשערת המחקר שלנו‪ ,‬ומערך‬
‫המחקר בהתאם‪ .‬ההמלצה היא להתאים את המבחן למחקר שלנו לפי האינטואיציה ולפי איך‬
‫שאנחנו מכירים את התפלגות המשתנים‪ -‬לכן חשוב מאוד להכיר טוב טוב איך המשתנים‬
‫מתפלגים‪.‬‬
‫‪‬‬
‫מסתכלים על ה‪ -F-‬אם מעניין אותנו לאתר את מקורות השונות נסתכל על ה‪ sig-‬ועל ה‪ F-‬אם‬
‫נמצא באזור הדחייה או לא (אומדן אותו מחשבים מתוך הנתונים ומשווים אותו מול טבלה‬
‫סטנדרטית ואומרים האם ה‪ F-‬באזור סטנדרטי או שהוא חורג)‪ F .‬הוא יחס והוא חיובי=‬
‫התפלגות‪.‬‬
‫*כל המודלים הפרמטרים מניחים איזושהי התפלגות של המדגם‪ :‬בין אם נורמלית או אחרת‪ ,‬השערת‬
‫המחקר משערת מה יקרה לאותו משתנה בכל חלק של ההתפלגות‪ :‬כלומר דנים בשטח של איזור אי‪-‬‬
‫הדחייה‪ ,‬ככל שהחריגות יותר רחוקה‪ -‬אז הערכים של ‪ F‬יהיו גבוהים ויהיו מעט מאוד תצפיות בתחום‬
‫שלנו‪ .‬ה‪F -‬מהווה מדד איכות המסביר משהו מעבר לאקראיות‪.‬‬
‫‪‬‬
‫‪ -General Linear Model‬כאן אנו כבר מתחילים לבנות מודל אותו נריץ ולהגיע למסקנות לגבי‬
‫הקשר הקיים בין המשתנים‪ :‬האם המתאם בין המשתנים שבדקנו משפר או מקטין את‬
‫ההסבר על ההבדל‪ .‬ואז אפשר לבדוק גורמים נוספים ולבחון כיצד הם תורמים עבור ההסבר‬
‫שלנו למודל (חלק מהפיזור מוסבר ע"י משהו סיסטמטי‪ ,‬ע"י תבנית אותה צפינו)‪ .‬אנו בוחנים‬
‫האם החלק של ההסבר של המודל שלנו מספק כדי שוכל לדווח על התנהגות עקבית ולבצע‬
‫לאחר מכן חיזוי וניבוי‪.‬‬
‫‪‬‬
‫‪ -Dependent‬המשתנה התלוי אותו מסבירים (פה שמים את ה‪)pre-‬‬
‫‪‬‬
‫‪ -Fixed‬הסבר אפשרי באמצעות גורם קבוע שעלול ליצור קראיות משום שמדובר בגורם קבוע‬
‫(אותם עשיריה שמופיעים בכל פעם)‪ -‬זה ה‪ .Control-‬פה שמים את ה‪grouping-‬‬
‫‪‬‬
‫‪ -Random‬כאן ניתן לבחון האם האקראיות‪ ,‬האם זה משפיע על השונות‬
‫‪‬‬
‫‪ -Covariates‬וניתן להכניס משתנים בלתי‪-‬תלויים נוספים המוסיפים הסבר למשתנה (זה כבר‬
‫רגרסיה ליניארית)‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫יש גם אפשרות של ‪ -Bootstrap‬מומלץ בעיקר במדגמים קטנים‪ -‬הוא משתמש בבריכת‬
‫נתונים‪ ,‬שולף ומחזיר ויוצר מספר גדול יותר של קומבינציות עבור מספר קטן של תצפיות‪.‬‬
‫גודל המדגם או איכות המדגם‪ ,‬אינם קשורים לגודל האוכ' משום שאנו מניחים שאת גודל‬
‫האוכ' איננו יודעים‪ .‬לכן‪ ,‬מה שהמדגם שלנו מייצג מתבסס על השונות באוכלוסיה‪ ,‬ודרך כך‬
‫מציין בפנינו כמה דגימות אנו זקוקים כדי לייצג את האוכ'‪.‬‬
‫מפגש שלישי‪ :‬ניתוח הנתונים ברבדים שונים‬
‫מערכי מחקר מורכבים והטיפול בהם בעזרת ‪ ,SPSS‬רגרסיה ליניארית‬
‫שעה ‪ – 0‬המשך ניתוח שונות‪ :‬טיפול במדידות חוזרות‪ SPSS ,‬ניתוח שונות רב גורמי ופירוק‬
‫השונות לגורמים‪.‬‬
‫שעה ‪ – 2‬המשך ניתוח שונות‪ :‬טיפול במדידות חוזרות‪ SPSS ,‬ניתוח שונות רב גורמי ופירוק‬
‫השונות לגורמים‪.‬‬
‫שעה ‪ – 3‬רגרסיה ליניארית פשוטה ומרובה‪ ,‬בדיקת השערות במודל רגרסיה בעזרת ‪.SPSS‬‬
‫שעה ‪ – 4‬המשך‪ :‬רגרסיה ליניארית פשוטה ומרובה‪ ,‬בדיקת השערות במודל רגרסיה‪.‬‬
‫מטלה‪ :‬בדיקת השערות במודל‬
‫טיפ‪ -‬אם יש מעבר בין גרסאות והגרסא החדשה לא קוראת‪ :‬באתר של ‪ IBM‬ניתן להוריד‬
‫מתרגמים‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫ספר מצוין שאמיר ממליץ עליו ‪http://www.amazon.com/Multilevel-Longitudinal-‬‬
‫‪Modeling-Quantitative-Methodology/dp/1848728638‬‬
‫כמה מילים על רגרסיה‪..‬‬
‫אנו עוברים היום ממתאמים דו‪-‬מימדיים (קשר דו‪-‬מימדי) למתאמים רב‪-‬מימדיים (בין קבוצת‬
‫משתנים מסבירים למשתנה מסביר אחד)‪ .‬בצד המוסבר תמיד יהיה לנו משתנה אחד‪.‬‬
‫רגרסיה‪ -‬מערכת משוואות המסבירה את המשתנה המסביר ‪ ,‬המשתנה המסביר הוא‬
‫פונקציה של קומבינציה ליניארית‪ .‬קומבינציה של משתנים ומקדמים יוצרת יחידת הסבר של‬
‫כל משתנה מוסבר‪ ,‬לכל תצפית ותצפית‪ .‬כלומר‪ ,‬שרגרסיה ליניארית היא מודל אינקרמנטלי‬
‫(תוספתי)‪ ,‬משקל(מקדמי המשתנה) ‪X‬משתנה ‪+‬משקל‪ X‬משתנה ‪ ,2‬וכן הלאה= שקלול‬
‫ההסבר‬
‫ברגרסיה אנו מנסים לאמוד קו ממוצע המייצג תופעה‪ ,‬מתוך ידיעה שבפועל קיימות גם סטיות‬
‫(לא כל הערכים נמצאים בדיוק על הקו) וקיים פיזור סביב הקו‪ .‬מודל הרגרסיה מרכז את כל‬
‫הערכים סביב הקו‪.‬‬
‫האם הרגרסיה הינה הכלי המתמטי הטוב ביותר? כן‪ ,‬לא קיים כלי מתמטי טוב יותר ממודל‬
‫זה‪ .‬מודל זה עובד על אותו עקרון כמו ניתוח שונות‪.‬‬
‫מה מודדים? ‪F,R2,∆R2‬‬
‫‪ -F‬צורת התפלגות בעזרתה אנו מודדים את טיב הרגרסיה‪ .‬ככל שהערך יותר גדול‬
‫ההסתברות יותר קטנה‪ -‬אנו רוצים ‪F‬גדול כדי להוכיח שהרגרסיה מובהקת‪.‬‬
‫‪ -R2‬שיעור ההסבר מסך המדידה‪ :‬מה מסביר המודל שלנו מתוך העולם האקראי? איזה חלק‬
‫אינו אקראי בתוך העולם האקראי? אחוז השונות המוסברת‪.‬‬
‫‪ –R‬מקדם מתאם של הקורלציה‪.‬‬
‫מקדמי הרגרסיה‪ -b :‬האם מובהקים‪ ,‬מהי מובהקות ברגרסיה? בוחנים האם ‪ 0.5‬שונה‬
‫בצורה מובהקת מ‪ .1-‬תחום הערכים סביב מקדם שהוא ‪ 1‬יכול להיות סביר‪ ,‬אבל מקדם ‪ 1‬לא‬
‫תורם למשתנה המוסבר‪.‬‬
‫מובהקות של משתני הרגרסיה‪b :‬‬
‫מקדמים מנורמלים‪ -β :‬מנורמל משמעותו שביתא מהווה משקל משמעותי בין ‪ ,-0-0‬אם‬
‫מנרמלים את כל המשתנים נקבל שאין חותך (החותך שואף לאפס) ‪ ,‬כאשר ביתא מהווה את‬
‫המדד האמיתי מהאוכלוסיה‪ ,‬כי ‪ b‬היא רק אומדן לשיפוע (אומדן לביתא מתוך האוכלוסיה)‬
‫וביתא המנורמל אמור לייצג את המשקל המנורמל של כל משתנה במודל שלנו‪ .‬מנורמל‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫משמעותו שסך כל המשקלות הללו צריך להסתכם ל‪ .0-‬אם ניקח יחידה בסיסית ונכפול אותה‬
‫במשקלות נקבל יחידה בסיסית של המשתנה תלוי‪.‬‬
‫ניתן לדווח גם על סטיות תקן‬
‫לוח דיווח על תוצאות הרגרסיה‪ :‬אנו מדווחים בד"כ (חשוב ללמוד מה שפת הדיווח במדע‬
‫המדינה‪ -‬כדי לדעת על מה דיווחנו ומה צריך להופיע בלוח הדיווח)‪.‬‬
‫*יש גרעין קשרים המהווה את מודל הבסיס‪ :‬מכיל את האפקטים העיקריים‪ .‬בנוסף‪ ,‬קיימים‬
‫גם משתני בקרה‪ ,‬אלה אינם משתני המודל‪ ,‬אלא משתנים שאספתי ובודקים מה קורה‬
‫לקשרים שבמודל הבסיס כאשר לוקחים בחשבון מרכיבים נוספים הקיימים בתוך הכאוס של‬
‫האקראיות‪ .‬קורה הרבה פעמים שאנשים מדווחים על משוואות מבניות (‪ )SEM‬אבל יוצרים‬
‫מבנה מאוד סטטי של מספר מערכות קשרים‪ ,‬אבל קיימת בעיה בדיווחים כי מדובר במודל‬
‫מאשש בלבד ולא עשיתי גישוש (חיפוש אחר קשרים נוספים כדי לחזק את ההשערות‬
‫הנוספות)‪.‬‬
‫לאחר הוספתן של ההשפעות הנוספות בודקים האם יש השפעה צולבת בין ההשפעות‬
‫השונות‪.‬‬
‫אינטראקציה בניתוח שונות‪ -‬בודקים ומצליבים במטרה לראות השפעה של כל משתנה בעת‬
‫קיומו של המשתנה האחר‪ .‬זוהי האינטראקציה בין המשתנים‪ .‬בדיוק אותם הסברים שיש לנו‬
‫בניתוח שונות קיימים גם כאן‪ .‬למשל‪ ,‬אוכלוסיה הנמצאת תחת קטגוריה 'הכנסה' בהצלבה‬
‫עם קטגוריה 'מיקום גאוגרפי' באינטראקציה נראה שככל שהיישוב גדל‪ ,‬ההכנסה עולה‪ ,‬ואז‬
‫מנקודה מסוימת באזורים הגיאוגרפים הממש גדולים‪ ,‬נתחיל לראות ירידה (בעקבות גורמים‬
‫נוספים שנכנסים למשוואה)‪ .‬זהו אפקט היפרבולי‪.‬‬
‫דרגת חופש ראשונה= מספר הפקטורים פחות ‪ .0‬איזה מודל העמסתי על הרגרסיה?‬
‫דרגת חופש שנייה= גודל המדגם פחות ‪.0‬‬
‫דגימה היא פרס וקנס‪ :‬ככל שדוגמים יותר יש ייצוג גדול יותר יש ייצוג גבוה יותר של‬
‫האוכלוסיה‪ ,‬אבל מאבדים דרגות חופש‪ .‬ברגע שדרגות החופש יורדות‪ ,‬קשה יותר להוכיח‬
‫שהמודל שלי מובהק‪( .‬ה‪ F-‬גובה תשלום עבור כל תוספת של מבנה)‪.‬‬
‫‪ ,∆R2‬אם יש מודל מסביר ויש מודל נוסף בעל אפקטים נוספים צריך לשאול האם הגדלתי את‬‫ההסבר שהמודל מספק והאם בצורה משמעותית?‬
‫חשוב שמודל הבסיס יכלול רק את המשתנה המסביר הקיים במודל שלנו כבסיס להתייחסות‪.‬‬
‫*הפלט שאנו מקבלים מכיל המון דברים‪ ,‬אבל לא הכול צריך‪.‬‬
‫בד"כ אם שי לנו שאלון וענו ‪ 011‬איש אז מדווחים פעם אחת בהערה (‪.)n=500‬‬
‫תמיד לכתוב מה מקור הנתונים‪ :‬מקור הנתונים הוא שאלון החוקר‪ ,‬שנת איסוף וקרדיט‬
‫לאוספים‪ ,‬הסבר על מובהקות‪ ,‬מובהקות‪ ,‬גודל המדגם (אפשר גם בלוח עצמו)‪ ,‬אבל אם שינוי‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫כתוצאה מהכנסת משתנים נוספים‪ ,‬אפשר להסתפק ב‪ .N=n‬רמת מובהקות של ‪ 01%‬גם‬
‫יכולה להיות בהרבה מקרים הסבר‪.‬‬
‫לא לשכוח‪ :‬כשאנו כותבים טקסט על גבי הטבלה‪ ,‬לדווח על נתונים מקוריים‪ ,‬בנוסף להסברים‬
‫שלנו עבור התוצאות‪.‬‬
‫נניח ויש קטגוריה של משתנה מצב נישואים‪ :‬בעל שלושה ערכים‪ -‬זה לא מתאים לרגרסיה‪:‬‬
‫לכן נפרק אותו לדו‪-‬משתני‪ .‬משתנה נומינאלי בעל שלושה ערכים אינו משתנה רציף ומשום‬
‫כך עלינו לפרקו למשתנה של "או זה או כל השאר"‪ .‬מציאת המשקל צריכה להיות ביחס‬
‫לאחר לא בהתאם לערכי הקטגוריה שניתנו לכל ערך‪ .‬לחלוקה בה יש קבוצה קטנה מול‬
‫קבוצה גדולה יש השפעה ("זה לא לא משנה")‪ .‬איך מאתרים את הקיצונים בניתוח יוניטרי?‬
‫עם תרשים ‪.boxplot‬‬
‫יש אפשרויות נוספות "לשחק" עם התצפיות‪ :‬שולפים כמה החוצה‪ ,‬מחזירים וכד'‪ ..‬בהמשך‬
‫נבחן את האפשרויות הללו‪.‬‬
‫שאלת המחקר אותה נבחן בשלב זה‪ :‬ניתוח ההכנסה האחרונה שנמדדה באמצעות מסבירים‬
‫שונים‪ :‬מגדר‪ ,‬גיל והשכלה‪.‬‬
‫את התחושות הראשונות הנוגעות לקשר הזה עלינו להציג בטבלה של קשרים דו‪-‬מימדיים‬
‫(ספירמן‪ ,‬פירסון וכד')‪ :‬זה עם זה‪ ,‬זה עם זה‪ ,‬ורק לאחר מכן ניתוח קשרים רב‪-‬מימדי‪.‬‬
‫סדר הכנסה של משתנים בבלוקים‪ :‬אנו באים עם מודל תיאורטי איתו אנו מגיעים מהספרות‬
‫אז במודל הבסיס יושבות כל ההשערות הבסיסיות שלנו ואליו אנו מתייחסים בראש‬
‫ובראשונה‪ -‬זה גרעין מודל ההשערות‪ ,‬ואז בבלוק הבא יוצרים מודל שני הכולל משתני בקרה‪.‬‬
‫ואז בבלוק השלישי בודקים למשל סיכויים של הצלבות בין משתנים (יחסי גומלין בתוך‬
‫המודל)‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫בתוך האופציה של ‪:statistics‬‬
‫‪ -Estimates‬זה ה‪ ,b-‬המקדמים שאומדים עבורנו‪.‬‬
‫‪ -Model fit‬מדדים לטיב המודל (‪ -F‬באמצעותו מדווחים האם המודל מובהק)‪.‬‬
‫‪ -R squared change‬מודד לנו כלמה כל משתנה הסביר‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫ניתן גם לסמן את ‪ ,outliers outline ,casewise diagnostics‬ואז מאתרים דרך זה את‬
‫החריגים לתבנית ההתנהגות‪.‬‬
‫באמצעות ‪ plot‬ניתן לצייר גרפים של איך המודל מתנהג מול משתנה תלוי‪ ,‬בלתי‪-‬‬
‫תלוי וכן הלאה‪.‬‬
‫יש אפשרות לשמור תוצרים המחושבים בפועל באמצעות ‪.save‬‬
‫‪ -Bootstrap‬מתאים למי שיש מדידות מעטות (לקח לו שנתיים להשיג ‪ 011‬תצפיות)‪-‬‬
‫באמצעות כך ניתן לבדוק מודלים קטנים בתוך התצפיות ולבדוק האם המודל הזה‬
‫תקף ויציב לכל תת‪-‬מודל שנלקח ונבחן‪ .‬כלי זה מאפשר לנו לעשות חזרות ולבדוק עד‬
‫כמה האומדן יציב ולא משתנה (האם ממשיך להיות מובהק לאורך כלל התצפיות)‪.‬‬
‫‪ -ENTER‬כל המשתנים שאני רוצה יכנסו במודל הזה‪ -‬עדיף תמיד להשתמש בזה‪ :‬אם‬
‫יש לך מודל להשתמש בו כמו שהוא‪.‬‬
‫ניתוח הפלט‪:‬‬
‫ב‪ -R2‬ראינו שלא היה שינוי‬
‫ב‪ -R change2‬רואים תרומה מעטה בלבד‪ ,‬ולמשתנים הנוספים תרומה קטנטונת‪ .‬ניתן לדווח‬
‫גם על דרגות החופש‪ ,‬או רק על המובהקות‪ .‬בטבלה הראשונה אנו בודקים שינוי‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫כעת אנו רואים בלוח ה ‪ ANOVA‬את היחס בין מה נמדד ברגרסיה לבין מה נמדד בכל השאר‪:‬‬
‫היחס בין המוסבר ללא מוסבר‪.‬‬
‫ה‪ F -‬גבוה אבל במקרה הזה זה בגלל שהרמנו ‪ 0,011‬תצפיות‪ .‬כאן אנו בודקים כל בלוק‬
‫בנפרד‪.‬‬
‫לאחר מכן אנו מגיעים לשלב המקדמים‪ :‬מה עושה כאן ‪ ?β‬באילו ערכים אנו יכולים לדבר על‬
‫ביתא? אם יש לנו מבנה ליניארי‪:‬‬
‫‪ Y=a+b1X1+b2X2……..‬וכעת אנו רוצים לדעת מה המשמעות של ‪ -b‬שהוא האומד (הסיפור‬
‫המעשי‪ ,‬כלומר איך באמת המודל מתנהג‪ ,‬כאשר ביתא הוא הסיפור התיאורטי)‪.‬‬
‫‪ -y‬הכנסה ב‪2100-‬‬
‫‪ -X1‬הכנסה ‪( 1,111‬בשנת ‪)2112‬‬
‫‪ -0.0 =b1‬הכנסה ב‪ 2100‬חלקי הכנסה ב‪.2112‬‬
‫התוצאה היא ‪02,111‬‬
‫הנגזרת היא ההשפעה השולית של ההכנסה ב‪ ,2112-‬כלומר ‪.0.0‬‬
‫חזרה לטבלת הפלט‪:‬‬
‫בטור המובהקות‪ ,‬כאשר המודל מובהק אז שונה מאפס באופן מובהק‪ .‬אצל הנשים ניתן‬
‫לראות בטור של ‪ B‬כי אישה הרוויחה ‪ ₪ 421‬פחות (תוצאה שלילית)‪ .‬במקרה זה כל‬
‫המדידות שאנו רואים הן ביחידות של הכנסה‪.‬‬
‫ניתן לראות שמודל הבסיס מצליח איכשהו לשמור על יציבות לעומת שאר המודלים‪.‬‬
‫המובהקות נבחנת עבור כל מרכיב במודל‪ ,‬כך למשל‪ ,‬ניתן לראות ששנת הלימוד אינה‬
‫מסבירה את ההכנסה‪.)p=0.611( ,‬‬
‫קוליניאריות‪ -‬אם יש בעיית קוליניאריות אבל יש מודל מנוסח ומעוצב אז צריך להתמודד עם‬
‫הבעיה‪.‬‬
‫‪ -Excluded variables‬בד"כ צריך לבקש חקירה של בעיות מולטיקוליניאריות שנמצאו‪.‬‬
‫חלק שני של השיעור‬
‫שיטה חצי‪-‬אטומטית למרכוז‪.‬‬
‫למה למרכז? מרכוז הוא נרמול חלקי‪ ,‬כאן מעניין אותי רק לראות את המשתנים הנעיםמ‬
‫סביב האפס כאשר הממוצע יהיה עכשיו האפס‪ .‬אם כל המשתנים ממורכזים אז אכן האפס‬
‫יהיה הערך הממוצע עבור כולם‪.‬‬
‫פקודה הנקראת ‪ -aggregate‬היוצרת משתנה אגרגטיבי של משתנים‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫למשל‪ ,‬עבור מצב משפחתי‪ ,‬לייצר את השכר הממוצע עבור רווקים‪ ,‬נשואים וגרושים‪ .‬ואז‬
‫נוצר משתנה חדש‪ :‬ממוצע ההכנסה בשנה מסוימת עבור מצב משפחתי מסוים‪.‬‬
‫כשיוצרים אינטראקציות הרבה יותר קל לעבוד עם המשתנים הממורכזים‪ .‬מה הערך של‬
‫המשתנה הצפוי כשאני מניח שכל הערכים הם הממוצעים של המשתנים? איזה אפס אני‬
‫אקבל? כאשר כולם ממוצעים (אפס) נקבל את ה‪.constant‬‬
‫האם כשאנחנו ממרכזים משתנה האם אנו מורידים מהמשתנה? בעקרון לא‪ ,‬כי מורידים ערך‬
‫קבוע‪ .‬מה כן משתנה? הביתא‪ ,‬כי עכשיו הורדתי את הכול בכמות מסוימת אז גם האפקט‬
‫שלו יהיה קצת שונה‪.‬‬
‫‪ -Break variables‬לפי אילו משתנים לשבור? "מצב משפחתי"‪ .‬אנו מבקשים שלכולם ייתן‬
‫ערך ממוצע‪.‬‬
‫קודם מבקשים ממנו לסדר ואז לבקש את הפונקציות‪.‬‬
‫‪ -Function‬ניתן לבקש כל מיני מדדים שיופיעו בערך קבוצתי (לנשואים יש את הממוצע‬
‫שלהם‪ ,‬לרווקים וכן הלאה)‪.‬‬
‫השפעות לא ישירות‪ -‬מיתון‪ ,‬משתנה מתערב‪ ,‬אינטראקציות‪:‬‬
‫בהשפעות לא ישירות יש לנו מצב בו אנו לא ממש יודעים מאיפה נוצרה ההשפעה (משתנה‬
‫ממתן או משתנה מתערב)‪ .‬אם יש שינוי בהתנהגות (בשיפוע) בהשפעה על ההכנסה היום‬
‫ואתמול‪ ,‬אנו רואים כי משתנה המין גורם לנו להבחין בין שתי התנהגויות שונות‪ .‬לכן מרכוז‬
‫עוזר לנו משום שיש לנו נק' מוצא אפס וכאשר התוצאה חיובית (מעל האפס) ‪.......‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫)‪ -Preacher Curran & Bauer (2006‬יצרו מחשבון שמסייע לנו באינטראקציות של שניים‬
‫ושלושה משתנים‪.‬‬
‫במקרה של תיווך נשתמש ב‪ script-‬שכתב ‪ )Hayes, 2012( Hayes‬על‪-‬מנת לחשב את החלק‬
‫העקיף ומובהקותו בקשר שבין המשתנה המסביר והתלוי‪.‬‬
‫‪http://afhayes.com/spss-sas-and-mplus-macros-and-code.html‬‬
‫בתיווך אנו בודקים האם יש קשר העובר דרך המשתנה המתווך‪ -‬במתערב אנו בודקים‬
‫השפעה של המשתנה גם על הבלתי‪-‬תלוי וגם על התלוי‪.‬‬
‫במקרה התיאוריה של ברון וקני יש חידושים בתחום ועל‪-‬כן יש לבדוק אותם‪ ,‬כך למשל‪,‬‬
‫החידוש בתחום אומר שלא חייבים שכל התנאים יתקיימו כדי שתהיה השפעה של מתווך‪.‬‬
‫יש המון סוגים של משתנים‪ :‬יש עשרות מודלים שניתן לבדוק‪ ,‬כ"א תלוי במודל שלו‪ .‬יש‬
‫מודלים הכוללים גם משתנה מתערב וגם משתנה מתווך‪.‬‬
‫מריצים את הפקודה שלו מה‪( script‬מופיע אחרי הסינטקס)מדביק ומפעיל‪:‬‬
‫סדר הפעולות‪:‬‬
‫ניתן להוריד את הפקודה ב‪zip‬‬
‫ואז ‪File-open-script- hayes‬‬
‫מופיעה הפקודה‪ -‬ואז מכניסים את הנתונים הבאים‪:‬‬
‫משתנה תלוי‪:‬‬
‫משתנים מתווכים‪:‬‬
‫משתנה בלתי‪-‬תלוי‪:‬‬
‫בכיתה הכנסנו הכנסה כמשתנה תלוי‬
‫כמשתנה מתווך את גיל והשכלה‬
‫בלתי‪-‬תלוי‪ -‬הכנסה ב‪2112-‬‬
‫‪ -Covariate‬מין‪ -‬מוודא שאין מתאם גבוה מדיי וחפיפה בין המשתנים‪.‬‬
‫ואז מריצים‪.‬‬
‫ואז מקבלים דיווח מלא של מהם המשתנים במודל‬
‫לאחר מכן גודל מדגם‬
‫ואז הוא מציג את הנתיבים בין הבלתי‪-‬תלוי למתווך‬
‫אפקטים ישירים על תלוי‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫אפקט כולל של בלתי‪-‬תלוי על תלוי‬
‫באפקט העקיף של המתווך נמצא ‪ ,1.130‬רואים ש‪ z‬קטן מאוד (‪ )1.0012‬ולכן ‪ p‬גדול ולא‬
‫מובהק‪.‬‬
‫אנחנו מדווחים על האפקט‪ ,‬את ה‪ Z-‬ואת ה‪ p-‬ולהוסיף טורים של ‪ bootstrap‬ומדווחים על ה‪-‬‬
‫‪ upper‬וה‪.lower-‬‬
‫שני יתרונות לכלי של הייז‪:‬‬
‫‪ .0‬אנחנו לא צריכים לחשב שום דבר לבד‪.‬‬
‫‪M‬‬
‫‪b2‬‬
‫‪b1‬‬
‫‪b4‬‬
‫‪Y‬‬
‫‪b3‬‬
‫‪X‬‬
‫‪ -B4‬קשר ‪ XY‬בנוכחות ‪M‬‬
‫‪B2Xb3=indirect effect‬‬
‫מה שמעניין אותנו זה הקשר בין ‪ b2‬ו‪ b3‬מול ‪b1‬‬
‫אנו רוצים לראות מה הערך של היחס הזה‪ ,‬ואיך הוא מתפלג (האם אכן מתפלג בהתאם‬
‫להשערה שלנו)‪.‬‬
‫*במקרים שבהם יש תיווך על המשתנה התלוי‪ :‬כיצד זה ייתכן?‬
‫‪IID-independent identical distribution‬‬
‫הרעיון הוא שדגמתי דגימה אקראית מלאה‪ :‬המניחה שכל תצפית היא בלתי‪-‬תלויה בתצפית‬
‫האחרת‪ ,‬אין לה קשר‪ ,‬וההסתברות‬
‫(ההנחה היא שאין שוויון שונויות ושה‪ covariant‬הוא אפס)‪.‬‬
‫כאשר אני מניח שיש או תיווך או מיתון אני יכול להניח‪ :‬אם זה מיתון אנו מניחים שונויות‬
‫שונות ואם זה מיתון אנו מניחים שהקו הוא אפס‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫מפגש רביעי‪ :‬מודלים ליניאריים ואחרים‬
‫בחינת השערות מורכבות ומקרים שונים של משתנים תלויים‪.‬‬
‫שעה ‪ – 0‬מודל מעורבים‪ ,‬רגרסיה ליניארית‪ SPSS ,‬רגרסיה ליניארית עם אפקטים מעורבים‪.‬‬
‫שעה ‪ – 2‬רגרסיה למשתנים תלויים לא רציפים‪.‬‬
‫שעה ‪ – 3‬רגרסיה למשתנים תלויים לא רציפים‪.‬‬
‫שעה ‪ – 4‬שיטות וצורות דיווח‪ ,‬איך לדווח‪ ,‬מה לדווח‪.‬‬
‫מטלה‪ :‬טיפול בנתונים אישיים‬
‫היום נמשיך בנושא הרגרסיות כאשר המשתנה התלוי אינו רציף‪ .‬ישנן מספר הנחות אותן מניחים‬
‫כאשר המשתנה הוא רציף שאינן מתאימות ולכן יש להתאים את המודל למקרה שבו המשתנה התלוי‬
‫אינו רציף‪.‬‬
‫דוגמאות למקרים דנן‪:‬‬
‫למשל‪ ,‬מודלים בהם המשתנה רציף רק בחלקו‪ ,‬משתנה קטום‪ ,‬למשל מדידת ביקוש בה חושפים‬
‫אדם למספר חלופות וקיימת רציפות של מחירים ורצון האדם לקנות‪ .‬אבל אין מחירים שליליים‬
‫בשוק‪ ,‬ולכן יש רציפות המתחילה בערך אפס עד מחיר מסוים ונקטמת בערך הזה ממנו שמאלה‬
‫(ערכים שליליים לא קיימים)‪,‬נ כל אלה שדיווח כי הם מוכנים לשלם ‪( 1‬לא מעוניינים במוצר)‬
‫יוצרים רציפות נסתרת לצד שמאל ולכן אנו אומדים אותה באמצעות נקודת האפס‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫אדם עם השכלה גבוהה אינו מעוניין בפעילויות פנאי מתחומים מסוימים ולכן המוצר שאנו מציעים לו‬
‫איננו רלוונטי עבורו‪ -‬ולכן ההנחה שקיים משתנה רציף קיים נפגמת ויש לטפל במשתנה התלוי באופן‬
‫שונה‪.‬‬
‫מודל ‪ -Tobit‬עוסק בבעיית המשתנה התלוי שאינו רציף‪.‬‬
‫זהו מודל שהקטגוריות בו זהות במשקלן זו לזו‪ .‬אנו מסתמכים על הבחירה בפועל‪ ,‬אין לנו אפשרות‬
‫לדעת מה העדפתו של האדם אלא אם קיבלנו אינדיקציה לכך מהאדם עצמו‪.‬‬
‫בעיה של משתנה תלוי קטגוריאלי‪:‬‬
‫העדפות נגלות‪ :‬כששואלים אדם מה הוא מעדיף הוא זורק משהו בין אפשרויות בחירה ולכן יש בעיה‬
‫של העדפה נסתרת שלא היתה קיימת באפשרויות הבחירה שנתנו לו‬
‫‪ -IIA- Indifference…. Alternative‬כאשר אין העדפה מסוימת כלפי אחת מן הקטגוריות‪ ,‬מסיבה‬
‫כזו או אחרת (לרוב‪ ,‬סיבה פרטנית הקשורה לאישיותו של הפרט)‪.‬‬
‫לפיכך‪ ,‬כל חלופה פועלת באופן בלתי‪-‬תלוי בחלופות האחרות ולכן משקלה נפרד‪.‬‬
‫קיימות דוגמאות רבות למשתני בחירה קטגוריאליים‪ ,‬העבודה החשובה ביותר שעסקה בתחום זה של‬
‫דניאל מק'פדן‪ ,‬שיצר מודל בתחום‪.‬‬
‫המודל האחרון אותו נבחן הוא מודל אורדינאלי בו יש סדר ולסדר יש משמעות‪ .‬למשל‪ ,‬כמות כוסות‬
‫קפה ששותים ביום‪ ,‬או סיגריות‪ ,‬מאחורי מידת צריכת הקפאין או הסיגריות עומד משתנה רציף‪ ,‬אבל‬
‫גם כאן יש לנו טיפוסי ‪ ,Tobit‬שאינם משתייכים לקטגוריות במוצעות בפניהם ולכן יש לקחת גם אותם‬
‫בחשבון‪ .‬לאלה יש משקל אפס ש ‪ SPSS‬אינו יודע לבדוק‪.‬‬
‫בסופו של דבר‪ ,‬כשאנו חוקרים מספר של טיפוסים‪ ,‬אנו רוצים לייצר הסתברויות לבחירת חלופות‬
‫עבור טיפוס א‪ ,‬ב‪ ,‬ג‪.‬‬
‫מודלים ליניאריים הסתברותיים‪ .‬בספרון שהועבר בכיתה ניתן לראות לוח ‪....‬‬
‫נניח ולא הכנסנו עמודה שבה הנשאל יכול לבחור שלא להביע דעה‪ ,‬אז יש לנו יכולת להכליל את‬
‫ההעדפות הסמויות שלא נכללו תחת אותו משתנה‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫הקבוצה האמצעית כוללת את המודלים בהם נשתמש‪ .‬אנו בחרנו בכיתה באפשרות של‬
‫‪.multinominal‬‬
‫‪‬‬
‫המשתנה חייב להיות קטגוריאלי‪.‬‬
‫כשנבדוק יחס הסתברויות נבדוק לא רק מה הסתברויות הפגיעה אלא גם מה יחס בין שיעורי‬
‫הטעות לשיעורי הפגיעה‪.‬‬
‫לאחר שהרצנו‬
‫נראות היא מכפלת ההסתברויות בסה"כ ואנו מנסים להגיע למקסימום נראות של המודל (כאשר‬
‫מכפלת ההסתברות נותנת לנו את ההסתברות הכי גבוהה של המודל כולו)‪ .‬אנו אומדים יחס בין‬
‫נראות בסיסית (ללא שום הסבר) לנראות בה אנו מוסיפים משתנים מסבירים‪.‬‬
‫נראות ללא משתנים מסבירים היא כמו לזרוק מטבע‪ ,‬כלומר‪ ,‬היחס בפועל‪ .‬בכיתה ראינו כי‬
‫המבחן שנבדק לא מייצר ערך מובהק ולכן אינו עומד במבחן המציאות‪.‬‬
‫דיווח על חי בריבוע במקרה של הרגרסיה הזאת הינו שווה ערך ל‪ ,F-‬כלומר‪ ,‬ככל שחי בריבוע‬
‫גדול יותר‪ ,‬ההסתברות לטעות קטנה יותר‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫מדד ‪( R2‬שיעור ההסבר שהמודל מספק לנו) נובע מהערך חי) כפול) ‪ X‬מספר הפריטים (מספר‬
‫המשתנים)‪.‬‬
‫לאחר מכן אנו רואים בטבלה הנקראת ‪ Likelihood Ratio Test‬את תרומת המשתנים לנראות‪-‬‬
‫תרומתו של כל משתנה לנראות‪ .‬גם ב‪.Parameter Estimate‬‬
‫מה מדווחים?‬
‫‪‬‬
‫גם כאן מדווחים על ה‪( b-‬על מקדמי הרגרסיה‪ ,‬בדיוק אותם מקדמים אותם אמדנו ברגרסיה‬
‫הליניארית אלא שאלה מנבאים הסתברויות)‪.‬‬
‫‪‬‬
‫מדווחים על מובהקות‪.‬‬
‫‪‬‬
‫מדווחים על סטיית תקן‪.‬‬
‫‪ -Wald‬כמו בדיקת ‪ ,t‬משתמש בחי בריבוע‪ ,‬ניתן לבקש ‪ z‬במקום זה באמצעות טרנספורמציה‪.‬‬
‫נקודה חשובה למודלים הללו‪ :‬כדאי למרכז משתנים‪.‬‬
‫מודל אורדינאלי‪:‬‬
‫להשלים‪.......‬‬
‫מודל בינארי עם ‪ n‬חזרות‪:‬‬
‫חלק שני של השיעור‪ :‬בקובץ שקיבלנו מאמיר ניתן לראות את לוח ‪XX‬של מערך מחקר רב‪-‬‬
‫שכבתי‪ ,‬דוגמה למחקרים של תוצרי מדיניות חינוך כהישגי תלמידים‪.‬‬
‫תצפי‬
‫רמה ‪1‬‬
‫ת‬
‫תלמיד‬
‫‪.‬תלמיד‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬תלמיד‬
‫תלמיד‬
‫תלמיד‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫תלמיד‬
‫תלמיד‬
‫רמה ‪2‬‬
‫כיתה‬
‫כיתה‬
‫כיתה‬
‫כיתה‬
‫משתנים תלויים‬
‫משתנים בלתי תלויים‬
‫משתני בקרה‬
‫רמה ‪:0‬‬
‫רמה ‪:0‬‬
‫רמה ‪:0‬‬
‫הישגי התלמידים‬
‫(נומינאלי)‬
‫ (אופרטיבי)‬‫מבחנים‬
‫בשפה זרה‪.‬‬
‫תיקוף‬
‫(מחקרים‬
‫קודמים)‬
‫יכולות התלמיד (נומינאלי)‬
‫‬‫הערכת ביצועי התלמיד‬
‫(נומינאלי)‬
‫‬‫רמה ‪:2‬‬
‫משתני רקע של התלמיד (נומינאלי)‬
‫מבחנים למורה (נומינאלי)‬
‫הערכת המורה (נומינאלי)‬
‫ (אופרטיבי) הערכת‬‫המורה על ידי המנהל‪.‬‬
‫השתלבות בכיתה (נומינאלי)‬
‫רמה ‪:2‬‬
‫חומר הלימוד (נומינאלי)‬
‫נתוני כיתת הלימוד (נומינאלי)‬
‫ (אופרטיבי) מספר תלמידים בכיתה‪.‬‬‫‪( -‬אופרטיבי) אווירה בשיעורים‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫תלמיד‬
‫נתוני בית הספר (נומינאלי)‬
‫ (אופרטיבי) סוג ביה"ס (ממלכתי‪ ,‬ממ‬‫ (אופרטיבי) הישגי ביה"ס‪.‬‬‫‪( -‬אופרטיבי) רמה סו"אק של ביה"ס‪.‬‬
‫נניח ויש לנו ‪ 0,011‬תלמידים כמדגם המהווה חתך של כל הארץ‪ .‬אבל אפילו אם לקחנו כיתה‬
‫בכל בי"ס יש לנו בעיה של תאימות בתוך כל כיתה‪ -‬כי כל התלמידים לומדים אותו שיעור אצל‬
‫אותה מורה‪.‬‬
‫אז מה אנו בודקים?‬
‫משתנים תלויים‪ :‬הישגי התלמידים כמשתנה נומינאלי‪.‬‬
‫את המשתנים הבלתי‪-‬תלויים אנו הולכים להסביר זאת בשתי רמות‪ :‬רמה ‪ 0‬היא יכולות התלמיד‬
‫(למשל‪ ,‬לבקש את הערכת המורה של ביצועי התלמיד) ורמה ‪ 2‬היא מבחנים למורה‪ -‬אולי המורה‬
‫בעייתי? האם הוא הוכשר למדיניות זאת?‬
‫במשתני בקרב יש לנו ברמה הראשונה את משתני הרקע של התלמיד‪.‬‬
‫השונות המוסברת אינה מוסברת רק על‪-‬ידי התלמידים‪ ,‬אלא גם על‪-‬ידי הבי"ס‪.‬‬
‫תכני העבודה יותר מתאימה להצעת מחקר מאשר למחקר‪.‬‬
‫מערך הנתונים שלנו הוא ‪( ,cross section‬ניתן למצוא זאת בספר שהוצג לנו אתמול) כאשר מודדים‬
‫כל תצפית בנקודות זמן שונות‪ .‬כאן למשל‪ ,‬תהיה לנו תצפית והמדידה שלה לאורך שלוש שנים‪ .‬אנחנו‬
‫לא נקליד את התצפיות הקודמות מחדש ולכן יש כלי שיכול לעשות טרנספורמציה למשתנים וחוסך‬
‫עבודה רבה‪:‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫‪:Variables to cases‬‬
‫מיהם המשתנים להם רוצים לבצע שינוי מעמד (‪ :)variables to be transposed‬אנו רוצים שבמקום‬
‫שיהיו לנו תצפית אחת לכל שנה (סה"כ שלוש תצפיות לשלוש שנים) אנו רוצים שיצור תצפית אחת‬
‫לשלוש שנים כמשתנה אחד‪.‬‬
‫אנו לא רוצים לאבד נתונים ברמה ‪( 2‬למשל‪ ,‬גיל התצפית בתחילת הניסוי הוא קבוע כי כל התצפיות‬
‫זזות באותו זמן)‪ ,‬או למשל מה היתה שביעות הרצון בנקודה האחרונה‪ -‬אלה משתנים שאינם‬
‫משתנים על‪-‬פני זמן‪.‬‬
‫הכנסנו שלושה משתנים (הכנסה בשנה ‪Y ,X‬ו‪ )Z‬ומהם אנו רוצים להפוך משתנה אחד לכל תצפית‪.‬‬
‫*צריך מראש במערך המחקר לבחור במדגם בו נוכל למספר את התצפיות ולחזור אליהן (מינימום ‪31‬‬
‫סטודנטים לדגימה) כדי שנוכל לחזור אל אותן תצפיות‪.‬‬
‫אחרי זה יש לשמור זאת תחת שם חדש ואז נדע להבחין בין המשתנה הישן לחדש אנו לא דורסים‬
‫את הנתונים הישנים כדי שנוכל לשחק בין מודלים‪ .‬אנו מחפשים כלים שיעזרו לנו להסביר את‬
‫ההיררכיה‪ .‬אחרי שמריצים את הנתונים (ביקשנו שני משתנים שהם משתנים על פני זמן) האחד‪,‬‬
‫משתנה ההגירה‪ -‬האם עבר דירה‪ ,‬ומשתנה ההכנסה‪ ,‬כ"א מהמשתנים בשלוש נקודות זמן‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫בנוסף קיימים גם המשתנים שאינם משתנים על‪-‬פני זמן‪ ,‬כמו מגדר‪ ,‬או גיל‪.‬‬
‫צריך לוודא שוב שהכנסנו בדיוק את המשתנים שיש בהם חזרות על‪-‬פני זמן (תצפית בשנה ‪ Y ,X‬ו‪.)Z‬‬
‫בנתונים אנו יכולים לראות שתצפית מס' ‪ ,0‬למשל‪ ,‬לא השתנתה במשך שלוש שנים מבחינת‬
‫המשתנים הקבועים‪ ,‬אך בשכר אנו רואים עליה וירידה‪ .‬בתצפית שתיים רואים התנהגות אחרת של‬
‫שכר‪ .‬כך גם לגבי הגירה‪ :‬אנו נראה לכל תצפית התנהגות שונה‪.‬‬
‫איך בונים מודל מתוך מבנה הנתונים הזה (‪ -)mixed linear‬מה שמעורב במודל הזה הוא מקור‬
‫השונות‪ :‬כשאנו מסתכלים על מערכת רגילה בנק' זמן אחת או בתצפית שאינה חוזרת על עצמה אנו‬
‫מניחים כי השונות נובעת או ממקור אקראי או ממקורות של המודל‪ ,‬כאן אנו משערים כי השונות‬
‫נובעת מרמה ‪( 0‬מקור שונות של התלמיד) ומרמה ‪( 2‬מקור שונות של הכיתה שמייצר שונות)‪ .‬אם‬
‫למקור מסוים יש תרומה מובהקת לשונות אז אנו יכולים לדווח כי קיים מערך היררכי לשונות‬
‫המובהקת‪.‬‬
‫צריך למצוא בספרות את המחשבונים המקובלים (זה קיים בספר גם)‪.‬‬
‫‪ -File- Save As‬כדי שיהיה לנו גם את המקור וגם את הטרנספורמציה‪ .‬נשתמש ב‪ 1,0‬ו‪ 2‬כדי שנדע‬
‫שהחותך מייצג את נקודת הזמן ההתחלתית אפס‪ .‬גם כאן מומלץ למרכז‪ .‬מרכוז נתונים מצמצם את‬
‫האפקט של מולטי קוליניאריות‪.‬‬
‫מודלים מהסוג הזה אנו עושים בשלושה חלקים‪ :‬יש לנו שלוש אמידות מרכזיות של המודל שחשוב‬
‫לציין ונורא מעניין אותנו לראות איך המודל מתפתח בשלושת האמידות הללו (איך כל יחידה משתנה‬
‫במדידות חוזרות)‪ .‬המערך האמפירי הוא תמיד‪:‬‬
‫‪‬‬
‫להריץ מודל בסיס ללא כל הסבר‪ -‬קודם כל ניתן למודל לבדוק את התנודתיות ללא כל הסבר‪.‬‬
‫אם אני רוצה לבדוק את התנודתיות האקראית של ההכנסה על פני זמן‪ ,‬זהו המשתנה‬
‫התלוי‪ ,‬אז המודל הוא ללא תנאים נוספים‪ -‬רק ההשתנות של ההכנסה על‪-‬פני זמן‪.‬‬
‫‪‬‬
‫לאחר מכן נכניס אפקטים עיקריים‪ :‬שלב ‪ 2‬בו בןדקים את השפעתם של האפקטים‬
‫העיקריים‪.‬‬
‫‪‬‬
‫ושלב ‪ 3‬הוא חיפוש אינטראקציות בין האפקטים העיקריים (המסבירים העיקריים) ולראות‬
‫את האינטראקציות שביניהם לבין הזמן‪ .‬האם יש להם השפעה על הזמן (האם למשתנים‬
‫ללא תלות זמן יש אינטראקציה עם הזמן)‪ .‬ואז אנו מקבלים תמונה מלאה‪.‬‬
‫מכיוון שיש התנהגויות שונות ראינו כי הזמן אינו ליניארי אלא היפרבולי ועדיין ניתן לבדוק את מודל‬
‫הבסיס לשלב שבו אין לנו תנאים מסבירים עדיין‪.‬‬
‫הזמן לא משתנה ביחידות קבועות אלא משתנה בריבוע ולכן אנו נבדוק מה תרומתו‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫ניתן לבחון כמה שונות מוסברת לאחר איחוד שלושת התצפיות של כל פרט (לאורך שלוש שנים)‬
‫ולאחר‪-‬מכן להשוות בין פרטים שונים‪.‬‬
‫‪ -Repeated‬מיהו הגורם שחוזר על עצמו? הזמן‪ .‬מה שהיה בזמן ‪ 2‬קשור למה שהיה בזמן ‪ ,0‬כלומר‪,‬‬
‫יש קשר בין מה שקרה אתמול לבין מה שקרה היום‪.‬‬
‫בשלב השלישי אנו בוחנים הכנסה כפונקציה של זמן (זמן‪.)2‬‬
‫התוצאות הן כמו ברגרסיה ליניארית רגילה (כל התוצאות יצאו מובהקות)‪:‬‬
‫‪:Estimate‬‬
‫‪1052‬‬
‫‪4043‬‬
‫‪-0011‬‬
‫‪8119+4543-1508= ~14'000‬‬
‫‪t=0: 8192‬‬
‫‪T=1: 8119+4543X1-1508X12‬‬
‫‪: 8119+4543X2-1508X22‬‬
‫‪t=2‬‬
‫ואז אנו יכולים לדווח שההשערה היא מובהקת‪.‬‬
‫האפקט הרנדומאלי של הזמן (העובדה שיש לנו שלוש מדידות לכל תצפית או לכל פרט נתמכת על‪-‬‬
‫ידי ) הטעות במדידת ההכנסה משתנה בכל נקודת זמן הטעות נדגמת מאוכלוסיה קצת שונה‬
‫(האקראיות היא שונה במקצת בכל נקודת זמן)‪.‬‬
‫עד עכשיו בדקנו את משמעות הרנדומליות של הזמן ומצאנו כי הוא יש שינוי מסוים באקראיות‬
‫בנקודות זמן שונות‪ .‬כעת נעבור לשלב השני בו מוסיפים אפקטים עיקריים‪.‬‬
‫מכניסים בראשון רק מין‪ ,‬גיל והגירה (שהוא תלוי זמן אבל לא השתמשנו פה עד כה‪ -‬צריך להסביר‬
‫שהוא משתנה מסביר אבל הוא נמדד ברמה ‪ .)0‬יותר מעניין אותנו לבדוק איך משתנים תלויי זמן‬
‫מתלכדים עם משתנים שאינם תלויי זמן‪.‬‬
‫דבר ראשון אנו רואים כי מספר הפריטים הנמדדים בכל מודל עולה בכל רמות ומקטין לנו את דרגות‬
‫החופש (במסגרת ‪ 0,011‬ניתן להוסיף עד כ‪ 21,01 -‬פריטים מבלי לפגוע יותר מדיי במודל)‪.‬‬
‫סדנת מחקר מרוכזת אוגוסט‪/‬ספטמבר ‪2102‬‬
‫מנחה‪ :‬אמיר חפץ‪,‬‬
‫כתבה במהלך הסדנה‪ :‬מורין חיו‪-‬חמו‬
‫יוזמת‪ :‬ד"ר דפנה קנטי‬
‫*המודל שלנו אומר כי אנשים מהגרים כי אנשים מהגרים כדי לחפש עבודה טובה יותר והכנסה גבוהה‬
‫יותר‪.‬‬
‫מצאנו אפקט לגיל (תוספת ‪ ₪ 21‬לשנה)‪ .‬אפקט הזמן כמעט ולא השתנה אבל אנו רואים הסברים‬
‫נוספים של האפקטים האחרים (ברגע שהמודל הבסיסי עבד אנו די אופטימיים לגבי השלב השני)‪.‬‬
‫כאן ב‪ estimate‬מדובר במקדמי השונות המשותפת‪.‬‬
‫‪ -Estimates of fixed effects‬אנו רואים שזמן וגיל יוצרים שיפועים שונים בין מבוגרים לעומת צעירים‪.‬‬