סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מפגש ראשון :מתיאוריה להשערות ,ממודל למסקנות חזרה על עקרונות המחקר האמפירי הכמותי והיכרות עם SPSS שעה – 0חשיבה כמותית ,שיטות מחקר כמותיות ,רקע ,כלי מחקר ,מגבלות. שעה - 2שיטות דגימה ,דגימה אקראית ,דגימה שיטתית ויעילות הדגימה. שעה – 3ארגון נתונים ,מסד הנתונים ,מבנהו ומרכיביו ,היכרות עם SPSS שעה - 4הצגה תיאורית של הנתונים SPSS ,ניתוח תיאורי SPSS ,בונה איורים מטלה :הצגת נתוני מדגם .......... תיאור התופעה- השיטה המדעית אומרת כי מצב המוצא ,כלומר השערת האפס ,היא ההשערה שיש לדחות. כאשר אנו מדברי על מדרג אנו מדברים על אפשרות לחריגות פרמטרית ,בגלל שאנו מדברים על מדרג (מבחן -)ANOVA ,tניתן לסדר אותם לפי מדרג ,והמדע תמיד כופה עלינו להיות שונים במחקר שעשינו על-מנת שנוכל לדווח על משהו חריג. רגרסיה- יכולת חיזוי -אחד הכלים החשובים ביותר במודל הוא שהמודל מייצר חיזוי .החיזוי הוא חשוב :אם יש אדם ששכרו מסוים ,וידועים לי נתונים נוספים לגביו ,נוכל לבצע חיזוי לגבי גורמים נוספים בזכות אותם משתנים ידועים (לאיזו קבוצה הוא שייך ,מהי האידיאולוגיה הפוליטית -ומה המודל מניח לגבי אותו פרט בעל מאפיינים אלה). ניתוח מדיניות -לוקחים את אותה אקסטרפולציה (אותה אינדוקציה) ומשליכים ומיישמים על אחרים. אם בנינו מודל על הקשר בין חינוך לתוצר ,נוכל לנתח מדיניות הבוחנת שיפור תנאי חינוך כתנאי לשיפור בתעסוקה. בפרק הדיון והמסקנות צריך תמיד לזכור שאנחנו פיתחנו כלי שחשוב לבדוק אותו -מה יקרה אם נעשה מדיניות שיהיו בה ערכים קצת שונים? האם הכלי מספק חיזוי מושלם? לא ,אבל הוא מספק חלק מן התמונה. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מהנקודה של ניסוח השערות ,בו מסכמים למעשה את החלק התיאורטי .השערת מחקר היא מחוברת לתיאוריה ,משהו שדנים בו ברמה התיאורטית ,ומבוססת על התיאוריה ולכן היא הבסיס לכל העבודה שלנו .לאחר שסיימנו לנסח את ההשערות ,סיימנו את התיאוריה ומתחילים לנסח את החלק האמפירי: מה אנו רוצים לאסוף (אילו נתונים?), איך (מהו מערך המחקר?) מרגע שיש לנו מערך מחקר אנו מתחילים לתרגם את ההשערות ,הכוללות את הקשר בין המשתנים, לרמה האופרציונלית: איך אנו מודדים זאת? מערך המחקר מתאר כיצד אנו רוצים למדוד. לשם כך עלינו ,ראשית כל ,להגדיר מהי אוכלוסיית היעד? יש תחומים שיש בהם מעט מאוד תיאוריה וסביר להניח שיהיה לנו קשה להגדיר מהי אוכלוסיית המחקר כי אין לנו תיאוריה להתבסס עליה. אוכלוסיית המחקר היא האוכלוסייה שתספק עבורנו את התשובות לשאלות ששאלנו. מספר מערכי מחקר מעניינים.... שלב התרגום מתיאוריה למחקר אמפירי -מערכי מחקר אפשריים: מדידות על-פני זמן ניסוי במעבדה (ניסוי מבוקר בו אנו יכולים לשלוט בתגובות של התצפית) -Cross sectionכשלוקחים תצפית ובוחנים אותה על גבי חתך של כל המימדים המעניינים אותנו עבור אותה תצפית. עדיין בשלב תכנון המחקר -עלינו לדעת כמה תצפיות עלינו לאסוף? עבור התשובה לגבי כמה צריך לדגום יש לפנות למשפט הגבול המרכזי: משפט הגבול המרכזי -כל ההסקה הסטטיסטית מבוססת על משפט הגבול המרכזי :משפט הגבול המרכזי מאפשר לנו להסיק מהפרט אל הכלל .אנו מבצעים מדגם המייצג את האוכלוסייה .יש לנו כמה מרכיבים במשפט הגבול המרכזי בהם אנו יכולים לשלוט ובעזרתם אנו יכולים לומר שאם אנו מעוניינים שתצא רמת מובהקות גבוהה עלינו להשתמש ביותר תצפיות. עלינו לבחור קריטריונים שיספקו את הקהילה המדעית בתחום בו אנו עוסקים. אנו רוצים לדגום nנדגמים -תוספת מידע=תוספת מהימנות. גודל המדגם מבוסס על רווח בר-סמך סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי ( Z2Xלהשלים את הנוסחה מהדף) לאמוד שונות באוכלוסייה הינה יותר אמינה מאשר אמידת ממוצע האוכלוסייה. כאשר המשתנה שלנו .. יש פעמים שמשתנה המחקר או משתנה המחקר מנוסחים בפרופורציות: כשמשתנה מחקר הוא דיכוטומי הוא מתפלג נורמלית בקירוב טוב מאוד ולכן משתמשים ב Zהנורמלי הרגיל שאנו מכירים. אם בפועל דגמנו .... כאשר יצאנו לשוק ודגמנו שם ,אבל אנו רוצים לחקור סטודנטים ,אז אנו בבעיה -עלינו להתמקד באוכלוסיית המחקר .ניתן להשתמש בשני כלים מאוד מקובלים להתמקד באוכ המחקר: מדגם שכבות :אם אנו רוצים שהמדגם יהיה פחות או יותר בהתאם למדגם האוכלוסייה (אשר למשל ,כוללת 31%סטודנטים 21% ,קשישים ו 01%בין הגילאים .)41-01 מדגם אשכולות :לדוגמה אם אנו מעוניינים באוכ' סטודנטים ,נלך לאוניברסיטה ,נדגום שם אשכול העונה על אוכ' המדגם שלנו ונדגום אותו. מדגם שיטתי :כל בניין רביעי ,למשל. הרבה פעמים מומלץ להיות אינטואיטיביים בהתאם לאוכלוסיית המחקר שבחרנו ואיזו שיטת דגימה הטובה ביותר לשם כך. סוגי משתנים איך אנו רוצים לתרגם ולדגום את ההשערות? דרך המשתנים שם משתנה תלוי בלתי-תלוי נומינאלי אורדינאלי רציף **טבלאות מוכרות -מומלץ להשתמש בהן במחקר מדידות -האופרציה של המשתנים: בקרה סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מדידה ישירה :למשל ,כששמים אדם על משקל ומציינים את המשקל ,גובה באמצעות מטר, טמפ' באמצעות מד-טמפ' מדידה עקיפה :יש משהו שבעקיפין מצביע על המדד הזה :לדוג' ,מה רמת התוצר באיזור מסוים? הולכים לחברת החשמל ומבקשים מדד זרימת חשמל באיזור התעשייה .המדד שלי על סריאוטיפיזציה ותפיסות שחיתות הוא מדד של מדידה עקיפה. מדידה מקורבת :כמה מכוניות יש בבית -כדי לשהליך על רמת ההכנסה עקרונות של ניהול מידע ותיעוד כאשר אנו מתחילים לאסוף את הנתונים ,להקליד אותם ,ויש ים של גרסאות והולכים לאיבוד :יש דרך לשמור על כל הנתונים והיא באמצעות יומן מעקב הכולל את הנתונים הבאים: .0לקודד משתנים -לדאוג שיש לנו מפתח קודים לכל משתנה :גם לגבי שם המשתנה ,כותרת המשתנה ,מה הסקאלה ( ,)1-0 ,0-0אם זה קטגוריות :מה התכונה של כל קטגוריה? בסוף היום לדאוג ולוודא שכל העבודה מקודדת .2כל הפעולות שעשינו דרך ה ,SPSS-לשמור את הפעולות :יש דרך לשמור את הפעולות הללו ואנו חייבים לשמור את הפעולות בקובץ סינטקס .תיעוד של העבודה המעשית שלנו חייב להיות מושלם. .3הפרוטוקול הוא כלי עבודה -יש לשמור על סדר כרונולוגי כדי לזכור מה עשינו מתי .וחשוב תמיד לעבוד על אותו מחשב כדי לא לדרוס נתונים! **קובץ בשם -GNLשומר את כל העבודה וההיסטוריה של העבודה שלנו (במידה ועבדנו על אותו מחשב). Output יוצר לנו פלט -ושומר את הנתונים של הפקודות שביקשנו ממנו .ניתן לשמור את זה אבל זה עולה לנו בהרבה זיכרון .יעיל יותר לשמור את קובץ הסינטקס. - File- New – Syntax -Koro problem set for ANOVAדוגמה לאיך לעשות מעקב על כל הפעולות שעשינו בSPSS http://psych.colorado.edu/~carey/Courses/PSYC7291/DataSets/Documentation/koro.ht m סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי שני סוגי ערכים: Numeric String יש לעבור על הכול ולוודא שאין מקרים של ברירת מחדל שאינה מתאימה לנו בכל פקודה ,יש לנו המון תפריטים והמון אפשרויות וכל פקודה ניתן להריץ באמצעות סרגל הכלים או לעשות קופי פייסט מהסינטקס. במקום לעשות ,Runכלומר ,להריץ את סט הפקודות שיצרנו ,יש ללחוץ על Pasteבמקום ,OK ולהעתיק לסינטקס ומשם אנו נריץ את הפקודה מתי שאנו רוצים. אם רוצים להכניס הערות שלנו יש להכניס * ואז המידע ,למשל ,תאריך +המידע של מה שעשינו ,ואז לתעד ,לתעד לתעד ,ואחרי זה להריץ. איך מריצים? מסמנים את הפקודה בסינטקס ואז לוחצים פליי ירוק (משולש ירוק). כיום ,מגרסה 01ומעלה ,יש את האופציה הזאת .מה המידע שהוא מספק לנו? .0איזה Datasetפעיל עכשיו? סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי .2 קשר בצורת -Logכשאנחנו בודקים רגרסיות אנו בודקים מבנה מצרפי ,ונניח רוצים לבנות מודל מעריכי ,אז עלינו ליצור טרנספורמציה. פקודות שגויות ניתן לשנות בתוך בסינטקס עצמו במקום להריץ אותן מחדש Copy :ולתקן בפעם השנייה שמעתיקים. כשמריצים מהסינטקס הוא מריץ את כל הפקודה עד שהוא מגיע לנקודה. Skewness Analyze - האושר הממוצע מוטה לכיוון הלא מאושרים :זוהי א-סימטריה ,כלומר שהמשתנה אינו מתפלג נורמאלי ואם אנו משערים כי האושר מתפלג נורמאלית תוצאות הסקר שלנו העלו כי אין הדבר כך. כשאנו עושים רגרסיה ליניארית אנו מניחים שהמשתנים המסבירים מתפלגים נורמלית ואם אנו מגלים שהם אינם מתפלגים נורמאלית אז יש לנו הטיות .ניתן לתקן את ההטיות באמצעות תקנון אבל צריך סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי לחזור לנתונים .הרבה פעמים מתקננים באמצעות .Logבמחקר שלי אני צריכה שוב לבדוק אם המשתנה מתפלג נורמלית .אם ה skewnessשונה מאפס אז קיימת הטייה. ניתן לחתוך משתנה רציף לקטגוריותTransform -Visual Binning: מעבירים את המשתנה הרציף ,הוא מראה לי את כל הערכים של המשתנה הרציף ואז אני יכולה לומר לו באילו נקודות לחתוך את המשתנה הרציף לקטגוריות. -Make cutpointsוניתן לבחור שנקודות החיתוך יהיו בסטיות התקן ואז אנו הופכים את המשתנה הרציף לקטגוריאלי ולראות אילו נתונים איבדנו\הפסדנו (זה יותר טוב מה recodeהרגיל(. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי ניתוח רב-מימדי- למשל ,אם רוצים חתך של לבנים ,שחורים ואחרים ,המחולקים בין שני איזורים :צפון ודרום ,כולל חתך של הגיל. גרפים מה ההבדל בין היסטוגרמה ל?bars- היסטוגרמה -משתנה רציף ,כלומר שהציר המודד את הערכים הוא רציף מנקודה מסוימת לנקודה הבאה ,ומהנקודה הבאה לנקודה שאחרי. -Barsמראה מעל קטגוריה מסוימת -מעין סף של קטגוריה Bar charts .בד"כ מראה שכיחות. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי -Boxplotנותן אפשרות לרכז בצורה גרפית מפגש שני :טיפול וטיפול מתקדם בנתונים השימוש ב SPSS-לטיפול בנתוני מדגם ,בניית מדדים וריבוד שעה – 0קידוד מחדש של משתנים לפי סוגי משתנים SPSS ,טרנספורמציות. שעה – 2ניתוחי שונות וניתוחי המשך SPSS ,ניתוח שונות חד-גורמי ורב גורמי. שעה – 3ניתוח גורמים SPSS ,ניתוח גורמים. שעה – 4ניתוח אשכולות SPSS ,ניתוח אשכולות. מטלה :ניתוח נתוני מדגם היום אנו עוברים מהשלב בו בדקנו את הנתונים שלנו מבחינה תיאורית ,איך המשתנים מתנהגים וכו'.היום נעשה שני דברים: .1נראה סוגים של מתאמים (משתנים רציפים ,קטגוריאלים ואורדינאליים) וכלים לבחינת המתאמים הללו .בסדנה אנו מסבירים את התוצאות שהמחשב מחשב מבלי לנסות להבין איך הוא עושה זאת ,כך נוכל לבחור בכלים המתאימים לנו מבלי להסביר את החישובים הסטטיסטיים ולבזבז זמן. .2ניתוח שונות ,מבחני ,tמבחנים מזווגים ANOVA ,וכו' .נעבוד על איסוף נתונים וניתוח הגורמים שבשאלון ,התוצאות והנתונים מבחינה מדעית ההיגיון אומר :קודם לחפש מסגרת תיאורטית להסביר את הבעיה בה אנו דנים ולאחר-מכן ,דרך אותה מסגרת תיאורטית נשער השערות לגבי הבעיה ונבחן אותן. דרך אחרת אומרת כך שניתן לבצע קודם גישושים ולאחר-מכן לכתוב את ההשערות :כאשר לוקחים כמה היגדים ובודקים אותם כמדד אחד – אז ניתן ליישם פקטור אנאליסיס ,ואז מגששים לגבי כמה קומבינציות ,מה מהן ומי מהן חזקה יותר ויציבה יותר ותואמת יותר את ההיגיון. כיום רבים משלבים ביניהם :כלומר שילוב של מחקר מאשש ומחקר מגשש. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי כאשר אנו אוספים נתונים אנו למעשה אוספים את המידע בו נשתמש לבצע תחזיות ולהסביר התנהגויות ,אבל חשוב לזכור שמדובר במדידות סובייקטיביות ולכן חשוב להסביר איך מדדנו ומדוע השתמשנו במדדים שבחרנו במסגרת הצגת מערך המחקר. .1כאשר אנו בודקים מתאמים אנו חייבים לדעת מהם המתאמים .מבחן חי בריבוע ,למשל ,אינו בודק מתאם. אנו מתחילים בפקודת מתאם: מתאם זה תמיד בין שני משתנים :כלומר ניתוח דו-מימדי המצביע על קשר ,על כיוון ועלינו להיות מאוד זהירים כי לא תמיד הצורה בה אנו חושבים על המשתנה מתאימה למתאם שאנו מציעים. משתנה רציף -יכול לקבל את כל הערכים (גובה ,משקל) ולרוב יהיה להם טווח ערכים מוגדר וברור (אין גובה נמוך מ 1-ס"מ) .את טווח הערכים נגדיר כהתנהגות נורמלית :גובה 0.21 למשל עד 2.31ס"מ .אנו צריכים לתקנן את המשתנה שמצאנו בשטח שהוא מקרה פרטי של התפלגות נורמלית .ההתפלגות הנורמלית הסטדנטרטית :בה הממוצע הוא 1והשונות היא .0 יש לנו ציר של סטיות תקן מימים ומשמאל לאפס ,אנו מסתכלים על התפלגות אליה אנו מתייחסים .פירסון מניח התפלגות רציפה ונורמלית .אם פירסון מניח התפלגות נורמלית ואנו מריצים מתאם בין שני משתנים או יותר (זוגות) ,ואנו מודאגים לגבי יחידות המדידה (בדידות) או ההתפלגות (אינה נורמלית) -מה הסיכוי שנקבל את השערת המחקר? אם נריץ אץ אותו המתאם בפירסון ונריץ אותו בספירמן המניח שהמדידות הן בדידות .אם אנו מודדים בהנחת הרציפות של המשתנה ולאחר מכן הולכים להנחה זהירה יותר ,ובודקים ספירמן, פירסון יהיה יותר מובהק כי הוא נותן לנו דרגת חופש גדולה יותר .אם לא הצלחנו בפירסון לא נצליח באחר. כאשר מוצאים מתאם חיובי אז כשאחד עולה השני עולה ,ולהיפך. אם אין בעיה בהתפלגות ( )Skewnessניתן להתייחס לליקרט כמשתנה רציף .צריך לבדוק את ההתפלגות של המשתנה ,איך היא נראית .טיפ :אם ראינו שהמשתנה לא עובד כרציף כדאי לנו לצמצם את הקטגוריות (מ 4-לשלוש ,למשל) ולאפיין את המשתנה מחדשף במקום כרציף כאורדינאלי או אפילו כנומינאלי. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי העברנו לימין שני משתנים: General happiness ?Is life exciting ואז יש שני מבחנים שסימנו :פירסון וספירמן .במקרה הזה דווקא ספירמן מתאים יותר כי מדובר בקטגוריות .1-0-2 כל התצפיות שיש להן ערכים חסרים הן מחוץ ולכן כאשר מדווחים על ניסיון לבצע חתכים חשוב מאוד לדווח גם על ה .N-יכול להיות שה 011-התצפיות שנחתכו יש להן חשיבות ולכן חשוב לדווח עליהן .כאשר המודל הולך ומתרחב ונרצה לבצע רגרסיות אנו צריכים לצמצמם את הדיווח אל תוך הנתונים שהם validבהתאם לניתוח הממוצע ,החציון והשכיח. אם שיערנו כיוון של קשר ניתן לבצע -one-tailedכך למשל אם שיערנו קשר הפוך .אם מצאנו מובהקות ב two-tailedאז בטוח קיימת מובהקות ב .one tailedחשוב להבין כי ההנחיה לגבי כיוון דורשת מחיר מסוים. המתאם יכול לנוע בין -0ל ,0-ויכול להיות קשרה מובהק אך חלש. אם R=0 -H0ו( H1-השערת החוקר) היא ,R≠0 אם הקשר לא ליניארי -צריך לשחק עם המשתנה ,בו המשתנים לא מתנהגים בצורה נורמלית ,נראה למשל ,בדרגת האושר ,מעין ענן ,אנו נראה את מה שנקרא תפוקה שולית פוחתת (התועלת כשיש הרבה היא נמוכה יותר מאשר כשיש לנו מעט) .לכן כדאי לקחת טרנספורמוציה מונוטונית שלוקחת את הערכים הגבוהים ומורידה מהם ואת הנמוכים ומורידה מהם (נניחו )logואז נבצע ביניהם קשר וזו דוגמה למשחק כזה. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי כשאנו באים לדווח על-כך כן חשובה לנו העובדה שלא הצלחנו למצוא קשר ליניארי ראשון, אך אם אנו מניחים שהקשר אינו ליניארי או שאנו רואים שהתנהגות הקשר הולכת ופוחתת ככל שעולים ,אז אפשר לשחק כדי לפתח תשובה מעניינת יותר למדוע לא מצאנו קשר ליניארי. כלי נוסף לחיפוש אחר קשר הוא -crosstabsזהו כלי דו-מימדי עבור ניתוח קטגוריאלי לחלוטין. אנו מבצעים מדידה מתוך הנחה שיש שלוש קטגוריות לאושר ושלוש קטגוריות להתרגשות ואנו רוצים לראות מה ניתן לדווח .זהו לא דיווח עיתונאי ,אלא דיווח בהתאם להשערות ולכ"א מהמבחנים עומדת מאחוריו השערה מסוימת. -Kappaמודד את מידת ההסכמה -כלי יעיל במקרים של מטריצה ריבועית (אותו מספר קטגוריות בשני המשתנים) וכאשר אנו רוצים למדוד באיזורי זמן שונים (למשל ,לפני ואחרי) .בודקים באמצעות השכיחות המופיעה באלכסון המרכזי (אלכסון ההסכמה) לאורך הטבלה .אם השכיחות באלכסון הולכת וגדלה אז זה אומר שיש קורלציה קטגוריאלית. חי בריבוע מציין כי קיימת תלות בין השורות לעמודות -כלומר ,האם כל שורה מתנהגת כמו כלל האוכ' או שהיא שונה ממנה .בחרנו ספר מבחנים העשויים להעיד על קיומו של קשר: סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי חשוב שכל המשתנים יהיו בעלי מספר זהה של ערכים (קטגוריות) ,לא עבור חי בריבוע אבלך עבור השאר. לא לשכוח לסמן ב.Rows & Columns cells - הערה :כאשר יש תאים שיש בהם פחות מחמישה %תאים :יש לחשוד בהם. -Koro problem set for ANOVAדוגמה לאיך לעשות מעקב על כל הפעולות שעשינו בSPSS http://psych.colorado.edu/~carey/Courses/PSYC7291/DataSets/Documentation/koro.ht m חלק שני של השיעור מדגם השוואתי :השוואה בין קבוצות ,יש לנו שתי אפשרויות :אפשרות להשוות בין קבוצה לקבוצה (בין גברים לנשים) אז אנו מניחים שאלה שתי קבוצות בלתי-תלויות ויש לנו אפשרות להשוות בין חזרות ,שכ"א נמדד בשתי נקודות או אירועים שונים (למשל ,מדידת לחץ דם בשתי נקודות זמן שונות). אם התייחסנו בשאלון לסקאלה של עמדות פוליטיות באמצעות סדרת שאלות אחת ובסדרת שאלות אחרת שאלנו שאלות עקיפות הקשורות לעמדות פוליטיות .אנו רוצים לדעת האם שני המדדים הללו אינם בעלי פער (הפרש) ,מי שימני תמיד נמדוד בצד הימני של המפה ומי ששמאלי בשמאל .זה מבחן tמזווג. השוואה בין קבוצות כמבחן -T סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי -One sample T testהשוואה מול תוחלת :נגיד שמחיר הדלק ,₪ 1ואנו רוצים לבדוק האם באזור הצפון הערך של הדלק שונה מ.1- -Independentהשוואה בין שתי קבוצות (נשים-גברים ,זקנים-צעירים) -Pairedמבחנים מזווגים כמו לחץ דם כאשר אותה תצפית חוזרת בבדיקות שונות אנו מניחים שיש מתאם בין הבדיקות -למשל אם אותו נבדק מופיע עבור משתנה אחד וגם עבור אחר. יותר תצפיות -דורשות הבדל קטן יחסית 01 ,תצפיות אינן דבר שניתן להסתמך עליו. מבחן לוין :כאשר sigגדול מ 1.10אז בודקים את השורה הראשונה .יש מקרים בהם הוא לא נותן רמת מובהקות ,ניתן להסתכל בטור האחרון ( )50%ונראה שה 1-נמצא בין ה Lowerל- .Upperאותו דבר אמרנו לגבי ה Skewness-אתמול :לא יכול להיות שייצא לנו 1מושלם ולכן יש להגדיר את תחום הערכים ההגיוני של ההפרשים בין הקבוצות ביחס ל .1-אם התחום הזה כולל את האפס זה אומר שכל הערכים המופיעים בטור האחרון כוללים את ה 1-אז ההפרש ביניהם כולל את ה .1-אם מגדילים את אזור אי-הדחייה ל ,55%-כלומר ,מצמצמים ל ,1.10-אנו מקטינים טעות מסוג ,0כלומר שאמרנו שיש משהו מובהק במחקר שלנו אבל המצב הטבעי הוא אקראי לחלוטין ,כלומר הגדלת אזור אי-הדחייה .הטעות ההפוכה היא טעות מסוג -2נדווח שלא מצאנו ,אבל דווקא אבל הוא לא בא לידי ביטוי כשאנחנו קשיחים מדיי. -One way ANOVAבו מודדים רק אפקט עיקרי ,על יותר משתי קבוצות. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מבחני פוסט הוק -לאחר מעשה ,כאשר מצאנו הבדלים בין קבוצות ,אנו רוצים לדעת בין אלו קבוצות :יש לנו אפשרות דירוג ,השוואה בין זוגות בכלים יותר מתקדמים. -Duncanמבצע דירוג ,מי הראשון והאם השני קרוב אליו ,מצרף אותו וכן הלאה -Tukeyבודק בין זוגות ניתן לבחור מספר סוגים של מבחנים המתאימים ביותר להשערת המחקר שלנו ,ומערך המחקר בהתאם .ההמלצה היא להתאים את המבחן למחקר שלנו לפי האינטואיציה ולפי איך שאנחנו מכירים את התפלגות המשתנים -לכן חשוב מאוד להכיר טוב טוב איך המשתנים מתפלגים. מסתכלים על ה -F-אם מעניין אותנו לאתר את מקורות השונות נסתכל על ה sig-ועל ה F-אם נמצא באזור הדחייה או לא (אומדן אותו מחשבים מתוך הנתונים ומשווים אותו מול טבלה סטנדרטית ואומרים האם ה F-באזור סטנדרטי או שהוא חורג) F .הוא יחס והוא חיובי= התפלגות. *כל המודלים הפרמטרים מניחים איזושהי התפלגות של המדגם :בין אם נורמלית או אחרת ,השערת המחקר משערת מה יקרה לאותו משתנה בכל חלק של ההתפלגות :כלומר דנים בשטח של איזור אי- הדחייה ,ככל שהחריגות יותר רחוקה -אז הערכים של Fיהיו גבוהים ויהיו מעט מאוד תצפיות בתחום שלנו .הF -מהווה מדד איכות המסביר משהו מעבר לאקראיות. -General Linear Modelכאן אנו כבר מתחילים לבנות מודל אותו נריץ ולהגיע למסקנות לגבי הקשר הקיים בין המשתנים :האם המתאם בין המשתנים שבדקנו משפר או מקטין את ההסבר על ההבדל .ואז אפשר לבדוק גורמים נוספים ולבחון כיצד הם תורמים עבור ההסבר שלנו למודל (חלק מהפיזור מוסבר ע"י משהו סיסטמטי ,ע"י תבנית אותה צפינו) .אנו בוחנים האם החלק של ההסבר של המודל שלנו מספק כדי שוכל לדווח על התנהגות עקבית ולבצע לאחר מכן חיזוי וניבוי. -Dependentהמשתנה התלוי אותו מסבירים (פה שמים את ה)pre- -Fixedהסבר אפשרי באמצעות גורם קבוע שעלול ליצור קראיות משום שמדובר בגורם קבוע (אותם עשיריה שמופיעים בכל פעם) -זה ה .Control-פה שמים את הgrouping- -Randomכאן ניתן לבחון האם האקראיות ,האם זה משפיע על השונות -Covariatesוניתן להכניס משתנים בלתי-תלויים נוספים המוסיפים הסבר למשתנה (זה כבר רגרסיה ליניארית). סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי יש גם אפשרות של -Bootstrapמומלץ בעיקר במדגמים קטנים -הוא משתמש בבריכת נתונים ,שולף ומחזיר ויוצר מספר גדול יותר של קומבינציות עבור מספר קטן של תצפיות. גודל המדגם או איכות המדגם ,אינם קשורים לגודל האוכ' משום שאנו מניחים שאת גודל האוכ' איננו יודעים .לכן ,מה שהמדגם שלנו מייצג מתבסס על השונות באוכלוסיה ,ודרך כך מציין בפנינו כמה דגימות אנו זקוקים כדי לייצג את האוכ'. מפגש שלישי :ניתוח הנתונים ברבדים שונים מערכי מחקר מורכבים והטיפול בהם בעזרת ,SPSSרגרסיה ליניארית שעה – 0המשך ניתוח שונות :טיפול במדידות חוזרות SPSS ,ניתוח שונות רב גורמי ופירוק השונות לגורמים. שעה – 2המשך ניתוח שונות :טיפול במדידות חוזרות SPSS ,ניתוח שונות רב גורמי ופירוק השונות לגורמים. שעה – 3רגרסיה ליניארית פשוטה ומרובה ,בדיקת השערות במודל רגרסיה בעזרת .SPSS שעה – 4המשך :רגרסיה ליניארית פשוטה ומרובה ,בדיקת השערות במודל רגרסיה. מטלה :בדיקת השערות במודל טיפ -אם יש מעבר בין גרסאות והגרסא החדשה לא קוראת :באתר של IBMניתן להוריד מתרגמים. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי ספר מצוין שאמיר ממליץ עליו http://www.amazon.com/Multilevel-Longitudinal- Modeling-Quantitative-Methodology/dp/1848728638 כמה מילים על רגרסיה.. אנו עוברים היום ממתאמים דו-מימדיים (קשר דו-מימדי) למתאמים רב-מימדיים (בין קבוצת משתנים מסבירים למשתנה מסביר אחד) .בצד המוסבר תמיד יהיה לנו משתנה אחד. רגרסיה -מערכת משוואות המסבירה את המשתנה המסביר ,המשתנה המסביר הוא פונקציה של קומבינציה ליניארית .קומבינציה של משתנים ומקדמים יוצרת יחידת הסבר של כל משתנה מוסבר ,לכל תצפית ותצפית .כלומר ,שרגרסיה ליניארית היא מודל אינקרמנטלי (תוספתי) ,משקל(מקדמי המשתנה) Xמשתנה +משקל Xמשתנה ,2וכן הלאה= שקלול ההסבר ברגרסיה אנו מנסים לאמוד קו ממוצע המייצג תופעה ,מתוך ידיעה שבפועל קיימות גם סטיות (לא כל הערכים נמצאים בדיוק על הקו) וקיים פיזור סביב הקו .מודל הרגרסיה מרכז את כל הערכים סביב הקו. האם הרגרסיה הינה הכלי המתמטי הטוב ביותר? כן ,לא קיים כלי מתמטי טוב יותר ממודל זה .מודל זה עובד על אותו עקרון כמו ניתוח שונות. מה מודדים? F,R2,∆R2 -Fצורת התפלגות בעזרתה אנו מודדים את טיב הרגרסיה .ככל שהערך יותר גדול ההסתברות יותר קטנה -אנו רוצים Fגדול כדי להוכיח שהרגרסיה מובהקת. -R2שיעור ההסבר מסך המדידה :מה מסביר המודל שלנו מתוך העולם האקראי? איזה חלק אינו אקראי בתוך העולם האקראי? אחוז השונות המוסברת. –Rמקדם מתאם של הקורלציה. מקדמי הרגרסיה -b :האם מובהקים ,מהי מובהקות ברגרסיה? בוחנים האם 0.5שונה בצורה מובהקת מ .1-תחום הערכים סביב מקדם שהוא 1יכול להיות סביר ,אבל מקדם 1לא תורם למשתנה המוסבר. מובהקות של משתני הרגרסיהb : מקדמים מנורמלים -β :מנורמל משמעותו שביתא מהווה משקל משמעותי בין ,-0-0אם מנרמלים את כל המשתנים נקבל שאין חותך (החותך שואף לאפס) ,כאשר ביתא מהווה את המדד האמיתי מהאוכלוסיה ,כי bהיא רק אומדן לשיפוע (אומדן לביתא מתוך האוכלוסיה) וביתא המנורמל אמור לייצג את המשקל המנורמל של כל משתנה במודל שלנו .מנורמל סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי משמעותו שסך כל המשקלות הללו צריך להסתכם ל .0-אם ניקח יחידה בסיסית ונכפול אותה במשקלות נקבל יחידה בסיסית של המשתנה תלוי. ניתן לדווח גם על סטיות תקן לוח דיווח על תוצאות הרגרסיה :אנו מדווחים בד"כ (חשוב ללמוד מה שפת הדיווח במדע המדינה -כדי לדעת על מה דיווחנו ומה צריך להופיע בלוח הדיווח). *יש גרעין קשרים המהווה את מודל הבסיס :מכיל את האפקטים העיקריים .בנוסף ,קיימים גם משתני בקרה ,אלה אינם משתני המודל ,אלא משתנים שאספתי ובודקים מה קורה לקשרים שבמודל הבסיס כאשר לוקחים בחשבון מרכיבים נוספים הקיימים בתוך הכאוס של האקראיות .קורה הרבה פעמים שאנשים מדווחים על משוואות מבניות ( )SEMאבל יוצרים מבנה מאוד סטטי של מספר מערכות קשרים ,אבל קיימת בעיה בדיווחים כי מדובר במודל מאשש בלבד ולא עשיתי גישוש (חיפוש אחר קשרים נוספים כדי לחזק את ההשערות הנוספות). לאחר הוספתן של ההשפעות הנוספות בודקים האם יש השפעה צולבת בין ההשפעות השונות. אינטראקציה בניתוח שונות -בודקים ומצליבים במטרה לראות השפעה של כל משתנה בעת קיומו של המשתנה האחר .זוהי האינטראקציה בין המשתנים .בדיוק אותם הסברים שיש לנו בניתוח שונות קיימים גם כאן .למשל ,אוכלוסיה הנמצאת תחת קטגוריה 'הכנסה' בהצלבה עם קטגוריה 'מיקום גאוגרפי' באינטראקציה נראה שככל שהיישוב גדל ,ההכנסה עולה ,ואז מנקודה מסוימת באזורים הגיאוגרפים הממש גדולים ,נתחיל לראות ירידה (בעקבות גורמים נוספים שנכנסים למשוואה) .זהו אפקט היפרבולי. דרגת חופש ראשונה= מספר הפקטורים פחות .0איזה מודל העמסתי על הרגרסיה? דרגת חופש שנייה= גודל המדגם פחות .0 דגימה היא פרס וקנס :ככל שדוגמים יותר יש ייצוג גדול יותר יש ייצוג גבוה יותר של האוכלוסיה ,אבל מאבדים דרגות חופש .ברגע שדרגות החופש יורדות ,קשה יותר להוכיח שהמודל שלי מובהק( .ה F-גובה תשלום עבור כל תוספת של מבנה). ,∆R2אם יש מודל מסביר ויש מודל נוסף בעל אפקטים נוספים צריך לשאול האם הגדלתי אתההסבר שהמודל מספק והאם בצורה משמעותית? חשוב שמודל הבסיס יכלול רק את המשתנה המסביר הקיים במודל שלנו כבסיס להתייחסות. *הפלט שאנו מקבלים מכיל המון דברים ,אבל לא הכול צריך. בד"כ אם שי לנו שאלון וענו 011איש אז מדווחים פעם אחת בהערה (.)n=500 תמיד לכתוב מה מקור הנתונים :מקור הנתונים הוא שאלון החוקר ,שנת איסוף וקרדיט לאוספים ,הסבר על מובהקות ,מובהקות ,גודל המדגם (אפשר גם בלוח עצמו) ,אבל אם שינוי סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי כתוצאה מהכנסת משתנים נוספים ,אפשר להסתפק ב .N=nרמת מובהקות של 01%גם יכולה להיות בהרבה מקרים הסבר. לא לשכוח :כשאנו כותבים טקסט על גבי הטבלה ,לדווח על נתונים מקוריים ,בנוסף להסברים שלנו עבור התוצאות. נניח ויש קטגוריה של משתנה מצב נישואים :בעל שלושה ערכים -זה לא מתאים לרגרסיה: לכן נפרק אותו לדו-משתני .משתנה נומינאלי בעל שלושה ערכים אינו משתנה רציף ומשום כך עלינו לפרקו למשתנה של "או זה או כל השאר" .מציאת המשקל צריכה להיות ביחס לאחר לא בהתאם לערכי הקטגוריה שניתנו לכל ערך .לחלוקה בה יש קבוצה קטנה מול קבוצה גדולה יש השפעה ("זה לא לא משנה") .איך מאתרים את הקיצונים בניתוח יוניטרי? עם תרשים .boxplot יש אפשרויות נוספות "לשחק" עם התצפיות :שולפים כמה החוצה ,מחזירים וכד' ..בהמשך נבחן את האפשרויות הללו. שאלת המחקר אותה נבחן בשלב זה :ניתוח ההכנסה האחרונה שנמדדה באמצעות מסבירים שונים :מגדר ,גיל והשכלה. את התחושות הראשונות הנוגעות לקשר הזה עלינו להציג בטבלה של קשרים דו-מימדיים (ספירמן ,פירסון וכד') :זה עם זה ,זה עם זה ,ורק לאחר מכן ניתוח קשרים רב-מימדי. סדר הכנסה של משתנים בבלוקים :אנו באים עם מודל תיאורטי איתו אנו מגיעים מהספרות אז במודל הבסיס יושבות כל ההשערות הבסיסיות שלנו ואליו אנו מתייחסים בראש ובראשונה -זה גרעין מודל ההשערות ,ואז בבלוק הבא יוצרים מודל שני הכולל משתני בקרה. ואז בבלוק השלישי בודקים למשל סיכויים של הצלבות בין משתנים (יחסי גומלין בתוך המודל). סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי בתוך האופציה של :statistics -Estimatesזה ה ,b-המקדמים שאומדים עבורנו. -Model fitמדדים לטיב המודל ( -Fבאמצעותו מדווחים האם המודל מובהק). -R squared changeמודד לנו כלמה כל משתנה הסביר. ניתן גם לסמן את ,outliers outline ,casewise diagnosticsואז מאתרים דרך זה את החריגים לתבנית ההתנהגות. באמצעות plotניתן לצייר גרפים של איך המודל מתנהג מול משתנה תלוי ,בלתי- תלוי וכן הלאה. יש אפשרות לשמור תוצרים המחושבים בפועל באמצעות .save -Bootstrapמתאים למי שיש מדידות מעטות (לקח לו שנתיים להשיג 011תצפיות)- באמצעות כך ניתן לבדוק מודלים קטנים בתוך התצפיות ולבדוק האם המודל הזה תקף ויציב לכל תת-מודל שנלקח ונבחן .כלי זה מאפשר לנו לעשות חזרות ולבדוק עד כמה האומדן יציב ולא משתנה (האם ממשיך להיות מובהק לאורך כלל התצפיות). -ENTERכל המשתנים שאני רוצה יכנסו במודל הזה -עדיף תמיד להשתמש בזה :אם יש לך מודל להשתמש בו כמו שהוא. ניתוח הפלט: ב -R2ראינו שלא היה שינוי ב -R change2רואים תרומה מעטה בלבד ,ולמשתנים הנוספים תרומה קטנטונת .ניתן לדווח גם על דרגות החופש ,או רק על המובהקות .בטבלה הראשונה אנו בודקים שינוי. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי כעת אנו רואים בלוח ה ANOVAאת היחס בין מה נמדד ברגרסיה לבין מה נמדד בכל השאר: היחס בין המוסבר ללא מוסבר. ה F -גבוה אבל במקרה הזה זה בגלל שהרמנו 0,011תצפיות .כאן אנו בודקים כל בלוק בנפרד. לאחר מכן אנו מגיעים לשלב המקדמים :מה עושה כאן ?βבאילו ערכים אנו יכולים לדבר על ביתא? אם יש לנו מבנה ליניארי: Y=a+b1X1+b2X2……..וכעת אנו רוצים לדעת מה המשמעות של -bשהוא האומד (הסיפור המעשי ,כלומר איך באמת המודל מתנהג ,כאשר ביתא הוא הסיפור התיאורטי). -yהכנסה ב2100- -X1הכנסה ( 1,111בשנת )2112 -0.0 =b1הכנסה ב 2100חלקי הכנסה ב.2112 התוצאה היא 02,111 הנגזרת היא ההשפעה השולית של ההכנסה ב ,2112-כלומר .0.0 חזרה לטבלת הפלט: בטור המובהקות ,כאשר המודל מובהק אז שונה מאפס באופן מובהק .אצל הנשים ניתן לראות בטור של Bכי אישה הרוויחה ₪ 421פחות (תוצאה שלילית) .במקרה זה כל המדידות שאנו רואים הן ביחידות של הכנסה. ניתן לראות שמודל הבסיס מצליח איכשהו לשמור על יציבות לעומת שאר המודלים. המובהקות נבחנת עבור כל מרכיב במודל ,כך למשל ,ניתן לראות ששנת הלימוד אינה מסבירה את ההכנסה.)p=0.611( , קוליניאריות -אם יש בעיית קוליניאריות אבל יש מודל מנוסח ומעוצב אז צריך להתמודד עם הבעיה. -Excluded variablesבד"כ צריך לבקש חקירה של בעיות מולטיקוליניאריות שנמצאו. חלק שני של השיעור שיטה חצי-אטומטית למרכוז. למה למרכז? מרכוז הוא נרמול חלקי ,כאן מעניין אותי רק לראות את המשתנים הנעיםמ סביב האפס כאשר הממוצע יהיה עכשיו האפס .אם כל המשתנים ממורכזים אז אכן האפס יהיה הערך הממוצע עבור כולם. פקודה הנקראת -aggregateהיוצרת משתנה אגרגטיבי של משתנים. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי למשל ,עבור מצב משפחתי ,לייצר את השכר הממוצע עבור רווקים ,נשואים וגרושים .ואז נוצר משתנה חדש :ממוצע ההכנסה בשנה מסוימת עבור מצב משפחתי מסוים. כשיוצרים אינטראקציות הרבה יותר קל לעבוד עם המשתנים הממורכזים .מה הערך של המשתנה הצפוי כשאני מניח שכל הערכים הם הממוצעים של המשתנים? איזה אפס אני אקבל? כאשר כולם ממוצעים (אפס) נקבל את ה.constant האם כשאנחנו ממרכזים משתנה האם אנו מורידים מהמשתנה? בעקרון לא ,כי מורידים ערך קבוע .מה כן משתנה? הביתא ,כי עכשיו הורדתי את הכול בכמות מסוימת אז גם האפקט שלו יהיה קצת שונה. -Break variablesלפי אילו משתנים לשבור? "מצב משפחתי" .אנו מבקשים שלכולם ייתן ערך ממוצע. קודם מבקשים ממנו לסדר ואז לבקש את הפונקציות. -Functionניתן לבקש כל מיני מדדים שיופיעו בערך קבוצתי (לנשואים יש את הממוצע שלהם ,לרווקים וכן הלאה). השפעות לא ישירות -מיתון ,משתנה מתערב ,אינטראקציות: בהשפעות לא ישירות יש לנו מצב בו אנו לא ממש יודעים מאיפה נוצרה ההשפעה (משתנה ממתן או משתנה מתערב) .אם יש שינוי בהתנהגות (בשיפוע) בהשפעה על ההכנסה היום ואתמול ,אנו רואים כי משתנה המין גורם לנו להבחין בין שתי התנהגויות שונות .לכן מרכוז עוזר לנו משום שיש לנו נק' מוצא אפס וכאשר התוצאה חיובית (מעל האפס) ....... סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי ) -Preacher Curran & Bauer (2006יצרו מחשבון שמסייע לנו באינטראקציות של שניים ושלושה משתנים. במקרה של תיווך נשתמש ב script-שכתב )Hayes, 2012( Hayesעל-מנת לחשב את החלק העקיף ומובהקותו בקשר שבין המשתנה המסביר והתלוי. http://afhayes.com/spss-sas-and-mplus-macros-and-code.html בתיווך אנו בודקים האם יש קשר העובר דרך המשתנה המתווך -במתערב אנו בודקים השפעה של המשתנה גם על הבלתי-תלוי וגם על התלוי. במקרה התיאוריה של ברון וקני יש חידושים בתחום ועל-כן יש לבדוק אותם ,כך למשל, החידוש בתחום אומר שלא חייבים שכל התנאים יתקיימו כדי שתהיה השפעה של מתווך. יש המון סוגים של משתנים :יש עשרות מודלים שניתן לבדוק ,כ"א תלוי במודל שלו .יש מודלים הכוללים גם משתנה מתערב וגם משתנה מתווך. מריצים את הפקודה שלו מה( scriptמופיע אחרי הסינטקס)מדביק ומפעיל: סדר הפעולות: ניתן להוריד את הפקודה בzip ואז File-open-script- hayes מופיעה הפקודה -ואז מכניסים את הנתונים הבאים: משתנה תלוי: משתנים מתווכים: משתנה בלתי-תלוי: בכיתה הכנסנו הכנסה כמשתנה תלוי כמשתנה מתווך את גיל והשכלה בלתי-תלוי -הכנסה ב2112- -Covariateמין -מוודא שאין מתאם גבוה מדיי וחפיפה בין המשתנים. ואז מריצים. ואז מקבלים דיווח מלא של מהם המשתנים במודל לאחר מכן גודל מדגם ואז הוא מציג את הנתיבים בין הבלתי-תלוי למתווך אפקטים ישירים על תלוי סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי אפקט כולל של בלתי-תלוי על תלוי באפקט העקיף של המתווך נמצא ,1.130רואים ש zקטן מאוד ( )1.0012ולכן pגדול ולא מובהק. אנחנו מדווחים על האפקט ,את ה Z-ואת ה p-ולהוסיף טורים של bootstrapומדווחים על ה- upperוה.lower- שני יתרונות לכלי של הייז: .0אנחנו לא צריכים לחשב שום דבר לבד. M b2 b1 b4 Y b3 X -B4קשר XYבנוכחות M B2Xb3=indirect effect מה שמעניין אותנו זה הקשר בין b2ו b3מול b1 אנו רוצים לראות מה הערך של היחס הזה ,ואיך הוא מתפלג (האם אכן מתפלג בהתאם להשערה שלנו). *במקרים שבהם יש תיווך על המשתנה התלוי :כיצד זה ייתכן? IID-independent identical distribution הרעיון הוא שדגמתי דגימה אקראית מלאה :המניחה שכל תצפית היא בלתי-תלויה בתצפית האחרת ,אין לה קשר ,וההסתברות (ההנחה היא שאין שוויון שונויות ושה covariantהוא אפס). כאשר אני מניח שיש או תיווך או מיתון אני יכול להניח :אם זה מיתון אנו מניחים שונויות שונות ואם זה מיתון אנו מניחים שהקו הוא אפס. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מפגש רביעי :מודלים ליניאריים ואחרים בחינת השערות מורכבות ומקרים שונים של משתנים תלויים. שעה – 0מודל מעורבים ,רגרסיה ליניארית SPSS ,רגרסיה ליניארית עם אפקטים מעורבים. שעה – 2רגרסיה למשתנים תלויים לא רציפים. שעה – 3רגרסיה למשתנים תלויים לא רציפים. שעה – 4שיטות וצורות דיווח ,איך לדווח ,מה לדווח. מטלה :טיפול בנתונים אישיים היום נמשיך בנושא הרגרסיות כאשר המשתנה התלוי אינו רציף .ישנן מספר הנחות אותן מניחים כאשר המשתנה הוא רציף שאינן מתאימות ולכן יש להתאים את המודל למקרה שבו המשתנה התלוי אינו רציף. דוגמאות למקרים דנן: למשל ,מודלים בהם המשתנה רציף רק בחלקו ,משתנה קטום ,למשל מדידת ביקוש בה חושפים אדם למספר חלופות וקיימת רציפות של מחירים ורצון האדם לקנות .אבל אין מחירים שליליים בשוק ,ולכן יש רציפות המתחילה בערך אפס עד מחיר מסוים ונקטמת בערך הזה ממנו שמאלה (ערכים שליליים לא קיימים),נ כל אלה שדיווח כי הם מוכנים לשלם ( 1לא מעוניינים במוצר) יוצרים רציפות נסתרת לצד שמאל ולכן אנו אומדים אותה באמצעות נקודת האפס. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי אדם עם השכלה גבוהה אינו מעוניין בפעילויות פנאי מתחומים מסוימים ולכן המוצר שאנו מציעים לו איננו רלוונטי עבורו -ולכן ההנחה שקיים משתנה רציף קיים נפגמת ויש לטפל במשתנה התלוי באופן שונה. מודל -Tobitעוסק בבעיית המשתנה התלוי שאינו רציף. זהו מודל שהקטגוריות בו זהות במשקלן זו לזו .אנו מסתמכים על הבחירה בפועל ,אין לנו אפשרות לדעת מה העדפתו של האדם אלא אם קיבלנו אינדיקציה לכך מהאדם עצמו. בעיה של משתנה תלוי קטגוריאלי: העדפות נגלות :כששואלים אדם מה הוא מעדיף הוא זורק משהו בין אפשרויות בחירה ולכן יש בעיה של העדפה נסתרת שלא היתה קיימת באפשרויות הבחירה שנתנו לו -IIA- Indifference…. Alternativeכאשר אין העדפה מסוימת כלפי אחת מן הקטגוריות ,מסיבה כזו או אחרת (לרוב ,סיבה פרטנית הקשורה לאישיותו של הפרט). לפיכך ,כל חלופה פועלת באופן בלתי-תלוי בחלופות האחרות ולכן משקלה נפרד. קיימות דוגמאות רבות למשתני בחירה קטגוריאליים ,העבודה החשובה ביותר שעסקה בתחום זה של דניאל מק'פדן ,שיצר מודל בתחום. המודל האחרון אותו נבחן הוא מודל אורדינאלי בו יש סדר ולסדר יש משמעות .למשל ,כמות כוסות קפה ששותים ביום ,או סיגריות ,מאחורי מידת צריכת הקפאין או הסיגריות עומד משתנה רציף ,אבל גם כאן יש לנו טיפוסי ,Tobitשאינם משתייכים לקטגוריות במוצעות בפניהם ולכן יש לקחת גם אותם בחשבון .לאלה יש משקל אפס ש SPSSאינו יודע לבדוק. בסופו של דבר ,כשאנו חוקרים מספר של טיפוסים ,אנו רוצים לייצר הסתברויות לבחירת חלופות עבור טיפוס א ,ב ,ג. מודלים ליניאריים הסתברותיים .בספרון שהועבר בכיתה ניתן לראות לוח .... נניח ולא הכנסנו עמודה שבה הנשאל יכול לבחור שלא להביע דעה ,אז יש לנו יכולת להכליל את ההעדפות הסמויות שלא נכללו תחת אותו משתנה. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי הקבוצה האמצעית כוללת את המודלים בהם נשתמש .אנו בחרנו בכיתה באפשרות של .multinominal המשתנה חייב להיות קטגוריאלי. כשנבדוק יחס הסתברויות נבדוק לא רק מה הסתברויות הפגיעה אלא גם מה יחס בין שיעורי הטעות לשיעורי הפגיעה. לאחר שהרצנו נראות היא מכפלת ההסתברויות בסה"כ ואנו מנסים להגיע למקסימום נראות של המודל (כאשר מכפלת ההסתברות נותנת לנו את ההסתברות הכי גבוהה של המודל כולו) .אנו אומדים יחס בין נראות בסיסית (ללא שום הסבר) לנראות בה אנו מוסיפים משתנים מסבירים. נראות ללא משתנים מסבירים היא כמו לזרוק מטבע ,כלומר ,היחס בפועל .בכיתה ראינו כי המבחן שנבדק לא מייצר ערך מובהק ולכן אינו עומד במבחן המציאות. דיווח על חי בריבוע במקרה של הרגרסיה הזאת הינו שווה ערך ל ,F-כלומר ,ככל שחי בריבוע גדול יותר ,ההסתברות לטעות קטנה יותר. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי מדד ( R2שיעור ההסבר שהמודל מספק לנו) נובע מהערך חי) כפול) Xמספר הפריטים (מספר המשתנים). לאחר מכן אנו רואים בטבלה הנקראת Likelihood Ratio Testאת תרומת המשתנים לנראות- תרומתו של כל משתנה לנראות .גם ב.Parameter Estimate מה מדווחים? גם כאן מדווחים על ה( b-על מקדמי הרגרסיה ,בדיוק אותם מקדמים אותם אמדנו ברגרסיה הליניארית אלא שאלה מנבאים הסתברויות). מדווחים על מובהקות. מדווחים על סטיית תקן. -Waldכמו בדיקת ,tמשתמש בחי בריבוע ,ניתן לבקש zבמקום זה באמצעות טרנספורמציה. נקודה חשובה למודלים הללו :כדאי למרכז משתנים. מודל אורדינאלי: להשלים....... מודל בינארי עם nחזרות: חלק שני של השיעור :בקובץ שקיבלנו מאמיר ניתן לראות את לוח XXשל מערך מחקר רב- שכבתי ,דוגמה למחקרים של תוצרי מדיניות חינוך כהישגי תלמידים. תצפי רמה 1 ת תלמיד .תלמיד . . . .תלמיד תלמיד תלמיד . . . . תלמיד תלמיד רמה 2 כיתה כיתה כיתה כיתה משתנים תלויים משתנים בלתי תלויים משתני בקרה רמה :0 רמה :0 רמה :0 הישגי התלמידים (נומינאלי) (אופרטיבי)מבחנים בשפה זרה. תיקוף (מחקרים קודמים) יכולות התלמיד (נומינאלי) הערכת ביצועי התלמיד (נומינאלי) רמה :2 משתני רקע של התלמיד (נומינאלי) מבחנים למורה (נומינאלי) הערכת המורה (נומינאלי) (אופרטיבי) הערכתהמורה על ידי המנהל. השתלבות בכיתה (נומינאלי) רמה :2 חומר הלימוד (נומינאלי) נתוני כיתת הלימוד (נומינאלי) (אופרטיבי) מספר תלמידים בכיתה.( -אופרטיבי) אווירה בשיעורים סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי . . . . תלמיד נתוני בית הספר (נומינאלי) (אופרטיבי) סוג ביה"ס (ממלכתי ,ממ (אופרטיבי) הישגי ביה"ס.( -אופרטיבי) רמה סו"אק של ביה"ס. נניח ויש לנו 0,011תלמידים כמדגם המהווה חתך של כל הארץ .אבל אפילו אם לקחנו כיתה בכל בי"ס יש לנו בעיה של תאימות בתוך כל כיתה -כי כל התלמידים לומדים אותו שיעור אצל אותה מורה. אז מה אנו בודקים? משתנים תלויים :הישגי התלמידים כמשתנה נומינאלי. את המשתנים הבלתי-תלויים אנו הולכים להסביר זאת בשתי רמות :רמה 0היא יכולות התלמיד (למשל ,לבקש את הערכת המורה של ביצועי התלמיד) ורמה 2היא מבחנים למורה -אולי המורה בעייתי? האם הוא הוכשר למדיניות זאת? במשתני בקרב יש לנו ברמה הראשונה את משתני הרקע של התלמיד. השונות המוסברת אינה מוסברת רק על-ידי התלמידים ,אלא גם על-ידי הבי"ס. תכני העבודה יותר מתאימה להצעת מחקר מאשר למחקר. מערך הנתונים שלנו הוא ( ,cross sectionניתן למצוא זאת בספר שהוצג לנו אתמול) כאשר מודדים כל תצפית בנקודות זמן שונות .כאן למשל ,תהיה לנו תצפית והמדידה שלה לאורך שלוש שנים .אנחנו לא נקליד את התצפיות הקודמות מחדש ולכן יש כלי שיכול לעשות טרנספורמציה למשתנים וחוסך עבודה רבה: סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי :Variables to cases מיהם המשתנים להם רוצים לבצע שינוי מעמד ( :)variables to be transposedאנו רוצים שבמקום שיהיו לנו תצפית אחת לכל שנה (סה"כ שלוש תצפיות לשלוש שנים) אנו רוצים שיצור תצפית אחת לשלוש שנים כמשתנה אחד. אנו לא רוצים לאבד נתונים ברמה ( 2למשל ,גיל התצפית בתחילת הניסוי הוא קבוע כי כל התצפיות זזות באותו זמן) ,או למשל מה היתה שביעות הרצון בנקודה האחרונה -אלה משתנים שאינם משתנים על-פני זמן. הכנסנו שלושה משתנים (הכנסה בשנה Y ,Xו )Zומהם אנו רוצים להפוך משתנה אחד לכל תצפית. *צריך מראש במערך המחקר לבחור במדגם בו נוכל למספר את התצפיות ולחזור אליהן (מינימום 31 סטודנטים לדגימה) כדי שנוכל לחזור אל אותן תצפיות. אחרי זה יש לשמור זאת תחת שם חדש ואז נדע להבחין בין המשתנה הישן לחדש אנו לא דורסים את הנתונים הישנים כדי שנוכל לשחק בין מודלים .אנו מחפשים כלים שיעזרו לנו להסביר את ההיררכיה .אחרי שמריצים את הנתונים (ביקשנו שני משתנים שהם משתנים על פני זמן) האחד, משתנה ההגירה -האם עבר דירה ,ומשתנה ההכנסה ,כ"א מהמשתנים בשלוש נקודות זמן. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי בנוסף קיימים גם המשתנים שאינם משתנים על-פני זמן ,כמו מגדר ,או גיל. צריך לוודא שוב שהכנסנו בדיוק את המשתנים שיש בהם חזרות על-פני זמן (תצפית בשנה Y ,Xו.)Z בנתונים אנו יכולים לראות שתצפית מס' ,0למשל ,לא השתנתה במשך שלוש שנים מבחינת המשתנים הקבועים ,אך בשכר אנו רואים עליה וירידה .בתצפית שתיים רואים התנהגות אחרת של שכר .כך גם לגבי הגירה :אנו נראה לכל תצפית התנהגות שונה. איך בונים מודל מתוך מבנה הנתונים הזה ( -)mixed linearמה שמעורב במודל הזה הוא מקור השונות :כשאנו מסתכלים על מערכת רגילה בנק' זמן אחת או בתצפית שאינה חוזרת על עצמה אנו מניחים כי השונות נובעת או ממקור אקראי או ממקורות של המודל ,כאן אנו משערים כי השונות נובעת מרמה ( 0מקור שונות של התלמיד) ומרמה ( 2מקור שונות של הכיתה שמייצר שונות) .אם למקור מסוים יש תרומה מובהקת לשונות אז אנו יכולים לדווח כי קיים מערך היררכי לשונות המובהקת. צריך למצוא בספרות את המחשבונים המקובלים (זה קיים בספר גם). -File- Save Asכדי שיהיה לנו גם את המקור וגם את הטרנספורמציה .נשתמש ב 1,0ו 2כדי שנדע שהחותך מייצג את נקודת הזמן ההתחלתית אפס .גם כאן מומלץ למרכז .מרכוז נתונים מצמצם את האפקט של מולטי קוליניאריות. מודלים מהסוג הזה אנו עושים בשלושה חלקים :יש לנו שלוש אמידות מרכזיות של המודל שחשוב לציין ונורא מעניין אותנו לראות איך המודל מתפתח בשלושת האמידות הללו (איך כל יחידה משתנה במדידות חוזרות) .המערך האמפירי הוא תמיד: להריץ מודל בסיס ללא כל הסבר -קודם כל ניתן למודל לבדוק את התנודתיות ללא כל הסבר. אם אני רוצה לבדוק את התנודתיות האקראית של ההכנסה על פני זמן ,זהו המשתנה התלוי ,אז המודל הוא ללא תנאים נוספים -רק ההשתנות של ההכנסה על-פני זמן. לאחר מכן נכניס אפקטים עיקריים :שלב 2בו בןדקים את השפעתם של האפקטים העיקריים. ושלב 3הוא חיפוש אינטראקציות בין האפקטים העיקריים (המסבירים העיקריים) ולראות את האינטראקציות שביניהם לבין הזמן .האם יש להם השפעה על הזמן (האם למשתנים ללא תלות זמן יש אינטראקציה עם הזמן) .ואז אנו מקבלים תמונה מלאה. מכיוון שיש התנהגויות שונות ראינו כי הזמן אינו ליניארי אלא היפרבולי ועדיין ניתן לבדוק את מודל הבסיס לשלב שבו אין לנו תנאים מסבירים עדיין. הזמן לא משתנה ביחידות קבועות אלא משתנה בריבוע ולכן אנו נבדוק מה תרומתו. סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי ניתן לבחון כמה שונות מוסברת לאחר איחוד שלושת התצפיות של כל פרט (לאורך שלוש שנים) ולאחר-מכן להשוות בין פרטים שונים. -Repeatedמיהו הגורם שחוזר על עצמו? הזמן .מה שהיה בזמן 2קשור למה שהיה בזמן ,0כלומר, יש קשר בין מה שקרה אתמול לבין מה שקרה היום. בשלב השלישי אנו בוחנים הכנסה כפונקציה של זמן (זמן.)2 התוצאות הן כמו ברגרסיה ליניארית רגילה (כל התוצאות יצאו מובהקות): :Estimate 1052 4043 -0011 8119+4543-1508= ~14'000 t=0: 8192 T=1: 8119+4543X1-1508X12 : 8119+4543X2-1508X22 t=2 ואז אנו יכולים לדווח שההשערה היא מובהקת. האפקט הרנדומאלי של הזמן (העובדה שיש לנו שלוש מדידות לכל תצפית או לכל פרט נתמכת על- ידי ) הטעות במדידת ההכנסה משתנה בכל נקודת זמן הטעות נדגמת מאוכלוסיה קצת שונה (האקראיות היא שונה במקצת בכל נקודת זמן). עד עכשיו בדקנו את משמעות הרנדומליות של הזמן ומצאנו כי הוא יש שינוי מסוים באקראיות בנקודות זמן שונות .כעת נעבור לשלב השני בו מוסיפים אפקטים עיקריים. מכניסים בראשון רק מין ,גיל והגירה (שהוא תלוי זמן אבל לא השתמשנו פה עד כה -צריך להסביר שהוא משתנה מסביר אבל הוא נמדד ברמה .)0יותר מעניין אותנו לבדוק איך משתנים תלויי זמן מתלכדים עם משתנים שאינם תלויי זמן. דבר ראשון אנו רואים כי מספר הפריטים הנמדדים בכל מודל עולה בכל רמות ומקטין לנו את דרגות החופש (במסגרת 0,011ניתן להוסיף עד כ 21,01 -פריטים מבלי לפגוע יותר מדיי במודל). סדנת מחקר מרוכזת אוגוסט/ספטמבר 2102 מנחה :אמיר חפץ, כתבה במהלך הסדנה :מורין חיו-חמו יוזמת :ד"ר דפנה קנטי *המודל שלנו אומר כי אנשים מהגרים כי אנשים מהגרים כדי לחפש עבודה טובה יותר והכנסה גבוהה יותר. מצאנו אפקט לגיל (תוספת ₪ 21לשנה) .אפקט הזמן כמעט ולא השתנה אבל אנו רואים הסברים נוספים של האפקטים האחרים (ברגע שהמודל הבסיסי עבד אנו די אופטימיים לגבי השלב השני). כאן ב estimateמדובר במקדמי השונות המשותפת. -Estimates of fixed effectsאנו רואים שזמן וגיל יוצרים שיפועים שונים בין מבוגרים לעומת צעירים.
© Copyright 2024