חוברת הדרכה

‫שם הקורס‪ :‬יסודות ‪PSPP‬‬
‫שם המרצה‪ :‬ד"ר ירון גילאי‬
‫נושאי הקורס – חלק א'‬
‫נושא מס' ‪ :1‬מבוא ‪3 ................................................................................................‬‬
‫כללי ‪3.............................................................................................................................‬‬
‫עיבודים בסיסיים‪ :‬טבלת שכיחות ‪5....................................................................................‬‬
‫תרגיל – דו"חות שכיחות ‪01 ...............................................................................................‬‬
‫נושא מס' ‪11 ................................................................................... Data editor :2‬‬
‫מבוא ‪00 ..........................................................................................................................‬‬
‫קביעת סוג המשתנה וכינוי ‪01 ............................................................... Type and Label -‬‬
‫קביעת ערכי משתנה וכינויים ‪01 ................................................................. Value labels -‬‬
‫ערכים חסרים – ‪05 .................................................................................. Missing values‬‬
‫תרגיל – הקמת קובץ ‪ sav‬חדש ‪01 .......................................................................................‬‬
‫נושא מס' ‪ :3‬יסודות סטטיסטיקה תיאורית ‪11 ..............................................................‬‬
‫סולמות מדידה ‪01 ............................................................................................................‬‬
‫סטטיסטיקה תיאורית ‪ -‬משתנים קטגוריאליים ‪01 ...............................................................‬‬
‫סטטיסטיקה תיאורית ‪ -‬משתנים רציפים ‪11 ........................................... Scale Variables -‬‬
‫היסטוגרמה עבור משתנים רציפים (‪11 .................................................... )Scale Variables‬‬
‫תרגיל – חישוב סטטיסטים ‪13 ...........................................................................................‬‬
‫נושא מס' ‪ :4‬עבודה עם ‪22 .............................................................................. Syntax‬‬
‫"הדבקת" סינטקס ‪15 .......................................................................................................‬‬
‫עריכת סינטקס ‪11 ............................................................................................................‬‬
‫הקלדת פקודות‪ ,‬שמירה ופתיחת קובץ סינטקס ‪12 ...............................................................‬‬
‫סינטקס לקביעת התצוגה המספרית בפלט ‪11 ......................................................................‬‬
‫הרצת קובץ סינטקס ‪11 .....................................................................................................‬‬
‫תרגיל – עבודה עם סינטקס ‪11 ...........................................................................................‬‬
‫נושא מס' ‪ :2‬ברירת אוכלוסיה בקובץ ‪31 ............................................................... Data‬‬
‫ברירת אוכלוסיה ‪30 ..........................................................................................................‬‬
‫תרגילים – ברירת אוכלוסיה ע"ב ביטויי תנאי ‪35 ....................... ................................ ................................‬‬
‫בחירת מדגם אקראי ‪31 ......................... ................................ ................................ ................................‬‬
‫תרגיל – בחירת מדגם אקראי ‪31 ........................................................................................‬‬
‫פיצול קובץ ‪11 ..................................................................................................................‬‬
‫שינוי מצב הקובץ ממפוצל ללא מפוצל ‪10 ............................................................................‬‬
‫תרגיל – פיצול קובץ ‪10 ......................................................................................................‬‬
‫נושא מס' ‪ :6‬סטטיסטיקה תיאורית – ‪43 ..................................... Descriptives/Explore‬‬
‫‪13 .............................................................................................................. Descriptives‬‬
‫תרגיל – ‪15 .................................................................................................. Descriptives‬‬
‫‪11 ..................................................................................................................... Explore‬‬
‫תרגיל –‪( Explore‬קובץ ‪50 ..................................................................... )L2-multiple.sav‬‬
‫‪1‬‬
‫נושא מס' ‪ :7‬ממוצעים ‪24 ............................................................................. Means -‬‬
‫תרגילים – ממוצעים ‪55 ....................................................................................... Means -‬‬
‫נושא מס' ‪ :1‬משתנים מחושבים בקובץ ‪25 ............................................................ Data‬‬
‫חישוב משתנה חדש (משתנה מחושב) ‪55 ..............................................................................‬‬
‫תרגיל – חישוב פשוט של משתנה חדש ‪10 ............................................................................‬‬
‫שימוש בפונקציות בביטויים מתמטיים ‪11 ...........................................................................‬‬
‫תרגילים – חישוב משתנה חדש באמצעות פונקציות ‪11 .........................................................‬‬
‫התניית ביצוע חישוב משתנה באמצעות ביטויי תנאי (או ביטויים לוגיים) ‪12 ............................‬‬
‫תרגיל – התניית ביצוע חישוב של משתנה חדש ‪11 ................................................................‬‬
‫קידוד מחדש של משתנה (‪15 ................................................................................ )Recode‬‬
‫תרגיל – קידוד מחדש של משתנה (‪25 .................................................................... )Recode‬‬
‫יצירת משתנה קטגוריאלי ממשתנה רציף ‪21 ......................................................................‬‬
‫תרגיל – יצירת משתנה קטגוריאלי ממשתנה רציף ‪25 ..........................................................‬‬
‫נושא מס' ‪ :5‬מיון קובץ ‪ Data‬ובקרת נתונים ‪18 ..............................................................‬‬
‫מיון קובץ ‪11 ........................................................................................................... Data‬‬
‫תרגיל – יצירת קובץ משני ומיונו (קובץ ‪11 ........................................................ )kesher.sav‬‬
‫איתור שגיאות הזנה בקובץ ‪ Data‬ותיקונן ‪13 .......................................................................‬‬
‫מחרוזת שלא הוזנה ‪13 ........................... ................................ ................................ ................................‬‬
‫משתנה נומרי שגוי או שלא הוזן ‪15 .......... ................................ ................................ ................................‬‬
‫תרגיל ‪ -‬איתור שגיאות הזנה בקובץ ‪12 ....................................................................... Data‬‬
‫תרגיל – גזירת מדגם מקובץ ומיונו ‪11 .................................................................................‬‬
‫‪3‬‬
‫יסודות ‪PSPP‬‬
‫נושא מס' ‪ :1‬מבוא‬
‫כללי‬
‫‪ .0‬הפעל את התוכנה ע"י הקשה על האייקון‬
‫‪ .1‬מהתפריט בחר‪:‬‬
‫‪.‬‬
‫‪File‬‬
‫‪Open‬‬
‫ייפתח חלון כדוגמת הבא‪:‬‬
‫‪ .3‬פתח קובץ ‪( Data‬בעל סיומת ‪ )sav‬המשמש לתרגול‪. demo.sav :‬‬
‫‪1‬‬
‫ייפתח החלון הבא (חלקי)‪:‬‬
‫‪ .1‬החלון הנ"ל הוא במצב ‪ :Data View‬בראש כל עמודה מופיע שם משתנה (או שדה) ואילו כל‬
‫שורה מיועדת לייצג תצפית (או רשומה)‪ .‬במילים אחרות‪ ,‬כל משתנה מייצג שאלה בשאלון‬
‫ואילו כל שורה מייצגת משיב אחד (תצפית)‪.‬‬
‫‪ .5‬ע"י הקלקה על ‪( Variable View‬בפינה השמאלית התחתונה)‪ ,‬תתקבל התצוגה הבאה‪:‬‬
‫‪ .1‬בצע שמירה על ה‪ Desktop -‬בשם חדש‪.demo-2.sav :‬‬
‫‪5‬‬
‫‪ .2‬לחזרה למצב הקודם‪ ,‬לחץ בתחתית המסך בצד שמאל על ‪ .Data View‬הצבעה עם העכבר על‬
‫כל אחד מהשדות (כותרת העמודה) תיתן פירוט מורחב של אותו משתנה‪.‬‬
‫‪ .1‬עפ"י ברירת המחדל‪ ,‬מוצגים ערכי המשתנים ללא ‪ Labels‬כלומר ללא כינוי למשתנה‪ .‬כדי‬
‫לראות את משמעות ערכי המשתנים‪ ,‬הקלק‬
‫‪View‬‬
‫‪Value Labels‬‬
‫לחילופין‪ ,‬ניתן להקליק על האייקון‬
‫(מלמעלה)‪.‬‬
‫הנמצא בצד הימני של שורת התפריט השניה‬
‫עיבודים בסיסיים‪ :‬טבלת שכיחות‬
‫‪ .5‬תפריט ‪ Analyze‬כולל אפשרויות רבות לעיבוד וניתוח הנתונים שבקובץ‪ .‬נתחיל בביצוע‬
‫עיבוד פשוט להפקת טבלת שכיחויות‪ .‬מהתפריט הראשי ע"י בחירת‪:‬‬
‫‪Analyze‬‬
‫‪Descriptive Statistics‬‬
‫‪Frequencies‬‬
‫תוצג תיבת השיח של שכיחויות (‪ .)Frequencies‬משמאל לכל משתנה מוצג סימן המציין את‬
‫סוג המשתנה (כפי שנדון בהמשך)‪.‬‬
‫משמאל לכל משתנה מוצג סימן המציין את סוג המשתנה (‪ )Data type‬וכן את סולם המדידה‬
‫(‪ .)Measurement level‬משמעות הסימנים הנ"ל מוצגת בטבלה הבאה‪:‬‬
‫‪1‬‬
‫‪ .01‬ניצור טבלת שכיחויות עבור המשתנים "מגדר" ו‪"-‬קטגוריית הכנסה באלפי דולרים"‪ .‬הקלק‬
‫על המשתנים ]‪ Gender [gender‬וכן ]‪ .Income category in thousands [inccat‬שם‬
‫המשתנה יוצג כאשר נצביע על ה‪ label-‬שלו (אם קיים)‪ .‬אם נקליק על המקש הימני של‬
‫העכבר ונבטל את האפשרות ‪ ,Prefer variable labels‬נקבל תצוגה קצרה יותר הכוללת רק‬
‫את שם המשתנים (ולא את כינוייהם) כדלקמן‪:‬‬
‫עקרונית‪ ,‬יש לבחור את אותם שדות שברצוננו לכלול בשגרות הניתוח‪/‬עיבוד ולהעבירם‬
‫לרשימת המשתנים שמימין (ע"י שימוש בחץ או הקלקה כפולה)‪ .‬ניתן להעביר כל משתנה‬
‫בנפרד או לחילופין‪ ,‬לסמן כמה מהם (ע"י שימוש במקש ‪ Shift‬או ‪ )Ctrl‬ואח"כ לבצע העברה‬
‫ימינה בפעולה אחת (חץ)‪.‬‬
‫‪ .00‬העבר את שני השדות הנ"ל לרשימה מימין‪:‬‬
‫‪2‬‬
‫‪ .01‬ברירת המחדל כוללת בנוסף לטבלת שכיחויות גם את החישובים הסטטיסטיים הבאים‪:‬‬
‫ממוצע‪ ,‬סטיית תקן‪ ,‬ערך מינימלי וערך מכסימלי‪ .‬כיוון שמדובר כרגע במשתנים בדידים‪,‬‬
‫נבטל את ‪ 1‬האפשרויות הללו‪:‬‬
‫‪ .03‬הקש "‪ ."Ok‬מתקבל הפלט הבא הנוצר בחלון חדש‪:‬‬
‫‪ .01‬הדו"ח המתקבל מציג שתי טבלאות‪ ,‬אחת לכל משתנה‪ .‬כל טבלה ממוינת לפי הקטגוריות של‬
‫כל משתנה (מגדר וקבוצת הכנסה) ובסרגל מוצגת שכיחות מספרית (‪ ,)Frequency‬אחוזית‬
‫(‪ ,(Percent‬אחוז תקף (‪ ,)Valid Percent‬כלומר בניכוי חסרים וכן אחוז מצטבר‬
‫(‪ .)Cumulative Percent‬בדוגמה שלפנינו אין חסרים ולכן שכיחות אחוז תקפה זהה לשכיחות‬
‫אחוזית‪.‬‬
‫‪1‬‬
‫‪ .05‬אם נרצה לקבל בדו"ח השכיחות גם את החסרים (אם יש כאלה)‪ ,‬נחזור על הפרוצדורה‬
‫הקודמת ונסמן בתחתית החלון את ‪:Include missing values‬‬
‫‪ .01‬נקליק שוב על ‪ OK‬ונקבל את הפלט הבא (לצורך ההדגמה הוספנו שתי רשומות שבהן מוזן‬
‫רק המשתנה ‪:)age‬‬
‫בדו"ח זה מופיעה גם שורת הכוללת ‪ 1‬חסרים (לא מוזן כל ערך הן עבור ‪ gender‬והן עבור‬
‫‪.Income category in thousands‬‬
‫‪5‬‬
‫‪ .02‬כדי לשמור את קובץ הפלט יש לבצע את הפעולות הבאות‪:‬‬
‫א‪ .‬בתפריט הראשי של דף הפלט‪ ,‬בחר ב‪:‬‬
‫‪File‬‬
‫‪Export‬‬
‫יתקבל חלון כדוגמת הבא‪:‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫ה‪.‬‬
‫בחר בתיקייה המתאימה‪.‬‬
‫בתחתית החלון בחר ב"‪( "HTML‬קימות אפשרויות נוספות)‪.‬‬
‫רשום למעלה את שם קובץ הפלט‪ ,‬למשל ‪.output1.html‬‬
‫הקלק על ‪ .save‬יתקבל קובץ ‪ html‬שבו ניתן לצפות בדפדפן אינטרנט וכמו כן‪ ,‬לפתוח‬
‫אותו במעבד תמלילים וורד‪ .‬ניתן להעביר קובץ פלט לדו"ח מסכם באמצעות תוכנות‬
‫שונות ללכידת מסך כגון ‪. FastStone Capture‬‬
‫‪01‬‬
‫תרגיל – דו"חות שכיחות‬
‫‪ .0‬הפק דו"ח שכיחות שביעות רצון מהתפקיד (‪.)jobsat‬‬
‫תשובה‪:‬‬
‫‪ .1‬הפק דו"ח שכיחות קטגוריות הכנסה (‪ ,)inccat‬ממוין בסדר יורד של שכיחות‪.‬‬
‫תשובה‪:‬‬
‫‪00‬‬
‫נושא מס' ‪Data editor :2‬‬
‫מבוא‬
‫‪ .0‬ה‪ Data Editor -‬מציג את התכנים של קובץ ‪ .Data‬כדי למנוע בעיות בכתיבת השפה העברית‪,‬‬
‫נפתח קובץ חדש (ריק) ע"י הקלקה על הקישור הבא‪basic file :‬‬
‫הערה‪ :‬בלי קשר לסוגיית העברית‪ ,‬ניתן לפתוח קובץ ריק באמצעות התפריט הראשי‬
‫כדלקמן‪:‬‬
‫‪File‬‬
‫‪New‬‬
‫‪Data‬‬
‫‪ .1‬שמור את הקובץ הנ"ל על שולחן העבודה בשם חדש‪n2 :‬‬
‫‪ .3‬המידע ב‪ Data Editor-‬מתבסס על משתנים (‪ )variables‬ותצפיות (‪ .)cases‬ישנם שני מצבים‬
‫אפשריים הניתנים לבחירה ושינוי בצד שמאל למטה של המסך‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪ :Data View‬עמודות מתייחסות למשתנים (שאלות בשאלון) ואילו שורות מייצגות‬
‫תצפיות (או משיבים)‪.‬‬
‫‪ :Variable View‬כל שורה מייצגת משתנה (שאלה) ואילו כל עמודה מתארת תכונה של‬
‫אותו משתנה‪.‬‬
‫משתנים משתייכים לסוגים שונים כולל מספרים‪ ,‬מחרוזות (‪ ,)Strings‬מטבע או תאריכים‪.‬‬
‫‪ .1‬רצוי להקליד נתונים באמצעות ‪ Data Editor‬בעיקר לקבצים קטנים או לביצוע עדכונים קלים‬
‫בקבצים גדולים‪ .‬הקלדה מסיבית של נתונים עדיפה בכלי תוכנה אחרים כגון אקסס‪ .‬בסיום‬
‫ההקלדה‪ ,‬ניתן להעביר את הנתונים אוטומטית ל‪.PSPP -‬‬
‫‪ .5‬הקש על ‪ Variable View‬כדי להגדיר את המשתנים‪ .‬לצורך התרגול נגדיר בשלב זה רק‬
‫שלושה‪. age, marital status, income :‬‬
‫‪ .1‬בשורה הראשונה של העמודה הראשונה הקלד ‪.age‬‬
‫‪ .2‬בשורה השניה של העמודה הראשונה הקלד ‪.marital‬‬
‫‪ .1‬בשורה השלישית של העמודה הראשונה הקלד‬
‫‪ 3 .income‬המשתנים החדשים קבלו‬
‫אוטומטית ‪ Type‬מסוג ‪. Numeric‬‬
‫‪ .5‬הקש על ה‪ Data View -‬כדי להתחיל בהקלדת הנתונים‪ .‬השמות שהקלדת במסך ‪Variable‬‬
‫‪ View‬הם כעת הכותרות של שלוש העמודות במסך ‪.Data View‬‬
‫‪01‬‬
‫‪ .01‬התחל להקליד נתונים בעמודה הראשונה בשורה הראשונה‪:‬‬
‫‪‬‬
‫בעמודת ‪ age‬הקלד ‪.22‬‬
‫‪‬‬
‫בעמודת ‪ marital‬הקלד ‪.1‬‬
‫‪‬‬
‫בעמודת ‪ income‬הקלד ‪.72000‬‬
‫‪ .00‬הזז את הסמן לעמודה הראשונה בשורה השניה והמשך להקליד‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫בעמודת ‪ age‬הקלד ‪.53‬‬
‫בעמודת ‪ marital‬הקלד ‪.8‬‬
‫בעמודת ‪ income‬הקלד ‪.123888‬‬
‫קביעת סוג המשתנה וכינוי ‪Type and Label -‬‬
‫בשלב זה משתני גיל ומצב משפחתי מוצגים עם שתי ספרות מימין לנקודה העשרונית‬
‫(‪ )Decimal points‬למרות שהם אמורים להיות מספרים שלמים (‪ .)Integers‬כדי להעלים את‬
‫הספרות שמימין לנקודה העשרונית‪ ,‬חזור ל‪ Variable View -‬ובצע את הפעולות הבאות‪:‬‬
‫‪ ‬בעמודה ‪ Decimals‬של השורה ‪ age‬הקלד ‪.8‬‬
‫‪ ‬בעמודה ‪ Decimals‬של השורה ‪ marital‬הקלד ‪.8‬‬
‫‪ ‬בעמודה ‪ Width‬של השורה ‪ income‬הקלד ‪( 5‬כדי שניתן יהיה להציג מספר בן ‪1‬‬
‫ספרות ושני מקומות מימין לנקודה – סה"כ ‪ 5‬מקומות כולל הנקודה העשרונית)‪.‬‬
‫כעת במסך ‪ 1 Data View‬המשתנים הראשונים מוצגים ע"י מספרים שלמים (ללא ספרות מימין‬
‫לנקודה העשרונית)‪.‬‬
‫נתונים לא מספריים (כגון מחרוזות טקסט) יכולים גם כן להיכנס לקובץ באמצעות‬
‫ה‪.Data Editor -‬‬
‫‪03‬‬
‫‪ .0‬הקלק על כפתור ‪ Variable View‬בתחתית מסך ה‪.Data Editor -‬‬
‫‪ .1‬בתא הראשון של השורה הריקה הראשונה הקלד ‪ gender‬עבור שם המשתנה‪.‬‬
‫‪ .3‬הקלק על התא ‪ Type‬שמימין לתא הקודם‪ .‬הקלק על הכפתור שבצידו הימני של תא זה כדי‬
‫לפתוח תיבת שיח בשם ‪ .Variable Type‬בחר באפשרות ‪ String‬כדי להגדיר את סוג‬
‫המשתנה‪.‬‬
‫‪ .1‬הקש ‪ OK‬כדי לשמור את הבחירה ולחזור ל‪.Data Editor -‬‬
‫‪ .5‬בנוסף להגדרת סוג (‪ )type‬המשתנה‪ ,‬ניתן גם להגדיר כינוי (‪ )label‬לכל משתנה‪ .‬חשיבות‬
‫הכינויי ם הללו היא בעת הפקת דו"חות סטטיסטיים (ה‪ labels-‬יופיעו אוטומטית בדו"חות)‪.‬‬
‫תפקידם הוא לספק תיאור מפורט יותר של המשתנה‪ .‬תיאורים אלה יכולים להגיע לאורך‬
‫מכסימלי של ‪ 155‬תווים ובעזרתם ניתן להבחין בפלטים בין המשתנים השונים‪.‬‬
‫‪ .1‬הקלק על כפתור ‪ Variable View‬בתחתית מסך ה‪.Data Editor -‬‬
‫‪ .2‬בעמודה ‪ Label‬של שורת ‪ age‬הקלד "גיל המשיב"‪.‬‬
‫‪ .1‬בעמודה ‪ Label‬של שורת ‪ marital‬הקלד "מצב משפחתי"‪.‬‬
‫‪ .5‬בעמודה ‪ Label‬של שורת ‪ income‬הקלד "הכנסה"‪.‬‬
‫‪ .01‬בעמודה ‪ Label‬של שורת ‪ gender‬הקלד "מגדר"‪.‬‬
‫‪01‬‬
‫‪ .00‬העמודה ‪ Type‬מציגה את הסוג הנוכחי של המשתנה‪ .‬הסוגים השכיחים ביותר הינם ‪numeric‬‬
‫ו‪ string -‬אולם למרות זאת‪ ,‬התוכנה תומכת גם בסוגים רבים נוספים‪ .‬בקובץ שהכנו עד כה‪,‬‬
‫משתנה ההכנסה מוגדר כנומרי‪ .‬הקלק על התא ‪ Type‬בשורה ‪ income‬ולאחר מכן הקלק על‬
‫הכפתור מימין כדי לפתוח תיבת שיח ‪.Variable Type‬‬
‫‪ .01‬בחר ‪.Dollar‬‬
‫‪ .03‬פורמטים אפשריים עבור מטבע דולר מוצגים בחלון‪ .‬בחר בסוג ‪ $###,###,###‬והקש ‪.OK‬‬
‫קביעת ערכי משתנה וכינויים ‪Value labels -‬‬
‫‪ Value labels .0‬מאפשרים להצמיד לכל ערך מספרי של המשתנה‪ ,‬מחרוזת (מלל) הנותנת לו‬
‫משמעות‪ .‬למשל‪ ,‬למשתנה "השכלה" (אינו מצוי בקובץ שלנו)‪ ,‬ישנם ‪ 1‬ערכים אפשריים‪:‬‬
‫‪ – 0‬השכלה יסודית ומטה‪.‬‬
‫‪ – 1‬השכלה תיכונית‪.‬‬
‫‪ - 3‬השכלה על תיכונית‪.‬‬
‫‪ - 1‬השכלה אקדמית‪.‬‬
‫המשתנה ‪ marital‬שבקובץ שלנו (מצב משפחתי)‪ ,‬יכול לקבל ‪ 1‬ערכים בלבד‪:‬‬
‫‪ - 1‬רווק‬
‫‪ - 0‬נשוי‬
‫‪.1‬‬
‫הקלק על התא ‪ Values‬עבור שורת ה‪ marital-‬ואח"כ הקש על הכפתור הימני כך שתפתח‬
‫תיבת שיח ‪ .Value Labels‬ה‪ Value -‬הוא הערך המספרי האמיתי ואילו ה‪value label -‬‬
‫היא המחרוזת (או מלל) המתארת את המשמעות של אותו ערך מספרי‪.‬‬
‫‪ .3‬הקלק ‪ 8‬ב‪ , Value-‬ו‪"-‬רווק" ב‪. Label-‬‬
‫‪ .1‬הקלק ‪ Add‬כדי להוסיף את הכינוי הנ"ל לרשימה‪.‬‬
‫‪ .5‬הקלק ‪ 1‬ב‪ , Value-‬ו‪"-‬נשוי" ב‪. Label-‬‬
‫‪ .1‬הקלק ‪ Add‬כדי להוסיף את הכינוי הנ"ל לרשימה ולבסוף ‪.OK‬‬
‫‪ .2‬עבור למסך ‪ Data View‬ומהתפריט הראשי בחר‪:‬‬
‫‪View‬‬
‫‪Value Labels‬‬
‫כעת ניתן לראות את הכינויים (‪ (Labels‬של המשתנה מצב משפחתי‪.‬‬
‫‪05‬‬
‫לחילופין ניתן להקליק בשורת התפריט השניה בצד ימין על האייקון‬
‫‪.‬‬
‫‪ .1‬חזור למסך ‪.Variable View‬‬
‫‪ .5‬הקלק על התא ‪ Values‬עבור שורת ה‪ gender-‬ואח"כ הקש על הכפתור הימני כך שתפתח‬
‫תיבת שיח ‪.Value Labels‬‬
‫‪ .01‬הקלק "נ" ב‪ , Value-‬ו‪"-‬נקבה" ב‪. Label-‬‬
‫‪ .00‬הקלק ‪ Add‬כדי להוסיף את הכינוי הנ"ל לרשימה‪.‬‬
‫‪ .01‬הקלק "ז" ב‪ , Value-‬ו‪"-‬זכר" ב‪. Label-‬‬
‫‪ .03‬הקלק ‪ Add‬כדי להוסיף את הכינוי הנ"ל לרשימה ולבסוף ‪.OK‬‬
‫‪ .01‬חזור למסך ‪. Data View‬‬
‫‪ .05‬בשורה הראשונה‪ ,‬בחר בתא "‪."gender‬‬
‫‪ .01‬הזן "ז" – התצוגה תהפוך ל"זכר (בתנאי שהמצה הוא (‪.)Value Labels‬‬
‫‪ .02‬בשורה השניה‪ ,‬בחר בתא "‪."gender‬‬
‫‪ .01‬הזן "נ" – התצוגה תהפוך ל"נקבה"‪.‬‬
‫ערכים חסרים – ‪Missing values‬‬
‫יש צורך שבעת ביצוע עיבודים סטטיסטיים‪ ,‬לא יילקחו בחשבון ערכים חסרים או שגויים‪.‬‬
‫משיבים בסקר עלולים לסרב לענות על שאלות מסוימות‪ ,‬יתכן שלא ידעו לענות על חלק מהשאלות‬
‫או שיענו בצורה שגויה‪ .‬אם לא נדאג לסנן או לזהות את אותם נתונים‪ ,‬הניתוח עלול לספק‬
‫תוצאות בלתי מדויקות‪.‬‬
‫עבור ערכים נומריים (מספריים)‪ ,‬שדות ריקים או שגויים מוגדרים ע"י התוכנה כ"חסרים"‬
‫(‪.)Missing‬‬
‫‪ .0‬עבור למסך ‪.Variable View‬‬
‫‪ .1‬הקלק על התא "‪ "Missing‬בשורה "‪ "age‬ואח"כ הקלק על הכפתור מימין לתא כדי לפתוח‬
‫את תיבת השיח "‪ ."Missing Values‬בתיבת שיח זו תוכל להגדיר עד ‪ 3‬ערכים חסרים‬
‫נפרדים או להגדיר תחום ערכים ובנוסף לכך גם ערך בדיד אחד‪.‬‬
‫‪01‬‬
‫‪ .3‬בחר "‪ ,"Discrete missing values‬הקלד ‪ 555‬בתיבת הטקסט הראשונה והשאר את שאר‬
‫שתי התיבות ריקות‪ .‬הקלק ‪.OK‬‬
‫‪ .1‬כעת נוסיף לערך החסר גם כינוי (‪ .)Label‬הקלק על התא ‪ Values‬בשורה ‪ age‬ואח"כ הקלק‬
‫על הכפתור הימני לפתיחת תיבת שיח מסוג ‪.Value Labels‬‬
‫‪ .5‬הקלק ‪ 555‬ב‪ , Value-‬ו‪"-‬אין תשובה" ב‪. Label-‬‬
‫‪ .1‬הקלק ‪ Add‬כדי להוסיף את הכינוי הנ"ל לרשימה ולבסוף ‪.OK‬‬
‫ערכים חסרים עבור משתני מחרוזת מטופלים בצורה דומה אולם שלא כמו במשתנים מספריים‪,‬‬
‫שדות ריקים במשתני מחרוזת אינם נחשבים כחסרים אלא כמחרוזת ריקה‪.‬‬
‫‪ .2‬הקלק על ‪ Variable View‬במסך ‪.Data Editor‬‬
‫‪ .1‬הצבע על התא ‪ Missing‬בשורת ה‪ gender-‬והקלק על הכפתור הימני כדי לפתוח את תיבת‬
‫השיח ‪. Missing Values‬‬
‫‪ .5‬סמן ‪Discrete missing values‬‬
‫(כלומר‪ ,‬אין תשובה) בתיבת הטקסט‬
‫והקלד "את"‬
‫הראשונה משמאל‪ .‬הקש ‪.OK‬‬
‫‪ .01‬כעת תוכל להוסיף ‪ label‬עבור הערך החסר הנ"ל‪ .‬הקלק על התא ‪ Values‬בשורת ‪gender‬‬
‫ואז לחץ על הכפתור הימני לפתיחת תיבת שיח ‪.Value Labels‬‬
‫‪ .00‬הקלד "את" בשדה ‪ Value‬וכן "אין תשובה" ב‪.Label -‬‬
‫‪ .01‬הקלק ‪ Add‬כדי להוסיף את הכינוי (‪ )Label‬הנ"ל לרשימה ולבסוף ‪.OK‬‬
‫תרגיל – הקמת קובץ ‪ sav‬חדש‬
‫בנה קובץ ‪ Data‬חדש בשם ‪ students.sav‬הכולל את המשתנים הבאים‪:‬‬
‫‪ ‬מס' סידורי ‪.num -‬‬
‫‪ ‬שם משפחה ‪.)Width=20( family -‬‬
‫‪ ‬שם פרטי ‪.)Width=20( private -‬‬
‫‪ ‬תאריך לידה ‪.)dd.mm.yyyy( date_birth -‬‬
‫‪ ‬שנה ‪=0 :year -‬א ‪=1 ,‬ב‪=3 ,‬ג‪=1 ,‬ד‪=55 ,‬אין תשובה (יוגדר כחסר)‪ ,‬סולם אורדינלי‪.‬‬
‫‪ ‬אזור מגורים ‪=0 :area -‬צפון‪=1 ,‬מרכז‪=3 ,‬דרום‪-55 ,‬אין תשובה (יוגדר כחסר) סולם שמי‪.‬‬
‫הקלד את הנתונים הבאים לקובץ‪:‬‬
‫‪Case Summaries‬‬
‫אזור מגורים‬
‫שנה‬
‫תאריך לידה‬
‫שם פרטי‬
‫שם משפחה‬
‫מס' סידורי‬
‫צפון‬
‫א ‪20.7.1983‬‬
‫משה‬
‫שמעון ‪1‬‬
‫‪1‬‬
‫דרום‬
‫ב ‪21.6.1983‬‬
‫מושון‬
‫רחמים ‪2‬‬
‫‪2‬‬
‫מרכז‬
‫ג ‪10.7.1984‬‬
‫אביגדור‬
‫לוי ‪3‬‬
‫‪3‬‬
‫צפון‬
‫ב ‪24.8.1983‬‬
‫נחמן‬
‫יוסף ‪4‬‬
‫‪4‬‬
‫צפון‬
‫א ‪29.4.1983‬‬
‫מרדכי‬
‫יצחק ‪5‬‬
‫‪5‬‬
‫צפון‬
‫א ‪20.7.1983‬‬
‫יהודה‬
‫רביב ‪6‬‬
‫‪6‬‬
‫צפון‬
‫ב ‪21.6.1983‬‬
‫רחלי‬
‫לאה ‪7‬‬
‫‪7‬‬
‫מרכז‬
‫א ‪10.7.1984‬‬
‫ליאון‬
‫רחל ‪8‬‬
‫‪8‬‬
‫דרום‬
‫ג ‪10.7.1984‬‬
‫יהודיוף‬
‫שמחה ‪9‬‬
‫‪9‬‬
‫‪02‬‬
‫מרכז‬
‫ד ‪24.8.1983‬‬
‫מושקוביץ‬
‫ירון ‪10‬‬
‫‪10‬‬
‫דרום‬
‫תשובה אין ‪10.7.1984‬‬
‫אבנר‬
‫פזנר ‪11‬‬
‫‪11‬‬
‫תשובה אין‬
‫ג ‪10.7.1984‬‬
‫משה‬
‫כהן ‪12‬‬
‫‪12‬‬
‫תשובה אין‬
‫ד ‪24.8.1983‬‬
‫דוד‬
‫יואב ‪13‬‬
‫‪13‬‬
‫‪11‬‬
‫‪12‬‬
‫‪13‬‬
‫הפק דו"ח שכיחות "אזור מגורים"‪.‬‬
‫תשובה‪:‬‬
‫הפק דו"ח שכיחות "שנה"‪.‬‬
‫תשובה‪:‬‬
‫‪13‬‬
‫‪13‬‬
‫‪13‬‬
‫‪N‬‬
‫‪Total‬‬
‫‪01‬‬
‫נושא מס' ‪ :3‬יסודות סטטיסטיקה תיאורית‬
‫סולמות מדידה‬
‫שיעור זה דן בסטטיסטיקה תיאורית וכיצד סולמות המדידה של משתנה משפיעים על סוג ההצגה‬
‫הסטטיסטית שבה יש להשתמש‪ .‬נשתמש בקובץ ‪ .demo.sav‬הצגות מספריות שונות מתאימות‬
‫לסוגי מידע שונים והן מושפעות מסולם המדידה‪.‬‬
‫‪‬‬
‫סולמות מדידה קטגוריאליים‪ :‬מידע הכולל מספר מוגבל של ערכים בדידים או קטגוריות‬
‫(למשל‪ ,‬מגדר או מצב משפחתי)‪ .‬משתנים קטגוריאליים יכולים להיות מחרוזת (אלפאנומרית)‬
‫או משתנים מספריים המבוססים על קודים מספריים כדי לייצג קטגוריות (למשל‪ = 1 :‬רווק‪,‬‬
‫‪=0‬נשוי)‪ .‬ישנם שני סוגים בסיסיים של מידע קטגוריאלי‪:‬‬
‫‪ o‬נומינלי (או שמי)‪ :‬מידע קטגוריאלי שעבורו אין משמעות לסדר של הקטגוריות‬
‫השונות‪ .‬לדוגמה‪ ,‬קטגורית תפקיד של "מכירות" אינה גבוהה או נמוכה מקטגוריית‬
‫תפקיד "שיווק" או "מחקר"‪.‬‬
‫‪ o‬אורדינלי ‪ :‬מידע קטגוריאלי שעבורו יש משמעות לסדר של הקטגוריות השונות אולם‬
‫אין מרחק בר‪-‬מדידה בין הקטגוריות‪ .‬לדוגמה‪ ,‬קטגוריות דרגות בצבא‪:‬‬
‫‪-0‬‬
‫‪-1‬‬
‫‪-3‬‬
‫‪-1‬‬
‫‪‬‬
‫טוראי‬
‫טר"ש‬
‫רב"ט‬
‫סמל‬
‫אכן דרגה ‪ 3‬גבוהה מדרגה ‪ 1‬אולם אין משמעות למרחק המספרי בין דרגה‬
‫אחת לשניה‪.‬‬
‫סולמות מדידה מסוג ‪ :Scale‬מידע נמדד על סקלת אינטרוול או יחס שבה הערכים מצביעים‬
‫הן על סדר והן על מרחק ביניהם‪ .‬כך למשל‪ ,‬משכורת של ‪ ₪ 11,111‬גבוהה ממשכורת של‬
‫‪ ₪ 05,111‬והמרחק בין שני ערכים אלה הוא ‪ .₪ 5,111‬סולמות אלה נקראים גם כמותיים או‬
‫רציפים‪.‬‬
‫סטטיסטיקה תיאורית ‪ -‬משתנים קטגוריאליים‬
‫למידע קטגוריאלי‪ ,‬ההצגה הסטטיסטית המקובלת ביותר היא שכיחות מספרית או אחוז של כל‬
‫קטגוריה‪ .‬השכיח (‪ )mode‬היא הקטגוריה שבה השכיחות הגבוהה ביותר‪ .‬לנתונים אורדינליים‬
‫החציון (‪ )median‬עשוי להיות גם כן שימושי (הערך שמעליו ומתחתיו נמצאים מחצית מהמקרים)‬
‫כאשר יש מספר רב של קטגוריות‪ .‬שגרות חישוב שכיחות נותנות טבלאות שכיחות המציגות הן את‬
‫מספר המקרים והן את חלקם האחוזי עבור כל קטגוריה‪.‬‬
‫‪ .0‬מהתפריט הראשי בחר ‪:‬‬
‫‪Analyze‬‬
‫‪Descriptive Statistics‬‬
‫‪Frequencies...‬‬
‫‪05‬‬
‫הקלק עם המקש הימני של העכבר על רשימת המשתנים (בצד שמאל) ובחר באפשרות‬
‫‪ .Prefer variable labels‬בחר במשתנים ]‪Primary vehicle price category [carcat‬‬
‫ו‪ Level of education [ed]-‬והעבירם לרשימת המשתנים‪.‬‬
‫‪ .1‬בטל את האפשרויות המופיעות כברירת מחדל‪:‬‬
‫‪.Mean, Standard deviation, Minimum, Maximum‬‬
‫בחר בחציון (‪ )Median‬ושכיח (‪.)Mode‬‬
‫‪11‬‬
‫‪ .3‬הקלק ‪ OK‬כדי להריץ את השגרה‪.‬‬
‫הפלט המתקבל‪:‬‬
‫טבלאות השכיחות מראות כי קטגוריית הרכב השכיחה ביותר היא ‪ )35.15%( Luxury‬והפחות‬
‫שכיחה היא ‪ .)11.22%( Economy‬ההשכלה השכיחה ביותר היא "סיום בי"ס תיכון" (‪)31.15%‬‬
‫ואילו הפחות שכיחה היא ‪.)5.10%( Post-undergraduate degree‬‬
‫סטטיסטיקה תיאורית ‪ -‬משתנים רציפים ‪Scale Variables -‬‬
‫ישנם מספר מדדים עבור משתנים רציפים כגון‪:‬‬
‫מדדי נטייה למרכז‪ :‬הנפוץ ביותר הוא הממוצע (‪ )mean‬והחציון (‪ - median‬הערך שמעליו‬
‫ומתחתיו נמצאים מחצית מהמקרים)‪.‬‬
‫מדדי פיזור‪ :‬מידת השונות או הפיזור של הנתונים כגון סטית תקן‪ ,‬ערך מינימלי וערך מכסימלי‪.‬‬
‫‪ .0‬פתח שוב את תיבת השיח של השכיחויות‪.‬‬
‫‪ .1‬בחר במשתנה ]‪ Household income in thousands [income‬והעבר אותו ימינה לרשימת‬
‫המשתנים‪.‬‬
‫‪10‬‬
‫‪ .3‬הוסף למדדי ברירת המחדל ‪Mean, Std. deviation, Minimum, and Maximum‬‬
‫את ‪.Median‬‬
‫‪ .1‬טבלאות שכיחות אינן שימושיות בדרך כלל עבור משתנים רציפים כיוון שמספר הערכים עשוי‬
‫להיות זהה למספר הרשומות)‪ .‬כיוון שכך‪ ,‬לחץ על ‪:Frequency tables‬‬
‫‪11‬‬
‫‪ .5‬תחת הכותרת ‪ Display frequency tables‬בחר באפשרות ‪.Never‬‬
‫‪ .1‬הקלק ‪.Continue‬‬
‫‪ .2‬הקלק ‪ OK‬כדי להריץ את השגרה‪ .‬יתקבל הפלט הבא‪:‬‬
‫בדוגמה זו‪ ,‬ישנו הבדל משמעותי בין הממוצע והחציון‪ .‬הממוצע גבוה בכמעט ‪ 15,111‬מהחציון‪,‬‬
‫דבר המצביע על כך שההתפלגות הנ"ל אינה נורמאלית‪ .‬ניתן לבחון את ההתפלגות ע"י יצירת‬
‫היסטוגרמה‪.‬‬
‫היסטוגרמה עבור משתנים רציפים (‪)Scale Variables‬‬
‫‪ .1‬חזור על הפעולות בסעיפים ‪ 0-5‬בפסקה הקודמת (תיבת השיח של שכיחויות)‪.‬‬
‫‪ .1‬הקלק על ‪.Charts‬‬
‫‪ .3‬סמן ‪ Draw histograms‬וכן ‪.Superimpose normal curve‬‬
‫‪ .4‬הקלק ‪ Continue‬ואח"כ ‪ OK‬בתיבת השיח הראשית כדי להריץ את השגרה‪.‬‬
‫‪13‬‬
‫מתקבל הפלט הבא‪:‬‬
‫רוב הרשומות נמצאות בחלק הנמוך של הסקאלה‪ ,‬רובן מתחת ל‪ .011,111 -‬ישנם כמובן מספר‬
‫מקרים באזור ה‪ 511,111 -‬ואף למעלה מכך (קשה להבחין בכך בהיסטוגרמה במתכונתה הנוכחית‪.‬‬
‫לערכים גבוהים מאד אלה ששכיחותם נמוכה מאד משפיעים מאד על הממוצע אולם אין להם‬
‫השפעה על החציון‪ .‬כיוון שכך‪ ,‬במקרה זה‪ ,‬החציון מהווה אינדיקטור מרכז טוב יותר‪.‬‬
‫תרגיל – חישוב סטטיסטים‬
‫קובץ ‪:demo.sav‬‬
‫עבור המשתנים גיל (‪ )age‬וכן וותק אצל מעביד נוכחי (‪ )employ‬חשב את הסטטיסטים הבאים‪:‬‬
‫ממוצע‪ ,‬חציון‪ ,‬סטיית תקן‪ ,‬ערך מינימלי‪ ,‬ערך מכסימלי‪ ,‬טווח (‪=Range‬הפרש בין ערך מכסימלי‬
‫למינימלי)‪.‬‬
‫‪11‬‬
‫תשובה‪:‬‬
‫‪15‬‬
‫נושא מס' ‪ :4‬עבודה עם ‪Syntax‬‬
‫‪ PSPP‬מספק שפת פקודות רבת עוצמה המאפשרת לשמור ולבצע אוטומטית מספר רב של‬
‫משימות‪ .‬שפה זו נקראת סינטקס ורוב פקודותיה ניתנות לביצוע באמצעות מערך התפריטים‬
‫ותיבות השיח (חלק מהפקודות דורש כתיבה ישירה שלהן)‪ .‬שפת הפקודות מאפשרת לשמור שגרות‬
‫ביצוע בקובץ סינטקס כך שניתן לח זור על הניתוח במועד מאוחר יותר‪ ,‬לחבר מספר פעולות‬
‫שתבוצענה אחת אחרי השניה‪ ,‬לבצע שינויים במשימות בלי לחזור לתפריטים וכד'‪.‬‬
‫פקודות סינטקס נשמרות בקובץ טקסט‪ .‬ניתן לפתוח חלון סינטקס ולהקליד פקודות ישירות‬
‫אולם בד"כ‪ ,‬תיבות השיח שבתוכנת ‪ PSPP‬מסוגלות לבצע עבודה זו ביתר קלות‪ .‬להלן ‪ 1‬מאפיינים‬
‫חשובים של פקודות סינטקס‪:‬‬
‫‪‬‬
‫‪‬‬
‫כל פקודת סינטקס (ראשית)‪ ,‬כוללת פקודות משנה וחייבת להסתיים בנקודה‪.‬‬
‫ניתן להוסיף כותרת הסבר (בעברית או באנגלית) לכל פקודה ראשית בקובץ ע"י התחלת‬
‫ההסבר בכוכבית (*) וסיומו בנקודה‪ .‬ההסבר יכול להיכתב במספר שורות‪ :‬הראשונה‬
‫מתחילה בכוכבית והאחרונה מסתיימת בנקודה (ללא רווח בין השורות)‪.‬‬
‫הדוגמאות בשיעור זה מתבססות על הקובץ ‪.demo.sav‬‬
‫"הדבקת" סינטקס‬
‫הדרך הקלה ביותר ליצירת סינטקס היא להשתמש בכפתור ‪ Paste‬הממוקם ברוב תיבות השיח‪.‬‬
‫‪ .0‬פתח את הקובץ ‪.demo.sav‬‬
‫‪ .1‬מהתפריט הראשי בחר‬
‫‪Analyze‬‬
‫‪Descriptive Statistics‬‬
‫‪Frequencies...‬‬
‫נפתחת תיבת השיח של השכיחויות (‪.)Frequencies‬‬
‫‪11‬‬
‫‪ .3‬מהתפריט הראשי בחר ]‪.Marital status [marital‬‬
‫‪ .1‬העבר את המשתנה לצד ימין‪.‬‬
‫‪ .5‬בטל את ‪ 1‬הסטטיסטים של ברירת המחדל‪.‬‬
‫‪ .1‬הקלק ‪ Paste‬כדי להעתיק את הסינטקס הנוצר באמצעות הבחירות שבתיבת השיח לעורך‬
‫הסינטקס (‪ .)Syntax Editor‬נוצרו הפקודות הבאות‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= marital‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫‪ .2‬ניתן להשתמש בסינטקס זה לבדו‪ ,‬להוסיפו לקובץ סינטקס אחר‪ .‬להעתיקו ולבצע בו שינויים‬
‫וכד'‪.‬‬
‫‪ .1‬כדי להריץ את כל פקודות הסינטקס המוצגות‪ ,‬יש לבחור‪:‬‬
‫‪Run‬‬
‫‪All‬‬
‫הפלט המתקבל הוא‪:‬‬
‫עריכת סינטקס‬
‫‪ .0‬במסך הסינטקס‪ ,‬ניתן לערוך את הפקודות‪ ,‬כלומר לשנות‪ ,‬להוסיף‪ ,‬למחוק וכד'‪ .‬לדוגמה‪,‬‬
‫בשורה השניה ניתן להחליף את המשתנה ‪ marital‬במשתנה‬
‫‪( inccat‬קטגוריית הכנסה‬
‫שנתית)‪.‬‬
‫‪ .1‬נעתיק את פקודת הסינטקס הקודמת ונבצע את ההחלפה‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= inccat‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫‪ .3‬נסמן את הסינטקס ונריץ אותו ע"י הפקודות הבאות‪:‬‬
‫‪Run‬‬
‫‪selection‬‬
‫‪12‬‬
‫נקבל את הפלט הבא‪:‬‬
‫הקלדת פקודות‪ ,‬שמירה ופתיחת קובץ סינטקס‬
‫‪ .0‬ניתן להקליד סינטקס למסך הסינטקס הפתוח כבר או לפתוח מסך חדש מהתפריט הראשי‬
‫כדלקמן‪:‬‬
‫‪File‬‬
‫‪New‬‬
‫‪Syntax...‬‬
‫‪ .1‬כדי לשמור קובץ סינטקס‪ ,‬בחר מהתפריט הראשי‪:‬‬
‫‪File‬‬
‫‪Save‬‬
‫או‬
‫‪File‬‬
‫‪Save As...‬‬
‫כל אחת מהחלופות הנ"ל פותחות תיבת שיח לשמירת קבצים‪ .‬החלופה הראשונה מבצעת‬
‫שמירה ללא פתיחת תיבת שיח כאשר קיים כבר שם קובץ (ונדרש לעדכנו)‪.‬‬
‫‪ .3‬כדי לפתוח קובץ סינטקס שמור‪ ,‬בחר‪:‬‬
‫‪File‬‬
‫‪Open‬‬
‫בחר את קובץ הסינטקס הרצוי והקש ‪.Open‬‬
‫‪ .4‬כיוון שהפקודות מתייחסות לקובץ נתונים מסוים‪ ,‬קובץ זה חייב להיות פתוח לפני הרצת‬
‫הסינטקס‪ .‬לחילופין‪ ,‬ניתן לכלול פקודת סינטקס לפתיחת קובץ נתונים‪:‬‬
‫סינטקס אופייני לפתיחת קובץ בשם ‪ demo.sav‬יראה כך‪:‬‬
‫‪GET FILE='F:\My Documents\yaron\professional\vizo\spss\2012‬‬‫‪2013\files\sav\chapter 4\demo.sav'.‬‬
‫‪11‬‬
‫סינטקס לקביעת התצוגה המספרית בפלט‬
‫עפ"י ברירת המחדל‪ ,‬מספרים מוצגים בפלט של ‪ PSPP‬עם שתי ספרות אחרי הנקודה‪ .‬ניתן לשנות‬
‫את ברירת המחדל באמצעות פקודת סינטקס מתאימה כגון‪:‬‬
‫‪SET FORMAT F8.3.‬‬
‫משמעות הפקודה הנ"ל היא שכל התוצאות יוצגו עם ‪ 3‬ספרות אחרי הנקודה העשרונית‪ .‬הספרה ‪1‬‬
‫משמעותה שהמספר המוצג יוכל להכיל לכל היותר ‪ 1‬ספרות (מימין ומשמאל נקודה)‪ ,‬כולל‬
‫הנקודה העשרונית‪ .‬כל עוד לא שונתה הפקודה הנ"ל‪ ,‬היא תישאר שרירה וקיימת‪ .‬כדי לחזור‬
‫לברירת המחדל‪ ,‬נפעיל את הפקודה הבאה (שתי ספרות אחרי הנקודה)‪:‬‬
‫‪SET FORMAT F8.2.‬‬
‫הרצת קובץ סינטקס‬
‫בתוכנת ‪ PSPP‬נפעיל את הסינטקס תמיד מתוך קובץ ה‪ )sav( Data-‬ולא ישירות ממערכת‬
‫ההפעלה‪ .‬בצורה זו‪ ,‬קובץ הסינטקס ישויך לאותו קובץ ‪ Data‬שממנו הופעל‪ .‬כדי למנוע טעויות‪,‬‬
‫רצוי לסגור קבצי ‪ Data‬שבהם אין שימוש (אם כי ניתן להשאיר כמה קבצים פתוחים במקביל)‪.‬‬
‫ישנן מספר חלופות להרצת קובץ סינטקס באמצעות תפריט ‪ Run‬בקובץ הסינטקס‪ ,‬כדלקמן‪:‬‬
‫‪.0‬‬
‫‪.1‬‬
‫‪.3‬‬
‫‪.1‬‬
‫‪ :All‬מריץ את כל הפקודות הנמצאות במסך הסינטקס‪.‬‬
‫‪ :Selection‬מריץ את כל הפקודות שנבחרו (נצבעו)‪.‬‬
‫‪ :Current line‬מריץ רק את השורה שעליה מצביע הסמן‪.‬‬
‫‪ :To End‬מריץ את כל הפקודות ממקום הצבעת הסמן ועד לסוף קובץ הסינטקס‪.‬‬
‫תרגיל – עבודה עם סינטקס‬
‫קובץ ‪:demo.sav‬‬
‫‪ .0‬בנה פקודת סינטקס עבור חישוב שכיחות קטגוריות הכנסה (‪ )inccat‬והרץ אותה‪ .‬לאחר מכן‪,‬‬
‫העתק את הפקודה שנוצרה והרץ באמצעותה דו"ח שכיחות רמת השכלה (‪ )ed‬וכן מספר‬
‫נפשות בדירה (‪)reside‬‬
‫הערה‪ :‬ניתן לבצע את כל ‪ 3‬הדו"חות בסינטקס אחד‪.‬‬
‫‪15‬‬
‫תשובה‪:‬‬
‫‪ .1‬חזור על שאלה ‪ 0‬כך שהתוצאות יוצגו עם ‪ 3‬ספרות אחרי הנקודה‪.‬‬
‫‪31‬‬
‫תשובה‪:‬‬
‫‪30‬‬
‫נושא מס' ‪ :2‬ברירת אוכלוסיה בקובץ ‪Data‬‬
‫ברירת אוכלוסיה‬
‫לעיתים נדרש להגביל את ניתוח הנתונים לתת‪-‬קבוצה בודדת או לבצע ניתוחים סימולטנית‬
‫על תת‪-‬קבוצות שונות‪.‬‬
‫הדוגמאות בנושא זה מבוססות על הקובץ ‪.demo.sav‬‬
‫ניתן לבחור תת קבוצה ספציפית של הקובץ בהתבסס על קריטריונים הכוללים משתנים וכן‬
‫ביטויים מורכבים הכוללים שערים לוגיים (‪ )or, and, not‬וסוגריים‪ .‬עפ"י כללי האלגברה‬
‫הבוליאנית‪ ,‬שערי ‪ and‬קודמים לשער ‪ or‬אלא אם כן הקדימות שונתה ע"י סוגריים (כמו‬
‫באלגברה רגילה שבה כפל‪/‬חילוק קודמים לחיבור חיסור אלא אם כן ישנם סוגריים)‪.‬‬
‫כמו כן ניתן גם לבחור מדגם אקראי מתוך הקובץ‪.‬‬
‫כדי להקל על תהליך ההגדרה של ברירת אוכלוסיה‪ ,‬כדאי להדפיס את הגדרת הקובץ כדלקמן‪:‬‬
‫‪ .0‬בחר מהתפריט הראשי‪:‬‬
‫‪File‬‬
‫‪Display Data File Information‬‬
‫‪Working File‬‬
‫פקודת הסינטקס המתאימה היא‪.DISPLAY DICTIONARY :‬‬
‫מתקבלת הטבלה הבאה עבור הקובץ ‪( demo.sav‬הצגה חלקית של ‪ 2‬המשתנים הראשונים‬
‫בלבד)‪:‬‬
‫עיון בטבלה הנ"ל (ובעיקר במשתנים הבדידים כולל כל הקטגוריות שלהם)‪ ,‬עשוי להקל על‬
‫תהליך כתיבת הביטויים הלוגיים בלי צורך לעבור כל פעם לרשימת המשתנים‬
‫ב‪.Variable View -‬‬
‫‪31‬‬
‫כדי לבחור תת‪-‬קבוצה של רשומות מתוך הקובץ‪ ,‬יש לבצע את הר"מ‪:‬‬
‫בדוגמה הראשונה נבחר רק את האנשים שהם גילאי ‪ 01‬עד ‪ .11‬תחילה‪ ,‬יש לבנות משתנה‬
‫מחושב שיכלול את הגדרת תת הקבוצה הנ"ל‪:‬‬
‫‪ .1‬בחר בתפריט הראשי‪:‬‬
‫‪Transform‬‬
‫…‪Compute‬‬
‫ייפתח החלון הבא‪:‬‬
‫‪ .3‬מתחת לכותרת ‪( Target Variable‬בצד שמאל למעלה)‪ ,‬תן שם למשתנה המחושב למשל‬
‫‪.selection1‬‬
‫‪33‬‬
‫‪ .1‬מתחת ל‪ Numeric Expressions-‬רשום את הביטוי הלוגי המתאים‪:‬‬
‫‪age>=18 and age<=40‬‬
‫‪ .5‬הקש ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪COMPUTE selection1 = age>=18 and age<=40.‬‬
‫‪EXECUTE.‬‬
‫‪ .1‬הרץ את הסינטקס‪ .‬לקובץ נוסף משתנה בשם ‪ selection1‬המקבל ערך ‪ 0‬עבור כל רשומה‬
‫העונה על התנאי הנ"ל (גיל בין ‪ 01‬ל‪ )11-‬וערך ‪ 1‬עבור כל רשומה שאינה עונה על התנאי‪.‬‬
‫‪ .2‬בחר מהתפריט הראשי‪:‬‬
‫‪Data‬‬
‫‪Select Cases...‬‬
‫פעולה זו פותחת את תיבת השיח של ‪:Select Cases‬‬
‫ברירת המחדל היא ‪.All Cases‬‬
‫‪31‬‬
‫‪ .1‬סמן את האפשרות ‪.Use filter variable‬‬
‫‪ .5‬בחר בסוף הרשימה את המשתנה ‪ selection1‬והעבר אותו לצד הימני של התיבה‪:‬‬
‫תחת הכותרת ‪ ,Unselected Cases Are‬ניתן לבחור אחת מ‪ 1-‬חלופות עבור התוצאה‬
‫המתקבלת‪:‬‬
‫‪‬‬
‫‪ :Filtered‬זוהי ברירת המחדל‪ .‬במצב זה‪ ,‬הרשומות שלא נבחרו‪ ,‬יעברו למצב "מסונן"‬
‫(‪ )selection1=0‬ויופיעו כ"מחוקות" (קו אלכסוני על המספר הסידורי)‪ .‬מעשית‪ ,‬כל רשומה‬
‫כזו אינה נלקחת בחשבון באף עיבוד שיבוצע כל עוד ברירת האוכלוסיה בתוקף‪ .‬ממצב זה ניתן‬
‫לחזור למצב שבו היה הקובץ לפני ברירת האוכלוסיה ע"י בחירת ‪ All cases‬בתיבת השיח‬
‫‪ .Select Cases‬גם סגירת הקובץ ופתיחתו מחדש תבטל את ברירת האוכלוסיה‪ .‬מעבר‬
‫מברירת אוכלוסיה אחת לחדשה מבטל את ההגדרות הקודמות ונותן תוקף רק להגדרות‬
‫החדשות‪.‬‬
‫‪‬‬
‫‪ :Deleted‬במצב זה‪ ,‬הרשומות שלא נבחרו‪ ,‬יימחקו‪ .‬יישארו אם כן רק אלה שנבחרו‪ .‬כאשר‬
‫נעשה שימוש בחלופה זו‪ ,‬יש לנקוט בכל אמצעי הזהירות כדי לא לגרום לנזק בלתי הפיך (יש‬
‫לשמור את הקובץ המקורי ואת החדש בשמות שונים כדי ששניהם יישמרו)‪.‬‬
‫‪ .01‬השאר את ברירת המחדל ‪ Filtered‬והקש על ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪FILTER BY selection1.‬‬
‫‪ .00‬הרץ את הסינטקס‪ .‬עיון בקובץ ה‪ Data-‬יראה כי הרשומות שאינן עונות על התנאי יימחקו‬
‫(זמנית) ע"י קו אלכסוני ‪ .‬כמו כן תופיע על המסך הראשי בצד ימין למטה אינדיקציה שאנו‬
‫נמצאים במצב מסונן (‪:)selection1‬‬
‫‪35‬‬
‫כאשר נחזור למצב הקודם (ללא מסננת) נקבל בצד ימין למטה הודעה מתאימה‪.Filter Off :‬‬
‫הערה חשובה‪ :‬כל עוד לא הוגדרה ברירת אוכלוסיה חדשה‪ ,‬נשארת בתוקף ברירת‬
‫האוכלוסיה הקודמת‪ .‬מומלץ לבטל לפני כל הרצה חדשה את ברירת האוכלוסיה הקודמת (אם‬
‫היתה כזו‪ .‬אם לא‪ ,‬ביטול ברירת האוכלוסיה אינו משנה) כדי לא לקבל דו"ח שגוי‪ .‬ניתן לעשות‬
‫זאת ע"י תפריט ‪ Select Cases‬או באמצעות פקודת הסינטקס הבאה‪:‬‬
‫‪FILTER OFF.‬‬
‫תרגילים – ברירת אוכלוסיה ע"ב ביטויי תנאי‬
‫קובץ‪demo.sav :‬‬
‫בחר את תתי הקבוצות הבאות ולכל אחת הפק דו"ח שכיחות השכלה‪:‬‬
‫‪ .0‬נשים בנות ‪ 35‬ומעלה‪ ,‬בעלות הכנסה של ‪ 15‬אלף דולר לפחות ורכב חסכוני‪.‬‬
‫הסינטקס המתקבל‪:‬‬
‫‪COMPUTE selection2 = gender='f' and age>=35 and inccat>=2 and‬‬
‫‪carcat=1.‬‬
‫‪EXECUTE.‬‬
‫‪FILTER BY selection2.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= ed‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
31
:‫הדו"ח‬
.‫ אלף דולר לפחות או בעלי רכב מפואר‬51 ‫ גברים בעלי הכנסה של‬.1
COMPUTE q2 = gender='m' and (inccat>=3 or carcat=3).
EXECUTE.
FILTER BY q2.
FREQUENCIES
/VARIABLES= ed
/FORMAT=AVALUE TABLE
/STATISTICS=NONE.
‫ אלף דולר לפחות ורכב חסכוני וכן גברים בעלי‬15 ‫ בעלות הכנסה של‬,‫ ומעלה‬35 ‫ נשים בנות‬.3
.‫ אלף דולר לפחות או בעלי רכב מפואר‬51 ‫הכנסה של‬
COMPUTE q3 = gender='f' and age>=35 and
gender='m' and (inccat>=3 or carcat=3).
EXECUTE.
inccat>=2 and carcat=1 or
FILTER BY q3.
FREQUENCIES
/VARIABLES= ed
/FORMAT=AVALUE TABLE
/STATISTICS=NONE.
COMPUTE q3 = gender='f' and age>=35 and inccat>=2 and carcat=1 or
gender='m' and (inccat>=3 or carcat=3.
EXECUTE.
32
FILTER BY q3.
FREQUENCIES
/VARIABLES= ed
/FORMAT=AVALUE TABLE
/STATISTICS=NONE.
,‫ ומעלה‬35 ‫ (כלומר כולם למעט "נשים בנות‬3 ‫ כל אלה שאינם עונים על ההגדרה בסעיף‬.1
‫ רכב חסכוני והשכלה תיכונית לפחות וכן גברים‬,‫ אלף דולר לפחות‬15 ‫בעלות הכנסה של‬
.)"‫ אלף דולר לפחות או בעלי רכב מפואר‬51 ‫בעלי הכנסה של‬
COMPUTE q4 = not (gender='f' and age>=35 and inccat>=2 and
carcat=1 or gender='m' and (inccat>=3 or carcat=3)).
EXECUTE.
FILTER BY q4.
FREQUENCIES
/VARIABLES= ed
/FORMAT=AVALUE TABLE
/STATISTICS=NONE.
‫‪31‬‬
‫בחירת מדגם אקראי‬
‫כדי לקבל מדגם אקראי (מתוך כלל רשומות הקובץ)‪ ,‬בצע את הר"מ‪:‬‬
‫‪ .0‬בחר ‪ Random sample of cases‬מתיבת השיח ‪.Select Cases‬‬
‫‪ .1‬הקלק ‪ .Sample‬נפתחת תיבת שיח בשם ‪ Select Cases: Random Sample‬שבה ניתן‬
‫לבחור אחת מהחלופות הבאות‪:‬‬
‫‪‬‬
‫‪ :Approximately‬יש להקליד את גודל המדגם באחוזים (מתוך כלל הרשומות בקובץ)‪.‬‬
‫התוצאה תהיה מדגם אקראי שגודלו יהיה שווה בקירוב לשיעור האחוזי שהוגדר‪.‬‬
‫לחילופין ניתן לעשות זאת ע"י פקודת הסינטקס הבאה עבור מדגם של כ‪( 28%-‬הקובץ‬
‫המקורי נעלם)‪:‬‬
‫‪SAMPLE 0.5.‬‬
‫‪‬‬
‫‪ :Exactly‬אפשרות זו נגדיר רק באמצעות הסינטקס (ולא דרך התפריט)‪ .‬כך למשל‪ ,‬בחירה‬
‫אקראית של ‪ 3111‬רשומות בדיוק מתוך ‪ 1111‬שבקובץ‪ ,‬תבוצע באמצעות הסינטקס הבא‬
‫(הקובץ המקורי נעלם)‪:‬‬
‫‪SAMPLE 3200 FROM 6400.‬‬
‫תרגיל – בחירת מדגם אקראי‬
‫קובץ ‪:L2-multiple.sav‬‬
‫בחר מדגם אקראי של ‪ 31‬רשומות בדיוק מתוך כלל הרשומות שבקובץ (‪ .)051‬הפק דו"ח שכיחות‬
‫עבור משתנה השכלה (‪.)q3‬‬
‫‪35‬‬
‫תשובה אפשרית‪:‬‬
‫‪SAMPLE 30 FROM 150 .‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= q3‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫הערה‪ :‬ניתן לקבל תשובות אפשריות שונות (כיוון שבכל ריצה מתקבל מדגם אקראי אחר)‪ .‬בסך‬
‫הכל חייבות להתקבל ‪ 31‬רשומות (כולל ‪ ) Missing‬וצפויה התפלגות שכיחות דומה בכל המדגמים‪.‬‬
‫‪11‬‬
‫פיצול קובץ‬
‫קובץ‪Demo.sav :‬‬
‫כדי לפצל קובץ לקבוצות ניתוח נפרדות (סוג של מיון) יש לבצע את הר"מ‪:‬‬
‫‪ .0‬בחר מהתפריט הראשי‪:‬‬
‫‪Data‬‬
‫‪Split File...‬‬
‫מופיעה תיבת השיח של ‪:Split File‬‬
‫‪ .1‬בחר בחלופה ‪.Compare groups‬‬
‫‪ .3‬בחר ב‪ Gender [gender] -‬כדי לפצל את הקובץ לקבוצות נפרדות עבור משתנה זה‪ .‬ניתן‬
‫לבחור גם יותר ממשתנה פיצול אחד – במקרה כזה‪ ,‬סדר הופעתם יקבע את מבנה הקבוצות‬
‫השונות‪.‬‬
‫‪ .1‬הפעל את שגרת השכיחויות לחישוב ממוצע‪ ,‬סטיית תקן וחציון של המשתנה‬
‫]‪. Household income in thousands [income‬‬
‫יתקבל הסינטקס הבא‪:‬‬
‫‪SORT CASES BY gender.‬‬
‫‪SPLIT FILE LAYERED BY gender.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= income‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN STDDEV MEDIAN.‬‬
‫‪10‬‬
‫יתקבל הפלט הבא‪:‬‬
‫הערה‪ :‬הקובץ חייב לעבור מיון לפי משתנה‪/‬משתני הפיצול‪ .‬אם הקובץ כבר ממוין‪ ,‬ניתן לוותר על‬
‫שגרת המיון (בדוגמה שלפנינו‪ ,‬לפי מגדר‪ )gender-‬ולחסוך זמן עיבוד‪.‬‬
‫שינוי מצב הקובץ ממפוצל ללא מפוצל‬
‫לאחר הפעלת פקודת הפיצול‪ ,‬היא נשארת בתוקף כל עוד אינה מבוטלת וכל עוד הקובץ אינו נסגר‪.‬‬
‫אם הקובץ נסגר ואח"כ נפתח שוב‪ ,‬מצב הפיצול מתבטל‪ .‬כדי לבטל את פיצול הקובץ יש לבחור‬
‫‪.Analyze all cases‬‬
‫פקודת סינטקס המתאימה‪:‬‬
‫‪SPLIT FILE OFF.‬‬
‫כדי להחזיר את הקובץ למצב מפוצל‪ ,‬יש לבחור באחת משתי החלופות ‪ Compare groups‬או‬
‫‪ .Organize output by groups‬כאשר מצב הפיצול תקף‪ ,‬ההודעה ‪ Split by ….‬מופיעה בצד‬
‫הימני התחתון של המסך (עם שם משתנה הפיצול)‪.‬‬
‫תרגיל – פיצול קובץ‬
‫קובץ ‪:L2-multiple.sav‬‬
‫פצל את הקובץ לפי מצב משפחתי‪ .‬הפק דו"ח שכיחות הכולל ממוצע‪ ,‬סטיית תקן וחציון עבור‬
‫הכנסה חודשית מעבודה (‪.)h1‬‬
‫‪11‬‬
‫תשובה‪:‬‬
‫‪13‬‬
‫נושא מס' ‪ :6‬סטטיסטיקה תיאורית – ‪Descriptives/Explore‬‬
‫נושא ‪ 1‬כולל דוגמאות עבור פרוצדורות סטטיסטיות נבחרות מתחום הסטטיסטיקה התיאורית‪.‬‬
‫הדוגמאות בנושא זה מבוססות על הקובץ ‪ demo.sav‬וכן על קבצים נוספים כמפורט בהמשך‪ .‬תת‬
‫התפריט ‪ Descriptive Statistics‬מתחת לתפריט ‪ Analyze‬מספק טכניקות לסיכום נתונים‬
‫והצגתם בצורה מספרית וגרפית‪ .‬טכניקה אחת הוצגה קודם לכן ‪ -‬שכיחויות (‪.)Frequencies‬‬
‫טכניקה נוספת הנקראת ‪ ,Descriptives‬מציגה סיכום סטטיסטי עבור מספר משתנים בטבלה‬
‫אחת‪ .‬המשתנים יכולים להיות מוצגים לפי הממוצע‪ ,‬סטיית תקן וכד' (בסדר עולה או יורד)‪ ,‬לפי‬
‫אלף‪-‬בית או לפי סדרם בקובץ (ברירת המחדל)‪ .‬בהמשך תוצג טכניקה נוספת בשם ‪Explore‬‬
‫השייכת גם כן לתת התפריט ‪.Descriptive Statistics‬‬
‫‪Descriptives‬‬
‫כדי לקבל ‪ ,Descriptives‬בצע את הר"מ (מקובץ ‪:)demo.sav‬‬
‫‪ .0‬מהתפריט הראשי בחר‬
‫‪Analyze‬‬
‫‪Descriptive Statistics‬‬
‫‪Descriptives...‬‬
‫נבחר במשתנה ]‪.Household income in thousands [income‬‬
‫‪11‬‬
‫‪ .1‬הקש ‪ .OK‬יתקבל הפלט הבא‪:‬‬
‫אפשרויות ה‪Descriptives-‬‬
‫‪ .0‬מתחת לכותרת ‪ Statistics‬ניתן לבחור בכמה אפשרויות (‪ 1‬הראשונים מסומנים כברירת‬
‫מחדל – ניתן לבטלם)‪:‬‬
‫משמעות אפשרויות הבחירה‪:‬‬
‫‪ :Mean‬הממוצע החשבוני (ברירת מחדל)‪.‬‬
‫‪ - Dispersion‬מדדי פיזור הכוללים סטיית תקן‪ ,‬שונות‪ ,‬טווח‪ ,‬מינימום‪ ,‬מכסימום ושגיאת תקן‬
‫של הממוצע‪:‬‬
‫‪‬‬
‫‪ :Std. deviation‬סטיית תקן (ברירת מחדל) – מידת הפיזור סביב הממוצע‪ .‬בהתפלגות‬
‫נורמלית‪ 11% ,‬מהאוכלוסיה‪/‬מדגם נמצאים במרחק של סטיית תקן אחת מהממוצע (מעל או‬
‫מתחת) ואילו ‪ 55%‬נמצאים בטווח של ‪ 1‬סטיות תקן‪ .‬כך למשל אם הגיל הממוצע הוא ‪15‬‬
‫וסטיית התקן היא ‪ ,01‬אזי ‪ 55%‬מהאוכלוסיה הם בגיל שבין ‪ 15‬ל‪( 15 -‬בתנאי שהגיל מתפלג‬
‫נורמלית)‪.‬‬
‫‪15‬‬
‫‪‬‬
‫‪ :Variance‬שונות ‪ -‬מידת הפיזור סביב הממוצע‪ ,‬שווה לסכום ריבועי הסטיות מהממוצע‬
‫מחולק בגודל המדגם פחות אחד‪ .‬סטיית התקן שווה לשורש ריבועי של השונות‪.‬‬
‫‪ :Range‬ההפרש בין הערך המכסימלי למינימלי‪.‬‬
‫‪ :)Standard error of the mean( S.E. mean‬מידת השונות של הממוצע כאשר עוברים‬
‫ממדגם למדגם מאותה אוכלוסיה‪.‬‬
‫‪ Kurtosis‬ו‪ skewness -‬הם סטטיסטים המאפיינים את הצורה‬
‫‪:Distribution‬‬
‫והסימטריה של ההתפלגות‪ .‬סטטיסטים אלה מוצגים עם השגיאה התקנית שלהם‪:‬‬
‫‪ :Kurtosis o‬המידה שבה התצפיות מתרכזות סביב המרכז‪ .‬בהתפלגות נורמלית‪,‬‬
‫ערכו אפס‪.‬‬
‫‪ :Skewness o‬מידת האסימטריה של ההתפלגות‪ .‬התפלגות נורמלית היא סימטרית‬
‫ויש לה ‪ skewness‬שערכו אפס‪( .‬ערך חיובי גבוה משמעותו זנב ימני ארוך וערך שלילי‬
‫גבוה ‪ -‬זנב שמאלי ארוך‪ .‬ככלל‪ skewness ,‬שערכו גבוה מפעמיים שגיאת התקן שלו‬
‫נחשב כמצביע על סטייה מסימטריה‪.‬‬
‫‪‬‬
‫‪ :Display Order‬אופציה זו אינה מופיעה בתפריט וניתן להפעילה באמצעות סינטקס‬
‫מתאים‪ .‬ברירת המחדל היא שהמשתנים מוצגים עפ"י הסדר שנבחרו‪ .‬אופציונאלית‪ ,‬ניתן‬
‫למיינם כדלקמן‪:‬‬
‫‪/SORT=NAME‬‬
‫‪ .1‬לפי סדר א"ב (של שמות המשתנים)‪:‬‬
‫)‪/SORT=MEAN(D‬‬
‫‪ .2‬עפ"י סדר יורד של הממוצע‪:‬‬
‫)‪/SORT=MEAN(A‬‬
‫‪ .3‬עפ"י סדר עולה של הממוצע‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫הפקת ציוני תקן‬
‫באמצעות ‪ Descriptives‬ניתן לחשב ציוני תקן לכל משתנה שנבחר‪ .‬ציון תקן מוגדר ע"י הנוסחה‪:‬‬
‫_‬
‫‪xi  x‬‬
‫‪x‬‬
‫‪Z‬‬
‫כאשר ‪ = xi‬ערך התצפית‬
‫_‬
‫‪ = x‬ממוצע המדגם‬
‫‪ =  x‬סטיית התקן‬
‫משמעות ציון תקן היא מרחק התצפית מהממוצע במונחי סטיות תקן‪ .‬סטיית התקן של "ציון‬
‫תקן" היא ‪ 0‬והממוצע שלו ‪ .1‬כדי להפיקו יש לסמן בתיבת השיח הראשית של ‪ Descriptives‬את‬
‫האפשרות ‪.Save standardized values as variables‬‬
‫תרגיל – ‪Descriptives‬‬
‫קובץ ‪:L2-multiple.sav‬‬
‫עבור המשתנים הכנסה חודשית מעבודה‪ ,‬מההורים ומריבית (‪ )h1, h2, h3‬חשב ממוצע‪ ,‬סטיית‬
‫תקן‪ ,‬ערך מכסימלי‪ ,‬ערך מינימלי‪ Kurtosis ,‬וכן ‪ .Skewness‬כמו כן‪ ,‬דרג את ערכי הממוצע‬
‫בסדר יורד וחשב ציון תקן עבור כל אחד מהם‪ .‬לאחר חישוב ציוני התקן‪ ,‬הראה שהממוצע שלהם‬
‫שווה אפס וסטיית התקן ‪.0‬‬
‫‪11‬‬
‫תשובה‪:‬‬
‫ממוצע וס"ת של ציוני התקן הם ‪ 1‬ו‪ 0-‬בהתאמה‪.‬‬
‫‪Explore‬‬
‫השגרה ‪ Explore‬מיועדת לתת מידע סטטיסטי עח התפלגות משתנים כמותיים‪ .‬הדבר חשוב לפני‬
‫ביצוע בדיקות של השערות שכן יתכן כי קיימת במדגם שלנו שונות גדולה מאד או ערכים‬
‫קיצוניים‪ .‬בדיקת ההתפלגות עשויה לסייע לנו כיצד לעבוד עם הנתונים בהמשך‪ .‬כך נוכל לבדוק‬
‫האם המשתנים שלנו מתפלגים נורמאלית (זהו תנאי עבור חלק מהמבחנים הסטטיסטיים שיוצגו‬
‫בהמשך הקורס)‪.‬‬
‫קובץ‪Demo.sav :‬‬
‫נניח כי ברצוננו לבחון לעומק את התפלגות מספר השנים אצל מעסיק‪ .‬פרוצדורת ‪Explore‬‬
‫מאפשרת לבחון את התפלגות השנים אצל מעסיק נתון ולקבל פירוט רב‪ ,‬כפי שיוצג בהמשך‪.‬‬
‫‪ .0‬בחר מהתפריט הראשי‪:‬‬
‫‪Analyze‬‬
‫‪Descriptive Statistics‬‬
‫‪Explore...‬‬
‫‪12‬‬
‫נפתחת תיבת השיח הבאה‪:‬‬
‫‪ .1‬בחר ]‪ Years with current employer [employ‬והזז אותו ל‪. Dependent List-‬‬
‫‪ .3‬הקלק על ‪ Statistics‬בתיבת השיח של ‪( Explore‬משמאל למטה)‪ .‬נפתחת תיבת השיח‬
‫הבאה‪:‬‬
‫‪ .1‬סמן את ‪.Descriptives‬‬
‫‪ .5‬ברירת המחדל כוללת רווח בר סמך של ‪ .55%‬זו גם רמת הביטחון המקובלת במחקר‬
‫במדעי החברה‪ .‬ניתן להגדיר רווח בר סמך אחר ע"י הוספת הסינטקס הבא (הדוגמה‬
‫מתאימה עבור ‪:)55%‬‬
‫‪/CINTERVAL .99‬‬
‫‪ .1‬הקלק על ‪ Continue‬ואח"כ על ‪.Paste‬‬
‫מתקבל הסינטקס‪:‬‬
‫‪EXAMINE‬‬
‫‪/VARIABLES= employ‬‬
‫‪/STATISTICS = DESCRIPTIVES‬‬
‫‪/MISSING=LISTWISE.‬‬
‫‪11‬‬
‫הפלט‪:‬‬
‫משמעות הגדרה של ‪ 55%‬היא שקיימת ההסתברות של ‪ 1.55‬שממוצע האוכלוסיה נמצא‬
‫באינטרוול (טווח הערכים) שהפלט מציג (נתוני מדגם)‪.‬‬
‫עפ"י הפלט‪ ,‬ממוצע השנים אצל מעסיק נוכחי הוא ‪ 01.52‬והטווח הוא ‪( 01.33-01.11‬כלומר‬
‫‪ .) 10.57  0.235‬ערכים גבוהים יותר מ‪ 55% -‬נותנים רמת ביטחון גבוהה יותר לטווח המוצג‬
‫בפלט (עבור אותם נתונים‪ ,‬הטווח ילך ויגדל ככל שרמת הביטחון גדלה)‪.‬‬
‫האופציה ‪( Descriptives‬בתוך ‪ )Explore‬כוללת את מדדי הנטייה למרכז ואת מדדי הפיזור‬
‫הבאים‪:‬‬
‫נטייה למרכז‪ :‬ממוצע‪ ,‬חציון וכן ממוצע מקוצץ ‪ :5% trimmed mean -‬מהווה פשרה בין הממוצע‬
‫לחציון‪ .‬מוגדר כממוצע המחושב ע"י "זריקת" ‪ 5%‬מנתוני הקצוות (המכסימום והמינימום)‪ .‬הדבר‬
‫מאפשר לשפר את העיוות הנגרם לממוצע ע"י ערכים קיצוניים‪.‬‬
‫מדדי פיזור‪ :‬מראים את השונות שבין הערכים וכוללים וריאנס‪ ,‬סטיית תקן‪ ,‬מינימום‪ ,‬מכסימום‪,‬‬
‫טווח‪( interquartile range ,‬ההפרש בין רבעון שלישי לרבעון ראשון) וכן ‪ skewness‬ו‪kurtosis-‬‬
‫(ראה הסבר בעמ' ‪.)15‬‬
‫ניתן לסמן בתיבת השיח ‪( Statistics‬ב‪ )Explore -‬גם את האפשרויות הבאות‪:‬‬
‫‪ :Extremes‬מציג את חמישה הערכים הגבוהים ביותר ואת חמישה הנמוכים ביותר‪.‬‬
‫‪ :Percentiles‬מציג אוטומטית את האחוזונים הבאים‪,51% ,25% ,51% ,15% ,01% ,5% :‬‬
‫‪.55%‬‬
‫‪Explore: Options‬‬
‫‪ .2‬הקלק על ‪ Options‬בתיבת השיח של ‪ .Explore‬תפתח תיבת השיח הבאה‪:‬‬
‫‪15‬‬
‫‪ .1‬בחר את אחת מהחלופות הבאות (שתפקידן לשלוט בעיבוד של ערכים חסרים)‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ :Exclude cases listwise‬רשומות עם ערכים חסרים עבור משתנה תלוי או פקטור‬
‫מוצאות מהניתוח‪ .‬זוהי ברירת המחדל‪.‬‬
‫‪ :Exclude cases pairwise‬נכללות רשומות שלהן אין ערכים חסרים לאותה‬
‫קבוצה‪ .‬הרשומה יכולה לכלול ערכים חסרים למשתנים השייכים לקבוצות אחרות‪.‬‬
‫‪ :Report values‬ערכים חסרים של משתנה פקטור מוצגים כקטגוריה נפרדת‪.‬‬
‫ניתן לבחור מס' משתנים תלויים במסגרת ‪ Dependent List‬ובמקביל לבחור ‪ Factor List‬אחד או‬
‫כלל לא‪ .‬במצב זה נקבל פירוט של כל אחד מהמשתנים שנבחרו (עם או בלי מיון לפי הפקטור)‪.‬‬
‫לחילופין‪ ,‬ניתן לבחור משתנה תלוי יחיד (במסגרת ‪ )Dependent List‬ובמקביל לבחור מספר‬
‫פקטורים ב‪( Factor List -‬או כלל לא)‪ .‬במצב זה נקבל פירוט של המשתנה שנבחר בכל פעם עם‬
‫מיון לפי הפקטור‪.‬‬
‫לדוגמה‪ :‬נריץ שגרת ‪ Explore‬עבור המשתנה ‪( age‬גיל) במיון לפי ‪( marital‬מצב משפחתי)‪:‬‬
‫‪ .0‬בחר ]‪ Age in years [age‬והזז אותו ל‪. Dependent List-‬‬
‫‪ .1‬בחר ]‪ Marital status [marital‬והזז אותו ל‪. Factor List-‬‬
‫‪ .3‬הקלק על ‪ Statistics‬בתיבת השיח של ‪( Explore‬משמאל למטה) וסמן את כל שלוש‬
‫האפשרויות (‪.)Descriptives, Extremes, Percentiles‬‬
‫‪ .1‬הקלק על ‪ Continue‬ועל ‪.Paste‬‬
‫‪ .5‬הרץ את הסינטקס‪ .‬מתקבל הפלט הבא‪:‬‬
‫‪EXAMINE‬‬
‫‪/VARIABLES= age‬‬
‫‪BY marital‬‬
‫‪/STATISTICS = DESCRIPTIVES EXTREME‬‬
‫‪/PERCENTILES‬‬
‫‪/MISSING=LISTWISE.‬‬
51
‫‪50‬‬
‫תרגיל –‪( Explore‬קובץ ‪)L2-multiple.sav‬‬
‫הרץ שגרת ‪ Explore‬מלאה עבור הכנסה חודשית מעבודה (‪ )h1‬בחלוקה למגדר‪.‬‬
‫תשובה‪:‬‬
51
53
‫‪51‬‬
‫נושא מס' ‪ :7‬ממוצעים ‪Means -‬‬
‫בקובץ הדמו ישנם מספר משתנים המאפשרים לחלק אנשים לקבוצות‪ .‬ניתן לחשב סטטיסטים‬
‫אחדים כדי לבצע השוואה בין הקבוצות‪ .‬למשל‪ ,‬ניתן לחשב את ההכנסה השנתית הממוצעת של‬
‫נשים וגברים‪.‬‬
‫‪ .0‬פתח את הקובץ ‪ demo.sav‬ובחר מהתפריט הראשי‪:‬‬
‫‪Analyze‬‬
‫‪Compare Means‬‬
‫‪Means...‬‬
‫הדבר פותח את תיבת השיח הבאה‪:‬‬
‫‪ .1‬בחר ]‪ Household income in thousands [income‬והעבירו ל‪.Dependent List -‬‬
‫‪ .3‬בחר ]‪ Gender [gender‬והעבירו ל‪ Independent List -‬בשכבה ‪.)layer 1( 0‬‬
‫‪ .1‬בחר ]‪ Owns PDA [ownpda‬והזז אותו ל‪ Independent List-‬באותה שכבה ‪.)0‬‬
‫‪ .5‬הקלק ‪ OK‬כדי להריץ את הפרוצדורה‪ .‬הסינטקס המתאים הוא‪:‬‬
‫‪MEANS TABLES = income‬‬
‫‪BY gender ownpda.‬‬
‫‪55‬‬
‫הפלט המתקבל הוא‪:‬‬
‫כדי להוסיף או להוריד סטטיסטים או לשנות את סדר הופעתם בפלט‪ ,‬ניתן להוסיף לסינטקס‬
‫‪/CELLS MEAN STDDEV COUNT MIN MAX.‬‬
‫הקודם‪ ,‬שורת סינטקס כדוגמת הבאה‪:‬‬
‫במקרה כזה הפלט המתקבל יהיה הבא‪:‬‬
‫להלן רשימת כל הסטטיסטים שניתן להוסיף לפקודת ‪:MEANS‬‬
‫]‪[MEAN] [COUNT] [STDDEV] [SEMEAN] [SUM] [MIN] [MAX] [RANGE‬‬
‫]‪[VARIANCE] [KURT] [SEKURT‬‬
‫]‪[SKEW] [SESKEW] [FIRST] [LAST‬‬
‫]‪[HARMONIC] [GEOMETRIC‬‬
‫]‪[DEFAULT‬‬
‫]‪[ALL‬‬
‫הוספת ‪ ALL‬במקום הרשימה תגרום להצגת כולם‪.‬‬
‫ברירת המחדל היא ממוצע‪ ,‬שכיחות וסטיית תקן (ביצוע דרך התפריט‪ ,‬ללא צורך בפקודה‬
‫‪.)/CELLS‬‬
‫תרגילים – ממוצעים ‪Means -‬‬
‫קובץ‪s-klali-5 scale-rek.sav :‬‬
‫‪ .0‬הפק דו"ח המציג את הממוצע בלבד (ללא סטיית תקן וללא ‪ )N‬של ‪ 1‬שאלות ‪ q1-q4‬במיון‬
‫הבא‪ :‬קבוצה (‪ ,)group‬בית‪-‬ספר (‪ )school‬ומגדר (‪.)gender‬‬
51
:‫תשובה‬
MEANS TABLES = q1 q2 q3 q4
BY group school gender
/CELLS MEAN.
52
.‫ הפק את הדו"ח הנ"ל עבור סטיית תקן בלבד‬.1
:‫תשובה‬
MEANS TABLES = q1 q2 q3 q4
BY group school gender
/CELLS STDDEV.
‫‪51‬‬
‫‪ .3‬הפק דו"ח הכולל ממוצע‪ N ,‬וסטיית תקן עבור שאלות ‪ q1-q2‬כדלקמן‪:‬‬
‫אוכלוסיה‪ :‬תלמידי בית‪-‬ספר א' בלבד (לא כולל הורים)‪.‬‬
‫‪ :‬שכבה‪.‬‬
‫מיון‬
‫תשובה‪:‬‬
‫‪MEANS TABLES = q1 q2‬‬
‫‪BY grade.‬‬
‫‪55‬‬
‫נושא מס' ‪ :1‬משתנים מחושבים בקובץ ‪Data‬‬
‫נתוני קובץ ה‪ data-‬שאיתם מתחילים אינם תמיד מאורגנים בדרך הטובה ביותר לצורך הניתוח‬
‫או דיווח הממצאים‪ .‬כך‪ ,‬יכול להתעורר צורך לבצע את הפעולות הבאות‪:‬‬
‫‪ ‬ליצור משתנה חדש ע"ב משתנים קיימים (למשל‪ :‬הפרש בין תאריכים)‪.‬‬
‫‪ ‬לקודד מחדש משתנה קיים (למשל‪ :‬לצרף כמה קטגוריות תשובה לקטגוריה אחת)‪.‬‬
‫‪ ‬ליצור משתנה קטגוריאלי ממשתנה רציף (לדוגמה‪ :‬להפוך את המשתנה הרציף "גיל" למספר‬
‫קטגוריות גיל)‪.‬‬
‫הדוגמה הבאה מתבססת על הקובץ ‪.demo.sav‬‬
‫חישוב משתנה חדש (משתנה מחושב)‬
‫באמצעות אוסף נרחב של פונקציות מתמטיות‪ ,‬ניתן ליצור משתנים מחושבים חדשים‪ .‬נתחיל‬
‫בדוגמה פשוטה שבה נחשב משתנה חדש שהוא ההפרש בין ערכי שני משתנים קיימים‪ .‬קובץ‬
‫הדוגמה ‪ demo.sav‬כולל משתנה עבור גיל המשיב וכן משתנה עבור הוותק (בשנים) בתפקיד‬
‫הנוכחי‪ .‬הקובץ אינו כולל את גיל המשיב בעת שהחל את תפקידו‪ .‬ניתן ליצור משתנה חדש‬
‫המחושב ע"י ההפרש שבין הגיל (הנוכחי) לבין מספר השנים בתפקיד‪ .‬נתון זה יכול לשמש כקירוב‬
‫לגיל שבו העובד החל את תפקידו‪.‬‬
‫‪ .0‬מהתפריט הראשי במסך ‪ Data Editor‬בחר‪:‬‬
‫‪Transform‬‬
‫‪Compute Variable...‬‬
‫‪ .1‬עבור ל‪ Target Variable -‬והקלד ‪( jobstart‬זהו השם של המשתנה החדש)‪.‬‬
‫‪ .3‬הקלק על ‪ .Type & Label‬ייפתח החלון הבא‪:‬‬
‫‪ .1‬סמן את ‪ Label‬ורשום "וותק בתפקיד"‪.‬‬
‫‪ .5‬הקלק על ‪.Continue‬‬
‫‪ .1‬בחר מתוך הרשימה במשתנה ]‪ Age in years [age‬והעתיקו באמצעות החץ לתיבת הטקסט‬
‫‪ .Numeric Expression‬הקש סימן מינוס )–( באמצעות המחשבון (או לחץ על מקש מינוס‬
‫במקלדת)‪.‬‬
‫‪11‬‬
‫‪ .2‬בחר במשתנה ]‪ Years with current employer [employ‬והעתיקו באמצעות החץ אל‬
‫הביטוי המתמטי‪.‬‬
‫הערה ‪ :‬שים לב לבחור את משתנה התפקיד הנכון‪ .‬ישנו גם משתנה קטגוריאלי שאינו מתאים‬
‫למקרה שלפנינו‪ .‬הביטוי המתמטי צריך להיות ‪( age-employ‬ולא ‪.)age-empcat‬‬
‫‪ .1‬הקלק ‪ OK/Paste‬כדי לחשב את המשתנה החדש‪ .‬המשתנה החדש מוצג כעת ב‪.Data Editor -‬‬
‫כיוון שהוא נוסף לסוף הקובץ‪ ,‬הוא מוצג בעמודה הימנית הרחוקה ב‪ Data View-‬ובשורה‬
‫האחרונה ב‪ . Variable View-‬הסינטקס עבור פעולה זו הוא‪:‬‬
‫‪NUMERIC jobstart.‬‬
‫‪'.‬וותק בתפקיד' ‪VARIABLE LABEL jobstart‬‬
‫‪COMPUTE jobstart = age-employ.‬‬
‫‪EXECUTE.‬‬
‫‪10‬‬
‫‪ .5‬הרץ דו"ח שכיחות שיחשב ממוצע‪ ,‬סטיית תקן‪ ,‬שכיח חציון עבור המשתנה ‪.jobstart‬‬
‫יתקבל הפלט הבא‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= jobstart‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN STDDEV MODE MEDIAN.‬‬
‫תרגיל – חישוב פשוט של משתנה חדש‬
‫קובץ ‪:L2-multiple.sav‬‬
‫בנה משתנה מחושב (‪ )gap‬השווה לפער שבין הכנסה רצויה לסך כל ההכנסה בפועל‪:‬‬
‫(‪q5-(h1+h2+h3‬‬
‫הצג טבלה הכוללת את ממוצע הפער‪ ,‬חציון‪ ,‬שכיח‪ ,‬סטיית תקן‪ ,‬ערך מינימלי ומכסימלי‪.‬‬
‫תשובה‪:‬‬
‫‪COMPUTE gap = q5-(h1+h2+h3(.‬‬
‫‪EXECUTE.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= gap‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=DEFAULT MODE MEDIAN.‬‬
‫‪11‬‬
‫שימוש בפונקציות בביטויים מתמטיים‬
‫ניתן להשתמש בפונקציות מוכנות בביטויים המתמטיים כגון פונקציות אריתמטיות‪ ,‬סטטיסטיות‪,‬‬
‫התפלגות‪ ,‬לוגיות‪ ,‬הפרש וחיבור תאריכים‪ ,‬מחרוזות ועוד‪.‬‬
‫הפונקציות מסודרות לפי א"ב‪.‬‬
‫הדבקת פונקציה לביטוי‪ :‬כדי להדביק פונקציה שנבחרה לביטוי‪ ,‬יש לבצע את הר"מ‪:‬‬
‫‪‬‬
‫למקם את הסמן באזור כתיבת הביטוי המתמטי‪ ,‬באותה נקודה שבה עליו להופיע‪.‬‬
‫‪‬‬
‫לבחור את הפונקציה המתאימה‪.‬‬
‫‪‬‬
‫להקיש הקשה כפולה על הפונקציה הרצויה (או לבחור את הפונקציה ולהקליק על החץ‬
‫הסמוך) ב‪ .Functions-‬הפונקציה מוכנסת לביטוי המתמטי‪ .‬אם נצבע חלק מהביטוי‬
‫הקיים בתיבת ‪ ,Numeric Expression‬ולאחר מכן נכניס משתנה‪ ,‬החלק הצבוע של‬
‫הביטוי ישמש כארגומנט ראשון בפונקציה‪.‬‬
‫עריכת פונקציה בביטוי ‪ :‬הפונקציה אינה מושלמת עד שלא נכניס את כל הארגומנטים המסומנים‬
‫ע"י סימני שאלה בתיבת ‪ .Numeric Expression‬מספר סימני השאלה מצביע על המספר‬
‫המינימלי של ארגומנטים הדרושים להשלים את הפונקציה‪.‬‬
‫פונקצית סכום‪ :‬נפתח את הקובץ ‪ L5.sav‬וניצור משתנה מחושב המתאר את ההכנסה הכוללת‪:‬‬
‫‪ .0‬ב‪ ,Target Variable -‬כתוב ‪( totalincome‬הכנסה כוללת)‪.‬‬
‫‪ .1‬בחר את הפונקציה ‪.Sum‬‬
‫‪ .3‬לתוך הסוגריים הכנס הביטוי ‪( q3,q4,q5‬כלומר הפונקציה תחשב את הסכום ‪. q3+q4+q5‬‬
‫‪ .1‬הקלק ‪( OK‬או ‪ Paste‬ליצירת סינטקס)‪ .‬נוצר כעת משתנה חדש בשם ‪ totalincome‬שערכו‬
‫שווה לסכום ‪.q3+q4+q5‬‬
‫‪13‬‬
‫הסינטקס‪:‬‬
‫‪COMPUTE totalincome = SUM(q1,q2,q3).‬‬
‫‪EXECUTE.‬‬
‫הצג טבלה הכוללת את ממוצע ההכנסה הכוללת‪ ,‬סטיית תקן‪ ,‬ערך מינימלי ומכסימלי‪.‬‬
‫תשובה‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= totalincome‬‬
‫‪/FORMAT=AVALUE NOTABLE.‬‬
‫הפרש בין תאריכים‪:‬‬
‫דוגמה א'‪ :‬בקובץ ‪ L5.sav‬ניצור משתנה מחושב המתאר וותק בלימודים ע"י חישוב ההפרש בין‬
‫התאריך של היום (‪ )$TIME‬לבין תאריך תחילת הלימודים (בשנים)‪.‬‬
‫‪ .0‬ב‪ ,Target Variable -‬כתוב ‪( vetek1‬וותק בלימודים)‪.‬‬
‫‪ .1‬בחר את הפונקציה ‪.DATEDIFF‬‬
‫‪ .3‬בחר את הפונקציה ‪ $TIME‬והכנס אותה לארגומנט הראשון של הפונקציה‬
‫‪.DATEDIFF‬‬
‫‪ .1‬את המשתנה ‪ q1‬הכנס כארגומנט שני של הפונקציה הנ"ל‪ .‬כארגומנט שלישי הכנס את‬
‫הביטוי '‪ .'years‬בתיבה ‪ Numeric Expression‬יתקבל הביטוי הבא‪:‬‬
‫)'‪ .DATEDIFF($TIME,q1,'years‬משמעות הביטוי היא שהפרש הזמן בין היום‬
‫לתחילת הלימודים יובע בשנים‪ .‬ניתן להביע את הפרש הזמן גם ברבעונים‪ ,‬חודשים‪,‬‬
‫שבועות‪ ,‬ימים‪ ,‬שעות‪ ,‬דקות‪ ,‬ושניות‪ ,‬כדלקמן‪:‬‬
‫‪‘quarters’, ‘months’, ‘weeks’, ‘days’, ‘hours’, ‘minutes’, ‘seconds’.‬‬
‫‪ .5‬הקלק ‪( OK‬או ‪ Paste‬ליצירת סינטקס)‪ .‬נוצר כעת משתנה חדש בשם ‪ vetek1‬שערכו שווה‬
‫להפרש בין תאריך נוכחי לתאריך תחילת הלימודים (בשנים)‪.‬‬
‫הסינטקס‪:‬‬
‫‪NUMERIC vetek1.‬‬
‫‪'.‬וותק בלימודים' ‪VARIABLE LABEL vetek1‬‬
‫‪COMPUTE vetek1 = DATEDIFF($TIME,q1,'years').‬‬
‫‪EXECUTE.‬‬
‫‪11‬‬
‫‪ .1‬הצג טבלה הכוללת את ממוצע הוותק‪ ,‬סטיית תקן‪ ,‬ערך מינימלי ומכסימלי‪.‬‬
‫תשובה‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= vetek1‬‬
‫‪/FORMAT=AVALUE NOTABLE.‬‬
‫דוגמה ב'‪ :‬בקובץ ‪ L5.sav‬ניצור משתנה מחושב המתאר וותק בלימודים נכון לתאריך מסוים (לא‬
‫היום כבדוגמה הקודמת)‪ .‬נבצע זאת ע"י חישוב ההפרש בין התאריך ‪ 0.0.1100‬לתאריך תחילת‬
‫הלימודים (בחודשים)‪.‬‬
‫‪ .0‬ב‪ ,Target Variable -‬כתוב ‪( vetek2‬וותק בחודשים)‪.‬‬
‫‪ .1‬בחר את הפונקציה ‪.DATEDIFF‬‬
‫‪ .3‬בחר את הפונקציה ‪ ,DATE.DMY‬הכנס אותה לארגומנט הראשון של הפונקציה‬
‫‪ ,DATEDIFF‬והגדר את שלושת הארגומנטים שלה עבור ‪ 0.0.1100‬כדלקמן‪:‬‬
‫)‪.DATE.DMY(1,1,2011‬‬
‫‪ .1‬את המשתנה ‪ q1‬הכנס כארגומנט שני של הפונקציה הנ"ל‪ .‬כארגומנט שלישי הכנס את‬
‫הביטוי '‪ .'years‬בתיבה ‪ Numeric Expression‬יתקבל הביטוי הבא‪:‬‬
‫)'‪ .DATEDIFF(DATE.DMY(1,1,2011),q1,'months‬משמעות הביטוי היא שהפרש‬
‫הזמן בין היום לתחילת הלימודים יובע בחודשים‪.‬‬
‫‪ .5‬הקלק ‪( OK‬או ‪ Paste‬ליצירת סינטקס)‪ .‬נוצר כעת משתנה חדש בשם ‪ vetek2‬שערכו‬
‫שווה להפרש בין תאריך נוכחי לתאריך תחילת הלימודים (בשנים)‪.‬‬
‫הסינטקס‪:‬‬
‫‪NUMERIC vetek2.‬‬
‫‪'.‬וותק בחודשים' ‪VARIABLE LABEL vetek2‬‬
‫‪COMPUTE vetek2 = DATEDIFF(DATE.DMY(1,1,2011),q1,'months').‬‬
‫‪EXECUTE.‬‬
‫‪ .2‬הצג טבלה הכוללת את ממוצע הוותק‪ ,‬סטיית תקן‪ ,‬ערך מינימלי ומכסימלי‪.‬‬
‫תשובה‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= vetek2‬‬
‫‪/FORMAT=AVALUE NOTABLE.‬‬
‫‪15‬‬
‫ממוצע של מספר משתנים‪ :‬בקובץ ‪ L5.sav‬ניצור משתנה מחושב המתאר ציון ממוצע של ‪1‬‬
‫הציונים הקיימים בקובץ‪.‬‬
‫‪ .0‬ב‪ ,Target Variable -‬כתוב ‪( meangrade‬ציון ממוצע)‪.‬‬
‫‪ .1‬בחר בקבוצה ‪ Statistical‬את הפונקציה ‪.Mean‬‬
‫‪ .3‬בתיבה ‪ ,Numeric Expression‬צור את הביטוי‪. MEAN(q6,q7,q8,q9) :‬‬
‫‪ .1‬הקלק ‪( OK‬או ‪ Paste‬ליצירת סינטקס)‪ .‬נוצר כעת משתנה חדש בשם ‪ meangrade‬שערכו‬
‫שווה ל ממוצע של ‪ 3‬הציונים‪.‬‬
‫הסינטקס‪:‬‬
‫‪NUMERIC meangrade.‬‬
‫‪'.‬ציון ממוצע' ‪VARIABLE LABEL meangrade‬‬
‫‪COMPUTE meangrade = MEAN(q6,q7,q8,q9).‬‬
‫‪EXECUTE.‬‬
‫‪ .1‬הצג טבלה הכוללת את ממוצע ה‪ ,meangrade-‬סטיית תקן‪ ,‬ערך מינימלי ומכסימלי‪.‬‬
11
‫תרגילים – חישוב משתנה חדש באמצעות פונקציות‬
:L2-multiple.sav ‫קובץ‬
.)‫ מהורים ומריבית‬,‫) השווה לממוצע ההכנסות (מעבודה‬meanincome( ‫ בנה משתנה מחושב‬.0
.‫הצג טבלה הכוללת ממוצע וסטיית תקן של ממוצע ההכנסה הנ"ל‬
:‫תשובה‬
NUMERIC meanincome.
VARIABLE LABEL meanincome 'MEAN(h1,h2,h3('.
COMPUTE meanincome = MEAN(h1,h2,h3(.
EXECUTE.
FREQUENCIES
/VARIABLES= meanincome
/FORMAT=AVALUE NOTABLE
/STATISTICS=MEAN STDDEV.
,‫ הצג טבלה הכוללת ממוצע‬.‫ שיציג גיל בשנים נכון להיום‬age ‫ בנה משתנה מחושב בשם‬.1
.age ‫סטיית תקן וחציון עבור המשתנה‬
:‫תשובה‬
NUMERIC age.
VARIABLE LABEL age '‫'גיל‬.
COMPUTE age = DATEDIFF($TIME,q1,'years').
EXECUTE.
FREQUENCIES
/VARIABLES= age
/FORMAT=AVALUE NOTABLE
/STATISTICS=MEAN STDDEV MEDIAN.
‫ הצג טבלה הכוללת‬.0.0.1112 ‫ שיציג גיל בשנים נכון ליום‬age2 ‫ בנה משתנה מחושב בשם‬.3
.age1 ‫ סטיית תקן וחציון עבור המשתנה‬,‫ממוצע‬
‫‪12‬‬
‫תשובה‪:‬‬
‫‪NUMERIC age2.‬‬
‫‪'.‬גיל'‪VARIABLE LABEL age2‬‬
‫)'‪COMPUTE age2 = DATEDIFF(DATE.DMY(1,1,2007),q1,'years‬‬
‫‪EXECUTE.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= age2‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN STDDEV MEDIAN.‬‬
‫התניית ביצוע חישוב משתנה באמצעות ביטויי תנאי (או ביטויים לוגיים)‬
‫ניתן להשתמש בביטויי תנאי (או כפי שהם נקראים לעיתית‪ ,‬ביטויים לוגיים)‪ ,‬כדי שפקודת‬
‫‪ Compute Variable‬תתבצע רק עבור חלק מהרשומות (ולא בכולן) העונות על תנאי מסוים‪.‬‬
‫נתייחס לקובץ ‪:L5.sav‬‬
‫נדרש לחשב ממוצע שונה עבור בנים ובנות‪ .‬עבור בנים הממוצע יחושב עבור כל ‪ 1‬המקצועות בעוד‬
‫שהממוצע של הבנות יחושב רק עבור ‪ 3‬המקצועות הראשונים (ללא מתמטיקה)‪.‬‬
‫‪ .0‬רשום את הסינטקס הבא‪:‬‬
‫‪NUMERIC meangrade_2.‬‬
‫‪'.‬ממוצע מותנה' ‪VARIABLE LABEL meangrade_2‬‬
‫‪IF q2=1 meangrade_2 = MEAN(q6,q7,q8,q9).‬‬
‫‪IF q2=2 meangrade_2 = MEAN(q6,q7,q8).‬‬
‫‪EXECUTE .‬‬
‫‪ .1‬הרץ את הסינטקס‪.‬‬
‫הרצת השגרה הנ"ל תחשב ממוצע בשיטות שונות לבנים ולבנות ולגבי אלה שחסר להם מגדר‬
‫– לא יחושב ממוצע כלל‪.‬‬
‫‪ .3‬הרץ דו"ח שכיחות שיציג ממוצע וסטיית תקן של המשתנה ‪ meangrade_2‬ממוין לפי‬
‫מגדר כדלקמן‪:‬‬
‫א‪.‬‬
‫פצל את הקובץ לפי מגדר‪.‬‬
‫ב‪.‬‬
‫הרץ דו"ח שכיחות עבור ממוצע מותנה אשר יכלול ממוצע וסטיית תקן‪.‬‬
‫‪11‬‬
‫יתקבל הדו"ח הבא‪:‬‬
‫‪SORT CASES BY q2.‬‬
‫‪SPLIT FILE LAYERED BY q2.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= meangrade_2‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN STDDEV.‬‬
‫תרגיל – התניית ביצוע חישוב של משתנה חדש‬
‫קובץ ‪:L2-multiple.sav‬‬
‫בנה משתנה מחושב בשם ‪( total_income‬כינוי‪ :‬הכנסה כוללת מותנה) המחושב עפ"י ההגדרה‬
‫הבאה‪:‬‬
‫עבור רווק‪ :‬סך ההכנסה החודשית מעבודה‪ ,‬מהורים ומריבית‪.‬‬
‫עבור מי שאינו רווק‪ :‬סך ההכנסה החודשית מעבודה ומריבית בלבד‪.‬‬
‫הצג טבלה הכוללת ממוצע‪ ,‬סטיית תקן וחציון עבור המשתנה הנ"ל‪.‬‬
‫‪15‬‬
‫תשובה‪:‬‬
‫‪NUMERIC total_income.‬‬
‫‪'.‬הכנסה כוללת מותנה' ‪VARIABLE LABEL total_income‬‬
‫‪IF q4=2 total_income = h1+h2+h3.‬‬
‫‪IF q4<>2 total_income = h1+h3.‬‬
‫‪EXECUTE.‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= total_income‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN STDDEV MEDIAN.‬‬
‫ישנן שתי חלופות נוספות לשורה הרביעית בסינטקס הנ"ל‪:‬‬
‫‪1) IF not q4=2 total_income = h1+h3.‬‬
‫‪2) IF q4~=2 total_income = h1+h3.‬‬
‫קידוד מחדש של משתנה (‪)Recode‬‬
‫פקודת ‪ Recode‬משמשת לצמצום מספר קטגוריות של משתנה‪ ,‬לשינוי קטגוריות קיימות (לאחר‬
‫שתשובות הנבדקים הוקלדו) או להפיכת משתנה רציף למשתנה בדיד (ע"י יצירת קטגוריות)‪.‬‬
‫שימוש נפוץ בפקודה זו הוא ל"הפוך" שאלות "הפוכות" כך שכל השאלות בשאלון יהיו באותה‬
‫מגמה‪ .‬הדוגמה הראשונה תתייחס לקובץ ‪ .Cars.sav‬נדרש לקודד מחדש את שנת הייצור של‬
‫הרכב (‪ )Year‬לשתי קטגוריות בלבד‪ :‬מכוניות שיוצרו עד ‪ 0525‬ועד בכלל ומכוניות שיוצרו משנת‬
‫‪ 0511‬ואילך‪:‬‬
‫‪ .0‬מהתפריט הראשי בחר‪:‬‬
‫‪Transform‬‬
‫‪Recode into Different Variables...‬‬
‫‪ .2‬בחר את המשתנה ‪ year‬והעבירו תחת הכותרת ‪.Old‬‬
‫‪ .3‬הצבע עם העכבר על המשתנה ‪.year‬‬
‫‪ .4‬תחת הכותרת ‪ Output Variable‬הגדר את שם המשתנה החדש ‪ yearcat‬ואת ה‪Label-‬‬
‫שלו‪ :‬שנת ייצור‪-‬קטגוריות‪.‬‬
‫‪21‬‬
‫‪ .5‬הקלק על …‪ .Old and New Values‬ייפתח החלון הבא‪:‬‬
‫‪ .1‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range, LOWEST through value‬והקלד‬
‫‪( 25‬כלומר‪ ,‬כל הערכים עד למכסימום ‪. )25‬‬
‫‪ .2‬תחת הכותרת ‪ New Value‬הקלד ‪ .0‬משמעות‪ :‬כל הערכים הישנים עד ‪ 25‬ועד בכלל‬
‫יהפכו לקוד חדש ‪.0‬‬
‫‪ .1‬הקש על ‪.Add‬‬
‫‪ .5‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪Range, value through HIGHEST:‬‬
‫והקלד ‪( 11‬כלומר‪ ,‬כל הערכים מ‪ 11-‬ומעלה) ‪.‬‬
‫‪ .01‬תחת הכותרת ‪ New Value‬הקלד ‪ .1‬משמעות‪ :‬כל הערכים הישנים מ‪ 11-‬ומעלה יהפכו‬
‫לקוד חדש ‪.1‬‬
‫‪20‬‬
‫‪ .00‬הקש על ‪ .Add‬יתקבל החלון הבא‪:‬‬
‫‪ .01‬הקש על ‪.Continue‬‬
‫‪ .03‬בתיבת השיח הראשית ‪ Recode into Different Variables‬הקש על ‪ .Change‬תחת‬
‫הכותרת ‪ Variables‬יתקבל הכיתוב הבא‪:‬‬
‫‪yearcat‬‬
‫‪year‬‬
‫‪21‬‬
‫‪ .44‬הקש ‪ .Paste‬יתקבל הסינטקס‪:‬‬
‫‪RECODE‬‬
‫‪year‬‬
‫)‪(LOWEST THRU 79 = 1) (80 THRU HIGHEST = 2‬‬
‫‪INTO yaercat.‬‬
‫‪".‬שנת ייצור‪-‬קטגוריות" ‪VARIABLE LABELS yaercat‬‬
‫‪EXECUTE.‬‬
‫‪ .05‬הפעל את הסינטקס‪ .‬נוצר בקובץ משתנה חדש בשם ‪ yearcat‬אשר ערכיו הם ‪( 0‬עד שנת‬
‫‪ )25‬או ‪( 1‬שנת ‪ 11‬ומעלה)‪ .‬ה‪ Label -‬של המשתנה החדש הוא "שנת ייצור‪-‬קטגוריות"‪.‬‬
‫ניתן להוסיף את הכינוי של כל קטגוריה באמצעות ‪ .Variable Label‬נשנה גם את סולם‬
‫המדידה לאורדינאלי ואת מספר הספרות אחרי הנקודה ל‪.1-‬‬
‫‪ .01‬הרץ דו"ח שכיחות עבור המשתנה החדש ‪ .yearcat‬מתקבל הדו"ח הבא‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= yaercat‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫נדגים כעת שימוש בפקודת ‪ Recode‬המשלבת ערכים בדידים וטווחי ערכים‪ .‬נשתמש בקובץ‬
‫‪ 1991 U.S. General Social Survey.sav‬כדי לקודד מחדש את המשתנה השכלה‬
‫]‪ .Highest Year of School Completed [educ‬ע"ב בדיקת התפלגות המשתנה‪ ,‬נדרש לקודד‬
‫אותו מחדש כדלקמן‪:‬‬
‫‪.0‬‬
‫‪.1‬‬
‫‪.3‬‬
‫‪.1‬‬
‫‪.5‬‬
‫עד ‪ 5‬שנות לימוד‪.‬‬
‫‪.01-00‬‬
‫‪.01‬‬
‫‪.03-05‬‬
‫‪ 01‬ומעלה‪.‬‬
‫‪ .0‬מהתפריט הראשי בחר‪:‬‬
‫‪Transform‬‬
‫‪Recode into Different Variables...‬‬
‫‪ .2‬בחר את המשתנה ‪ educ‬והעבירו תחת הכותרת ‪.Old‬‬
‫‪23‬‬
‫‪ .3‬תחת הכותרת ‪ Output Variable‬הגדר את שם המשתנה החדש ‪ educat‬ואת ה‪Label-‬‬
‫שלו‪ :‬השכלה‪-‬קטגוריות‪.‬‬
‫‪ .4‬הקלק על …‪.Old and New Values‬‬
‫‪ .5‬תחת הכותרת ‪ Old Value‬בחר באפשרות‬
‫‪Range, LOWEST through value:‬‬
‫והקלד ‪( 5‬כלומר‪ ,‬כל הערכים עד למכסימום ‪. )5‬‬
‫‪ .1‬תחת הכותרת ‪ New Value‬הקלד ‪ .0‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים עד ‪ 5‬ועד בכלל יהפכו לקוד חדש ‪.0‬‬
‫‪ .2‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range‬והקלד ‪( 00 through 10‬כלומר‪ ,‬כל‬
‫הערכים מ‪ 01-‬עד ל‪. )00 -‬‬
‫‪ .1‬תחת הכותרת ‪ New Value‬הקלד ‪ .1‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 01-00‬יהפכו לקוד חדש ‪.1‬‬
‫‪ .5‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Value‬והקלד ‪( 12‬כלומר‪ ,‬הערך ‪ 01‬בדיוק) ‪.‬‬
‫‪ .01‬תחת הכותרת ‪ New Value‬הקלד ‪ .3‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים שערכם ‪ 01‬יהפכו לקוד חדש ‪.3‬‬
‫‪ .00‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range‬והקלד ‪( 05 through 13‬כלומר‪ ,‬כל‬
‫הערכים מ‪ 03-‬עד ל‪. )05 -‬‬
‫‪ .01‬תחת הכותרת ‪ New Value‬הקלד ‪ .1‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 03-05‬יהפכו לקוד חדש ‪.1‬‬
‫‪ .03‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range, value through HIGHEST‬והקלד‬
‫‪( 16‬כלומר‪ ,‬כל הערכים מ‪ 01-‬ומעלה) ‪.‬‬
‫‪ .01‬תחת הכותרת ‪ New Value‬הקלד ‪ .5‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 01‬ומעלה יהפכו לקוד חדש ‪ .5‬בשלב זה המסך‬
‫יראה כך‪:‬‬
21
.Continue ‫ הקש על‬.05
‫ תחת‬.Change ‫ הקש על‬Recode into Different Variables ‫ בתיבת השיח הראשית‬.01
:‫ יתקבל הכיתוב הבא‬Numeric Variable  Output Variable ‫הכותרת‬
educ  educat
:‫ יתקבל הסינטקס‬.Paste ‫ הקש‬.41
RECODE educ
(LOWEST THRU 9 = 1) (10 THRU 11 = 2) (12 = 3) (13 THRU 15 = 4)
(16 THRU HIGHEST = 5) INTO educat.
VARIABLE LABELS educat
X'D794D7A9D79BD79CD7942DD7A7D798D792D795D7A8D799D795D7AA.'
EXECUTE.
.5 ‫ עד‬0 ‫ אשר ערכיו הם‬educat ‫ נוצר בקובץ משתנה חדש בשם‬.‫ הפעל את הסינטקס‬.01
."‫קטגוריות‬-‫ של המשתנה החדש הוא "השכלה‬Label -‫ה‬
‫ ועדכן את הכינויים של כל הקודים‬Variable View ‫ עבור למסך‬,‫ כדי לסיים את הפעולה‬.05
:‫ כדלקמן‬Values -‫ ב‬educat ‫החדשים במשתנה‬
5 ‫עד‬
01-00
01
03-05
‫ ומעלה‬01
.0
.1
.3
.1
.5
‫‪25‬‬
‫‪ .11‬לחילופין ניתן לעדכן את הכינויים באמצעות הסינטקס הבא‪:‬‬
‫‪VALUE LABELS‬‬
‫‪/educat‬‬
‫‪' 1‬עד ‪ 11' 1 '13-11' 4 '12' 3 '11-11' 2 '9‬ומעלה'‪.‬‬
‫כדי שמספר הספרות מימין לנקודה העשרונית במשתנה החדש יהיה אפס‪ ,‬ניתן לכוון זאת‬
‫ידנית במסך ‪ Variable View‬או להריץ את הסינטקס הבא‪:‬‬
‫‪FORMATS educat (F8.0).‬‬
‫הרץ דו"ח שכיחות עבור המשתנה החדש‪ .‬מתקבל הדו"ח הבא‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= educat‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫תרגיל – קידוד מחדש של משתנה (‪)Recode‬‬
‫קובץ ‪:L2-multiple.sav‬‬
‫באמצעות פקודת ‪ Recode‬בנה משתנה מחושב בשם ‪( ed_new‬השכלה) שיתבסס על המשתנה‬
‫‪ .q3‬המשתנה החדש יכלול ‪ 1‬קטגוריות בלבד‪:‬‬
‫‪=0 .0‬יסודית‬
‫‪=1 .1‬תיכונית‪.‬‬
‫‪=3 .3‬אקדמית‪.‬‬
‫‪ =55 .1‬אין תשובה (הגדר כ‪.)Missing-‬‬
‫ההמרה תבוצע כמוגדר בטבלה הבאה‪:‬‬
‫מס'‬
‫‪q3‬‬
‫‪ed_new‬‬
‫‪0‬‬
‫‪=0‬יסודית‬
‫‪=0‬יסודית‬
‫‪1‬‬
‫‪=1‬תיכונית‬
‫‪=1‬תיכונית‬
‫‪3‬‬
‫‪=3‬על תיכונית‬
‫‪=3‬אקדמית‬
‫‪1‬‬
‫‪=1‬תואר ראשון‬
‫‪=3‬אקדמית‬
‫‪5‬‬
‫‪=5‬תואר שני‬
‫‪=3‬אקדמית‬
‫‪1‬‬
‫‪=1‬תואר שלישי‬
‫‪=3‬אקדמית‬
‫‪2‬‬
‫‪=55‬אין תשובה‬
‫‪=55‬אין תשובה‬
‫הפק דו"ח שכיחות עבור המשתנה החדש‪.‬‬
‫‪21‬‬
‫תשובה‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= ed_new‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
‫יצירת משתנה קטגוריאלי ממשתנה רציף‬
‫מספר משתנים קטגוריאליים בקובץ הנתונים ‪ demo.sav‬נגזרים למעשה ממשתנים רציפים‬
‫בקובץ‪ .‬למשל‪ ,‬המשתנה ‪ inccat‬הוא פשוט המשתנה ‪ income‬המקובץ ל‪ 1-‬קטגוריות‪ .‬המשתנה‬
‫הקטגוריאלי עושה שימוש ב‪ 1-‬קטגוריות כדי לייצג את קטגוריות ההכנסה הבאות‪:‬‬
‫‪ ‬פחות מ‪ 15,111 -‬דולר בשנה‪.‬‬
‫‪.15,111-15,111 ‬‬
‫‪.51,111-21,111 ‬‬
‫‪ 25,111 ‬ומעלה‪.‬‬
‫כדי ליצור את המשתנה הקטגוריאלי ‪ inccat‬ע"ב המשתנה הקיים ‪ ,income‬בצע את הר"מ‪:‬‬
‫‪ .10‬מהתפריט הראשי בחר‪:‬‬
‫‪Transform‬‬
‫‪Recode into Different Variables...‬‬
‫‪ .22‬בחר את המשתנה ‪ income‬והעבירו תחת הכותרת ‪.Old‬‬
‫‪ .23‬תחת הכותרת ‪ Output Variable‬הגדר את שם המשתנה החדש ‪ inccat2‬ואת ה‪Label-‬‬
‫שלו‪ :‬קטגוריות הכנסה‪.‬‬
‫‪22‬‬
‫‪ .24‬הקלק על …‪.Old and New Values‬‬
‫‪ .15‬תחת הכותרת ‪ Old Value‬בחר באפשרות‬
‫‪Range, LOWEST through value:‬‬
‫והקלד ‪( 11‬כלומר‪ ,‬כל הערכים עד למכסימום ‪. )11‬‬
‫‪ .11‬תחת הכותרת ‪ New Value‬הקלד ‪ .0‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים עד ‪ 11‬ועד בכלל יהפכו לקוד חדש ‪.0‬‬
‫‪ .12‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range‬והקלד ‪( 15 through 15‬כלומר‪ ,‬כל‬
‫הערכים מ‪ 15-‬עד ל‪. )15 -‬‬
‫‪ .11‬תחת הכותרת ‪ New Value‬הקלד ‪ .1‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 15-15‬יהפכו לקוד חדש ‪.1‬‬
‫‪ .15‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range‬והקלד ‪( 21 through 51‬כלומר‪ ,‬כל‬
‫הערכים מ‪ 51-‬עד ל‪. )21 -‬‬
‫‪ .31‬תחת הכותרת ‪ New Value‬הקלד ‪ .3‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 51-21‬יהפכו לקוד חדש ‪.3‬‬
‫‪ .30‬תחת הכותרת ‪ Old Value‬בחר באפשרות ‪ Range, value through HIGHEST‬והקלד‬
‫‪( 25‬כלומר‪ ,‬כל הערכים מ‪ 25-‬ומעלה) ‪.‬‬
‫‪ .31‬תחת הכותרת ‪ New Value‬הקלד ‪ .1‬הקש על ‪.Add‬‬
‫משמעות‪ :‬כל הערכים הישנים בתחום ‪ 25‬ומעלה יהפכו לקוד חדש ‪ .1‬בשלב זה המסך‬
‫יראה כך‪:‬‬
‫‪ .33‬הקש על ‪.Continue‬‬
‫‪ .31‬בתיבת השיח הראשית ‪ Recode into Different Variables‬הקש על ‪ .Change‬תחת‬
‫הכותרת‬
‫‪ Variables‬יתקבל הכיתוב הבא‪:‬‬
‫‪21‬‬
‫‪inccat2‬‬
‫‪income‬‬
‫‪ .33‬הקש ‪ .Paste‬יתקבל הסינטקס‪:‬‬
‫‪RECODE income‬‬
‫‪(LOWEST THRU 24 = 1) (25 THRU 49 = 2) (50 THRU 74 = 3) (75‬‬
‫)‪THRU HIGHEST = 4‬‬
‫‪INTO inccat2 .‬‬
‫‪".‬קטגוריות הכנסה" ‪VARIABLE LABELS inccat2‬‬
‫‪EXECUTE.‬‬
‫‪ .31‬כדי לסיים את הפעולה‪ ,‬עבור למסך ‪ Variable View‬ועדכן את הכינויים של כל הקודים‬
‫החדשים במשתנה ‪ inccat2‬ב‪ Values -‬כדלקמן‪:‬‬
‫‪.0‬‬
‫‪.1‬‬
‫‪.3‬‬
‫‪.1‬‬
‫עד ‪11‬‬
‫‪15-15‬‬
‫‪51-21‬‬
‫‪ 25‬ומעלה‬
‫‪ .32‬לחילופין ניתן לעדכן את הכינויים באמצעות הסינטקס הבא‪:‬‬
‫‪VALUE LABELS‬‬
‫‪/inccat2‬‬
‫‪' 1‬עד ‪ 41' 4 '11-44' 3 '21-49' 2 '24‬ומעלה'‪.‬‬
‫כדי שמספר הספרות מימין לנקודה העשרונית במשתנה החדש יהיה אפס‪ ,‬ניתן לכוון זאת‬
‫ידנית במסך ‪ Variable View‬או להריץ את הסינטקס הבא‪:‬‬
‫‪FORMATS inccat2 (F8.0).‬‬
‫מתקבל הדו"ח הבא‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= inccat2‬‬
‫‪/FORMAT=AVALUE TABLE‬‬
‫‪/STATISTICS=NONE.‬‬
25
‫תרגיל – יצירת משתנה קטגוריאלי ממשתנה רציף‬
:L2-multiple.sav ‫קובץ‬
‫ המשתנה‬.)h1( ‫בנה משתנה קטגוריאלי בהתבסס על המשתנה הרציף הכנסה חודשית מעבודה‬
:‫) יכלול את הקטגוריות הבאות‬h1_cat( ‫החדש‬
.1111-‫פחות מ‬
.1111-3555
.1111-5555
.1111-2555
.‫ ומעלה‬1111
.0
.1
.3
.1
.5
.‫הצג טבלת שכיחות עבור המשתנה החדש‬
:‫תשובה‬
RECODE
h1
(LOWEST THRU 1999 = 1) (2000 THRU 3999 = 2) (4000 THRU 5999
= 3) (6000 THRU 7999 = 4) (8000 THRU HIGHEST = 5)
INTO h1_cat .
VARIABLE LABELS h1_cat
X'D794D79BD7A0D7A1D79420D79ED7A2D791D795D793D794'.
EXECUTE.
VALUE LABELS
/ h1_cat
0111' 1 '1111-4999' 4 '4111-1999' 3 '2111-3999' 2 '1999 ‫ 'עד‬1
.'‫ומעלה‬
FORMATS h1_cat (F8.0).
FREQUENCIES
/VARIABLES= h1_cat
/FORMAT=AVALUE TABLE
/STATISTICS=NONE.
‫‪11‬‬
‫נושא מס' ‪ :5‬מיון קובץ ‪ Data‬ובקרת נתונים‬
‫נושא ‪ 5‬כולל אפשרויות למיין את קובץ ה‪ data -‬כדי להציג את הרשומות במיון רצוי‪ .‬כמו כן‬
‫נעסוק ביצירת כלי בקרה שיסייעו באיתור שגיאות הזנה ובתיקונן‪.‬‬
‫מיון קובץ ‪Data‬‬
‫קבצים אינם מאורגנים תמיד בצורה האידיאלית עבור צרכים ספציפיים‪ .‬כדי להכין את הנתונים‬
‫לניתוח‪ ,‬ניתן למיין רשומות בהתבסס על ערך של משתנה אחד או יותר‪.‬‬
‫מיון רשומות (מיון שורות בקובץ ה‪ )data-‬הוא לעיתים שימושי או אף הכרחי עבור סוגי ניתוח‬
‫מסוימים‪ .‬כדי לשנות את סדר הרשומות ע"ב משתנה אחד או יותר‪ ,‬בחר מהתפריט הראשי (קובץ‬
‫‪:)demo.sav‬‬
‫‪Data‬‬
‫‪Sort Cases...‬‬
‫הוסף את המשתנים ]‪ Age in years [age‬וכן ]‪Household income in thousands [income‬‬
‫לרשימת המיון (‪ .)Sort by‬כאשר מוסיפים יותר ממשתנה מיון אחד‪ ,‬סדר הופעתם קובע את סדר‬
‫מיונם‪ .‬בדוגמה שלפנינו‪ ,‬לכל גיל יהיה מיון לפי הכנסה‪ .‬משתני מחרוזת ימוינו בסדר אלפא ביתי‬
‫(באנגלית‪ ,‬אות גדולה קודמת לקטנה)‪ .‬לגבי כל משתנה מיון‪ ,‬ניתן לקבוע אם הוא ימוין בסדר עולה‬
‫(‪ )Ascending‬או יורד (‪ .)Descending‬הקלק ‪( OK‬או ‪ Paste‬ולאחר מכן הרץ את הסינטקס)‪.‬‬
‫הסינטקס המתקבל הוא‪:‬‬
‫‪SORT CASES BY age income(A).‬‬
‫האות ‪ A‬בסוגריים מצביעה על ‪ ,Ascending‬כלומר מיון בסדר עולה‪ .‬אם המיון הוא בסדר יורד‪,‬‬
‫תופיע האות ‪ D‬בסוגריים (‪.)Descending‬‬
‫הקובץ במיון החדש (בסדר עולה) יראה כך‪:‬‬
‫‪10‬‬
‫הסינטקס הבא יבצע מיון ראשי לפי גיל יורד ומיון משני לפי הכנסה עולה‪:‬‬
‫‪SORT CASES BY age(D) income(A).‬‬
‫לא ניתן לבצע את הפעולה הנ"ל ישירות מהתפריט (אלא רק כאשר סוג המיון זהה לכל‬
‫המשתנים)‪.‬‬
11
)kesher.sav ‫תרגיל – יצירת קובץ משני ומיונו (קובץ‬
:‫ הפק את הקובץ הבא‬kesher.sav ‫מהקובץ‬
.‫ דתיים רווקים‬,‫ גברים‬:‫אוכלוסיה‬
.‫ א"ב של שם פרטי‬,‫ א"ב של שם משפחה‬:‫מיון‬
:‫תשובה‬
COMPUTE select1 = gender=1 and religion=1 and family=1.
EXECUTE.
SELECT IF (select1 <> 0).
SORT CASES BY mishpaha prati(A).
‫‪13‬‬
‫איתור שגיאות הזנה בקובץ ‪ Data‬ותיקונן‬
‫לאחר הקלדת נתונים לקובץ ‪ Data‬יש צורך לבצע בקרה על איכות הנתונים‪ ,‬לאתר שגיאות‬
‫הקלדה ולתקנן‪ .‬דו"חות מפורטים עשויים לסייע באיתור רשומות שגויות‪ .‬נפריד בין שני סוגי‬
‫שגיאות הזנה‪:‬‬
‫א‪.‬‬
‫מחרוזת (‪ )String‬שלא הוזנה‪ :‬מחרוזת כזו אינה נחשבת ב‪ PSPP-‬כ‪ .Missing-‬למשל שם‬
‫משפחה שלא הוזן‪ ,‬אינו נחשב ל כ‪ Missing-‬אולם למרות זאת יש צורך לאתרו ולהשלים‬
‫את החסר‪.‬‬
‫ב‪.‬‬
‫משתנה נומרי שלא הוקלד או שהוזן עבורו ערך שגוי‪ :‬כל אחד מהמצבים הללו נחשב‬
‫כ‪ .Missing-‬משתנה נומרי חסר נחשב תמיד כ‪ Missing -‬בעוד שמשתנה נומרי שגוי יחשב‬
‫כ‪ Missing -‬רק אם הוגדר כך ע"י המשתמש‪ .‬כך למשל‪ ,‬אם בסקלת תשובות של ‪0-5‬‬
‫התחום שמעל ‪ 5‬הוגדר מראש (ב‪ )Variable View-‬כ‪ ,Missing -‬אזי הקלדה של ערך ‪2‬‬
‫תחשב ע"י התוכנה כ‪( Missing -‬ולא תילקח בחשבון בחישובים הסטטיסטיים)‪.‬‬
‫מחרוזת שלא הוזנה‬
‫כיוון שמחרוזת כזו אינה נחשבת כ‪ ,Missing-‬יש לאתר את הרשומה שבה חסרה מחרוזת באופן‬
‫הבא‪ :‬נניח שנדרש לאתר את כל השמות הפרטיים (‪ )prati‬בקובץ שלא הוזנו‪ .‬לשם כך‪ ,‬יש להגדיר‬
‫ב‪ Select cases-‬את ביטוי התנאי הבא‪. prati=' ' :‬‬
‫נאתר כעת את כל הרשומות בקובץ ‪ kesher-haser.sav‬שבהן לא הוקלד שם פרטי או שם‬
‫משפחה‪:‬‬
‫‪ .0‬בשלב ראשון יש לבצע ברירת אוכלוסיה עבור כל הרשומות שבהן חסר שם פרטי או שם‬
‫משפחה‪ .‬לשם כך‪ ,‬בחר מהתפריט הראשי‪:‬‬
‫‪Transform‬‬
‫…‪Compute‬‬
‫‪ .1‬מתחת לכותרת ‪( Target Variable‬בצד שמאל למעלה)‪ ,‬תן שם למשתנה המחושב למשל‬
‫‪.selection1‬‬
‫‪ .3‬מתחת ל‪ Numeric Expressions-‬רשום את הביטוי הלוגי המתאים‪:‬‬
‫' '=‪Prati= ' ' or mishpaha‬‬
‫‪ .1‬הקש ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪COMPUTE selection1 = prati=' ' or mishpaha=' '.‬‬
‫‪EXECUTE.‬‬
‫‪ .5‬הרץ את הסינטקס‪ .‬לקובץ נוסף משתנה בשם ‪ selection1‬המקבל ערך ‪ 0‬עבור כל רשומה‬
‫העונה על התנאי הנ"ל (חסר שם פרטי או שם משפחה) וערך ‪ 1‬עבור כל רשומה שאינה‬
‫עונה על התנאי‪.‬‬
‫‪ .1‬בחר מהתפריט הראשי‪:‬‬
‫‪Data‬‬
‫‪Select Cases...‬‬
‫פעולה זו פותחת את תיבת השיח של ‪.Select Cases‬‬
‫‪11‬‬
‫‪ .2‬סמן את האפשרות ‪.Use filter variable‬‬
‫‪ .1‬בחר בסוף הרשימה את המשתנה ‪ selection1‬והעבר אותו לצד הימני של התיבה‪:‬‬
‫‪ .5‬מתחת לכותרת ‪ Unselected Cases Are‬בחר באפשרות‬
‫‪.‬‬
‫‪ .01‬הקש על ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪SELECT IF (selection1 <> 0).‬‬
‫‪ .00‬הרץ את הסינטקס‪ .‬מתקבל הקובץ הבא הכולל ‪ 1‬רשומות בלבד‪:‬‬
‫כלומר‪ ,‬אותרו ‪ 1‬רשומות (מס' ‪ )135 ,131 ,11 ,11‬שבהן חסר שם פרטי או שם משפחה‪.‬‬
‫‪ .01‬כעת נדרש לנסות ולהשלים את החסר‪ .‬בהנחה שמדובר בתקלת הקלדה‪ ,‬יש לחזור למקור‬
‫הנתונים‪ ,‬לבדוק את הרשומות הללו (למשל ע"י בדיקת טפסי השאלונים הממוספרים)‬
‫ולהשלים את החסר‪ .‬לצורך התרגיל‪ ,‬נעיין בקובץ "התקין" בשם ‪ kesher.sav‬ונבדוק‬
‫האם השמות החסרים מופיעים ברשומות הנ"ל‪.‬‬
‫כעת ניתן לתקן את הרשומות הנ"ל בקובץ ‪.kesher-haser.sav‬‬
‫‪15‬‬
‫משתנה נומרי שגוי או שלא הוזן‬
‫קובץ‪.relations-partial-shgiot-huge.sav :‬‬
‫להבדיל ממשתנה מחרוזת‪ ,‬משתנה נומרי שלא הוזן נחשב ע"י התוכנה כחסר (‪ .)Missing‬כך‬
‫הדבר גם לגבי משתנה נומרי הנמצא בתחום שהוגדר ע"י המשתמש כ‪( Missing -‬במסך‬
‫‪ .)Variable View‬כדי לאתר רשומות בקובץ ‪ relations-partial-shgiot-huge.sav‬שבהן ישנם‬
‫משתנים נומריים חסרים או שלא בתחום שהוגדר ע"י המשתמש‪ ,‬יש לפעול בדרך הבאה‪:‬‬
‫‪ .0‬בשלב ראשון יש לאתר את המשתנים הנומריים שבהם יש ‪ Missing‬אחד לפחות‪ .‬כדי‬
‫לעשות זאת‪ ,‬נריץ דו"ח ‪ frequencies‬מינימלי (כולל רק ממוצע) עבור כל המשתנים‬
‫הנומריים‪:‬‬
‫‪FREQUENCIES‬‬
‫‪/VARIABLES= attach01 attach02 attach03 attach04 attach05‬‬
‫‪gender age religion family educ‬‬
‫‪/FORMAT=AVALUE NOTABLE‬‬
‫‪/STATISTICS=MEAN.‬‬
‫יתקבל הפלט הבא‪:‬‬
‫‪11‬‬
‫משמעות הפלט‪ :‬המשתנים‬
‫‪attach01‬‬
‫עד‬
‫‪attach05‬‬
‫מתייחסים לשאלות בסקלה של ‪.2 – 0‬‬
‫כלומר‪ ,‬כל ערך גבוה מ‪ 2-‬או נמוך מ‪ 0-‬נחשב כ‪ .Missing -‬כך הדבר גם לגבי ערכים שלא‬
‫הוקלדו‪ .‬הפלט מצביע על כך שלגבי שאלות‬
‫‪attach04 ,attach03 ,attach02‬‬
‫וכן‬
‫‪gender‬‬
‫נמצאה‬
‫רשומה אחת (לכל משתנה) שבה יש ‪ . Missing‬כעת נדרש לאתר את הרשומות הנ"ל כדי‬
‫לתקנן‪ .‬משמעות נוספת של הפלט היא שלגבי כל שאר המשתנים‪ ,‬אין ‪ Missing‬באף רשומה‬
‫כך שאין צורך להמשיך ולבדוק אותם‬
‫‪ .1‬כעת יש אם כן צורך להפיק דו"ח איתור חסרים עבור המשתנים הנ"ל בלבד‪ .‬לשם כך‪,‬‬
‫נעשה שימוש בפונקציה ‪ MISSING‬אשר הפעלתה על משתנה נומרי מחזירה ערך ‪0‬‬
‫כלומר חסר או ‪ 1‬שמשמעותו "לא חסר"‪ .‬כדי לאתר את הרשומות שבהן ישנם משתנים‬
‫חסרים‪ ,‬נגדיר משתנה ‪ s1‬הכולל את ברירת האוכלוסייה הבאה‪:‬‬
‫‪MISSING(attach02)=1 or MISSING(attach03)=1 or MISSING(attach04)=1‬‬
‫‪or MISSING(gender)=1‬‬
‫לחילופין‪ ,‬ניתן לכתוב גם את הביטוי הבא (מבצע את אותה פעולה)‪:‬‬
‫‪or‬‬
‫)‪MISSING(attach04‬‬
‫‪or‬‬
‫)‪MISSING(attach03‬‬
‫‪or‬‬
‫)‪MISSING(attach02‬‬
‫)‪MISSING(gender‬‬
‫הביצוע יהיה כדלקמן‪:‬‬
‫‪ .3‬בחר מהתפריט הראשי‪:‬‬
‫‪Transform‬‬
‫…‪Compute‬‬
‫‪ .1‬מתחת לכותרת ‪( Target Variable‬בצד שמאל למעלה)‪ ,‬תן שם ‪ s1‬למשתנה המחושב‪.‬‬
‫‪ .5‬מתחת ל‪ Numeric Expressions-‬רשום את הביטוי הלוגי המתאים‪:‬‬
‫‪or‬‬
‫)‪MISSING(attach04‬‬
‫‪or‬‬
‫)‪MISSING(attach03‬‬
‫‪or‬‬
‫)‪MISSING(attach02‬‬
‫)‪MISSING(gender‬‬
‫‪ .1‬הקש ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪COMPUTE s1 = MISSING(attach02) or MISSING(attach03) or‬‬
‫‪MISSING(attach04) or MISSING(gender).‬‬
‫‪EXECUTE.‬‬
‫‪ .2‬הרץ את הסינטקס‪ .‬לקובץ נוסף משתנה בשם ‪ s1‬המקבל ערך ‪ 0‬עבור כל רשומה העונה על‬
‫התנאי הנ"ל (אם באחד המשתנים הנ"ל יש ‪ )Missing‬וערך ‪ 1‬עבור כל רשומה שאינה עונה‬
‫על התנאי‪.‬‬
‫‪ .1‬בחר מהתפריט הראשי‪:‬‬
‫‪Data‬‬
‫‪Select Cases...‬‬
‫פעולה זו פותחת את תיבת השיח של ‪.Select Cases‬‬
‫‪ .5‬סמן את האפשרות ‪.Use filter variable‬‬
‫‪ .01‬בחר בסוף הרשימה את המשתנה ‪ s1‬והעבר אותו לצד הימני של התיבה‪.‬‬
‫‪12‬‬
‫‪.‬‬
‫‪ .00‬מתחת לכותרת ‪ Unselected Cases Are‬בחר באפשרות‬
‫‪ .01‬הקש על ‪ .Paste‬מתקבל הסינטקס הבא‪:‬‬
‫‪SELECT IF (s1 <> 0).‬‬
‫‪ .03‬הרץ את הסינטקס‪ .‬מתקבל הקובץ הבא הכולל ‪ 1‬רשומות בלבד‪:‬‬
‫מהקובץ ניתן ללמוד כי ישנן שגיאות בהזנת ‪ 1‬הרשומות הבאות‪:‬‬
‫‪ :287‬ערך ‪ 1‬למשתנה ‪ attach04‬הינו שגוי (התחום המותר‪.)0-2 :‬‬
‫‪ :236‬לא הוקלד ערך למשתנה ‪.attach02‬‬
‫‪ :657‬ערך ‪ 1‬למשתנה "מגדר" הינו שגוי (התחום המותר‪.)0-1 :‬‬
‫‪ :517‬ערך ‪ 1‬למשתנה ‪ attach03‬הינו שגוי (התחום המותר‪.)0-2 :‬‬
‫כעת נדרש לתקן את השגיאות בקובץ ע"י בדיקת נתוני המקור (כגון טפסי השאלונים)‪ ,‬איתור‬
‫הרשומה המתאימה בקובץ והזנת ערך נכון בשדה השגוי‪.‬‬
‫תרגיל ‪ -‬איתור שגיאות הזנה בקובץ ‪Data‬‬
‫קובץ‪kesher-shelon-haser.sav :‬‬
‫אתר בקובץ ‪ kesher-shelon-haser.sav‬רשומות שבהן יש משתנים חסרים‪/‬שגויים‪ .‬הצבע על‬
‫המשתנים החסרים‪/‬שגויים‪.‬‬
‫תשובה‪:‬‬
‫דו"ח ‪ Frequencies‬מצביע על כך שישנם ‪ 1‬שדות נומריים חסרים ברשומה אחת (כל אחד)‪:‬‬
‫‪ gender‬ו‪.education -‬‬
‫הקובץ המתקבל מצביע על ‪ 1‬רשומות שבהן יש משתנים נומריים או מחרוזתיים שלא‬
‫הוזנו‪/‬שגויים‪.‬‬
‫‪11‬‬
‫תרגיל – גזירת מדגם מקובץ ומיונו‬
‫קובץ‪seker.sav :‬‬
‫הקובץ ‪ seker.sav‬כולל את רשימת ‪ 511‬תלמידי בית ספר שש‪-‬שנתי (השמות פיקטיביים)‪.‬‬
‫הקובץ כולל מס' סידורי‪ ,‬שם פרטי ומשפחה‪ ,‬מגדר ושכבה בלבד‪ .‬בצע את הר"מ‪:‬‬
‫‪‬‬
‫גזור מתוך הקובץ הראשי מדגם אקראי של ‪ 51‬תלמידים בלבד שרק להם יימסרו שאלוני‬
‫מחקר‪.‬‬
‫‪‬‬
‫מיין את קובץ המדגם לפי שכבה‪ ,‬שם משפחה ושם פרטי‪.‬‬
‫תשובה אפשרית (מוצג רק חלק מקובץ המדגם)‪:‬‬
‫‪SAMPLE 90 FROM 900.‬‬
‫‪SORT CASES BY grade mishpaha prati(A).‬‬