מיקום מרכזי ופיזור

‫היסטוגרמה‬
‫התפלגות ימי העדרות בשנה‬
‫חציון‬
‫‪12‬‬
‫‪11‬‬
‫‪10‬‬
‫‪9‬‬
‫‪6‬‬
‫‪6‬‬
‫‪4‬‬
‫‪2‬‬
‫‪2‬‬
‫‪20-24‬‬
‫‪15-19‬‬
‫שכיחות העובדים‬
‫‪8‬‬
‫‪2‬‬
‫‪0‬‬
‫‪10-14‬‬
‫‪0-4‬‬
‫‪5-9‬‬
‫ימי ההעדרות‬
‫שיעור ‪ – 5‬ערכים מרכזיים )המשך( ופונקציות הפסד‪.‬‬
‫כללי הסכימה‬
‫עבור סידרה של ערכים ‪ x1,x2,x3,…xn‬נסמן‬
‫‪ – i‬אינדקס רץ שממספר את הפריטים‪.‬‬
‫‪ – xi‬סימון הערכים בסדרה ‪. x1,x2,x3,…xn‬‬
‫‪ – n‬מספר הפריטים בסדרה‪.‬‬
‫כדי לסמן סכום של סידרה משתמשים בסיגמה ‪) Σ‬האות היוונית הגדולה(‬
‫‪n‬‬
‫) ‪= ( x1 + x2 + x3 + .... + xn‬‬
‫‪∑x‬‬
‫‪i‬‬
‫‪i =1‬‬
‫הסימנים הם‪:‬‬
‫סיגמה ‪ – Σ‬היא סימן של סכום עבור סדרת ערכים‪.‬‬
‫‪ – i‬אינדקס רץ שממספר את הפריטים‪.‬‬
‫‪ – n‬מספר הפריטים‪.‬‬
‫‪1‬‬
‫שיעור ‪ – 5‬ערכים מרכזיים )המשך( ופונקציות הפסד‪.‬‬
‫_‬
‫ממוצע – מסומן ‪ (mean) X‬הוא סכום הערכים חלקי מספר הערכים‪.‬‬
‫את נוסחת הממוצע עבור הסדרה ‪ x1,x2,x3,…xn‬נסמן‬
‫‪n‬‬
‫) ‪( x1 + x2 + x3 + .... + xn‬‬
‫‪n‬‬
‫‪∑x‬‬
‫‪i‬‬
‫=‬
‫‪i =1‬‬
‫‪n‬‬
‫___‬
‫= ‪X‬‬
‫את נוסחת הממוצע ריכוז של תוצאות או טבלת שכיחויות נסמן‬
‫)‪∑ x • f ( x‬‬
‫‪x‬‬
‫‪n‬‬
‫שכיחות‬
‫מצטברת‬
‫‪2‬‬
‫‪12‬‬
‫‪16‬‬
‫‪17‬‬
‫‪18‬‬
‫‪24‬‬
‫‪24‬‬
‫‪24‬‬
‫‪28‬‬
‫‪33‬‬
‫‪F(x)*X‬‬
‫‪20‬‬
‫‪90‬‬
‫‪32‬‬
‫‪7‬‬
‫‪6‬‬
‫‪30‬‬
‫‪0‬‬
‫‪0‬‬
‫‪8‬‬
‫‪5‬‬
‫‪198‬‬
‫‪6‬‬
‫ˆ‬
‫‪x‬‬
‫חציון=‪7‬‬
‫ממוצע=‪6‬‬
‫=‪Σ‬‬
‫ממוצע‬
‫=‪X‬‬
‫שכיחות שביעות‬
‫המשיבים הרצון‬
‫‪X‬‬
‫)‪f(x‬‬
‫‪2‬‬
‫‪10‬‬
‫‪4‬‬
‫‪1‬‬
‫‪1‬‬
‫‪6‬‬
‫‪0‬‬
‫‪0‬‬
‫‪4‬‬
‫‪5‬‬
‫‪33‬‬
‫‪10‬‬
‫‪9‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫סכום‬
‫‪2‬‬
‫רמת המדידה‬
‫שכיח‬
‫חציון‬
‫ממוצע‬
‫משתנה שמי‬
‫)נומינלי(‬
‫‪+‬‬
‫‪-‬‬
‫‪-‬‬
‫סולם סודר‬
‫)אורדינלי(‬
‫‪+‬‬
‫‪+‬‬
‫‪-‬‬
‫‪+‬‬
‫‪+‬‬
‫‪+‬‬
‫‪+‬‬
‫‪+‬‬
‫‪+‬‬
‫סולם רווח‬
‫)אינטרוולי(‬
‫סולם מנה או יחס‬
‫)אבסולוטי(‬
‫דוגמאות‬
‫• לאום‪ :‬יהודים‪ ,‬ערבים‪ ,‬דרוזים‬
‫• מין‪ :‬זכר‪/‬נקבה‬
‫• צורות ישוב‪ :‬עירוני‪ ,‬קהילתי‪ ,‬חקלאי‬
‫• סוג דם‪A, B, AB, O. :‬‬
‫• מקצוע‪ :‬נגר‪ ,‬רופא‪ ,‬חוקר‪...‬‬
‫• מצב משפחתי‪ :‬נשוי‪ ,‬רווק‪ ,‬גרוש‪ ,‬אלמן‬
‫• ארץ מוצא‪ :‬אסיה‪ ,‬אירופה‪ ,‬אפריקה‪...‬‬
‫• רמה מקצועית‪ :‬טכנאי‪,‬הנדסאי‪ ,‬מהנדס‬
‫• דרגה‪ :‬טוראי‪ ,‬רב"ט‪ ,‬סמל‬
‫• סולם הטונים באוקטבה‪ :‬דו‪ ,‬רה‪ ,‬מי )יש אמנם רבעי וחצאי טון אך רק סולם התדרים הוא רציף(‬
‫• שביעות רצון בעבודה‪ :‬מאוד‪ ,‬מעט‪ ,‬בכלל לא‪.‬‬
‫• מידת הסכמה עם הגדים‪ :‬מסכים בהחלט‪ ,‬מסכים‪ ,‬ניטרלי‪ ,‬מתנגד‪,‬מתנגד בהחלט‪.‬‬
‫• סידור היררכי של פריטים לפי חשיבות – למשל דרוג סדר החשיבות של קרירה‪ ,‬משפחה‪,‬‬
‫השכלה‪ ,‬ופנאי )מתקבלים ‪ 4‬סולמות(‪.‬‬
‫• מידות של בגדים‪48 , 44 , 42 :‬‬
‫• דרגה בשרות הציבורי‪...44 ,43 ,41 :‬‬
‫• סולמות שאינם ליניאריים*‪ .‬למשל למבדה ‪ λ‬במבחן רורשך מחושב כמספר תגובות של "צורה‬
‫טהורה" חלקי מספר התגובות שאינם צורה טהורה‪.‬‬
‫• דרוג מ‪ 1-‬עד ‪ 10‬לשביעות רצון ממקום העבודה‪-10 :‬מאוד שבע רצון‪-1 ,‬מאוד לא מרוצה‪.‬‬
‫• ציון סולם ליקרט )‪ (Likert, 1932‬למידת הסכמה‪-1 :‬מתנגד בתוקף ‪ -5‬מסכים בהחלט‪.‬‬
‫• טמפרטורה – צלזיוס או פרנהיט‬
‫• ציון פסיכומטרי‬
‫• לחץ דם‬
‫• מספר ילדים למשפחה‬
‫• שנות לימוד‬
‫• מספר ימי מחלה‬
‫• מספר איחורים לעבודה‬
‫• גיל בשנים‬
‫• שנות ותק‬
‫• שכר חודשי‬
‫• איחורים לעבודה בשעות‬
‫• משקל‬
‫• גובה‬
‫* למשל סולמות לוגריתמים כגון סולם ריכטר לדרוג רעידות אדמה‪ ,‬סולם בדציבלים לעוצמת קול‪ ,‬וסולמות פסיכו‪-‬פיזיים אחרים‪ ,‬אלו סולמות‬
‫רציפים אך בהרבה מקרים צריך להתיחס אליהם כאל אינטרוולים‪.‬‬
‫פונקציות הפסד‬
‫אמרנו שהמדד המרכזי אמור לסכם את הערכים שקיבלנו כך‬
‫שבאמצעות ערך בודד אנו יכולים לאפיין את האוכלוסיה ולהשוות בין‬
‫אוכלוסיות שונות‪ .‬כמו כן אנו מתיחסים אליו כבעל יכולת ניבוי‪ .‬כלומר‬
‫המדד המרכזי מסוגל לתאר כל אחת מהתצפיות שנמדדו )עם שגיאה‬
‫מסוימת הנובעת מההתפלגות(‪ .‬אנו רוצים לדעת מה תוקף הניבוי‬
‫שהמדד מניב‪ .‬כלומר אנו רוצים לראות איזה מדד מרכזי מנבא הכי טוב‬
‫את התצפיות שלנו‪.‬‬
‫המונח "הכי טוב" נגזר מהצרכים שלנו כלומר את סוג השגיאה אנו‬
‫מגדירים בהתאם לצרכים‪ .‬לשם כך אנו מחשבים פונקצית הפסד‪.‬‬
‫ההפסד בניבוי הוא הפער בין התצפית לבין הערך המרכזי‪ ,‬והניבוי‬
‫הטוב ביותר הוא הניבוי שסכום ההפסדים שלו מעבר לתצפיות הוא‬
‫הקטן ביותר‪.‬‬
‫‪3‬‬
‫‪ 3‬פונקציות הפסד‬
‫‪.I‬‬
‫מהו המדד המנבא הכי הרבה תצפיות‪.‬‬
‫כל שגיאה בניבוי נספרת כהפסד‪.‬‬
‫‪.II‬‬
‫מהו הניבוי שהסטיות ממנו יהיו הקטנות ביותר‪.‬‬
‫גודל ההפסד כגודל הסטיה מניבוי‪.‬‬
‫‪ .III‬מהו הניבוי שיצמצם בעיקר את הסטיות הגדולות‪.‬‬
‫גודל ההפסד כריבוע הסטיה מהניבוי‬
‫‪ .I‬ניבוי הכי הרבה תצפיות‬
‫למשל בתוצאות שביעות הרצון‪ ,‬אם אני רוצה מדד שייצג הכי‬
‫הרבה עובדים‪ .‬אז פונקצית ההפסד שלי תקבל נקודה עבור‬
‫כל עובד שהמדד המרכזי לא מיצג אותו ותקבל אפס עבור כל‬
‫עובד שהמדד מיצג‪ .‬ככל שסכום הנקודות יותר גדול כך‬
‫ההפסד שלי יותר גבוה )בפונקציה כזאת אין משמעות לגודל‬
‫הטעות(‪.‬‬
‫‪n‬‬
‫‪Lxˆ = ∑ li‬‬
‫‪i =1‬‬
‫ˆ‪0 xi = x‬‬
‫= ‪li‬‬
‫ˆ‪1 xi ≠ x‬‬
‫‪4‬‬
‫פונקצית הפסד ראשונה לפי מספר טעויות הניבוי‬
‫שכיחות שביעות‬
‫ˆ‬
‫‪x‬‬
‫המשיבים הרצון‬
‫שכיח‬
‫חציון‬
‫ממוצע‬
‫‪X‬‬
‫)‪f(x‬‬
‫‪Xi≠9 F(x)*L Xi≠7 F(x)*L Xi≠6 F(x)*L‬‬
‫‪10‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪9‬‬
‫‪10‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪10‬‬
‫‪1‬‬
‫‪10‬‬
‫‪8‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪7‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪5‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪4‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪3‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪2‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪5‬‬
‫‪1‬‬
‫‪5‬‬
‫‪1‬‬
‫‪5‬‬
‫‪1‬‬
‫‪5‬‬
‫סכום‬
‫‪33‬‬
‫‪L= 23‬‬
‫‪L= 32‬‬
‫‪L= 32‬‬
‫‪ .II‬ניבוי שהסטיות ממנו הן הקטנות ביותר‬
‫אם לא כל כך חשוב לי שהניבוי יפגע בול בערכים יותר‬
‫חשוב לי סטיות כמה שיותר קטנות‪.‬‬
‫למשל בשביעות הרצון‪ ,‬חשוב שטעות הניבוי תהיה‬
‫מינימאלית עבור כל העובדים‪ .‬אז פונקצית ההפסד שלי‬
‫תהיה הערך המוחלט של גודל הטעות‪ .‬ככל שסכום‬
‫הערכים המוחלטים יותר קטן כך יש לי פחות ההפסד‪.‬‬
‫‪n‬‬
‫ˆ‪Lxˆ = ∑ xi − x‬‬
‫‪i =1‬‬
‫‪5‬‬
‫פונקצית הפסד שנייה לפי גודל הסטיה מהניבוי‬
‫ˆ‬
‫‪x‬‬
‫חציון‬
‫ממוצע‬
‫שכיח‬
‫|‪|9-Xi‬‬
‫)‪f(x‬‬
‫‪8‬‬
‫‪4‬‬
‫‪6‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪10‬‬
‫‪30‬‬
‫‪3‬‬
‫‪20‬‬
‫‪2‬‬
‫‪0‬‬
‫‪0‬‬
‫‪10‬‬
‫‪9‬‬
‫‪8‬‬
‫‪2‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪8‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪7‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪3‬‬
‫‪3‬‬
‫‪1‬‬
‫‪6‬‬
‫‪6‬‬
‫‪1‬‬
‫‪12‬‬
‫‪2‬‬
‫‪24‬‬
‫‪4‬‬
‫‪6‬‬
‫‪5‬‬
‫‪0‬‬
‫‪2‬‬
‫‪0‬‬
‫‪3‬‬
‫‪0‬‬
‫‪5‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪3‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪6‬‬
‫‪0‬‬
‫‪3‬‬
‫‪16‬‬
‫‪4‬‬
‫‪20‬‬
‫‪5‬‬
‫‪28‬‬
‫‪7‬‬
‫‪4‬‬
‫‪2‬‬
‫‪25‬‬
‫‪5‬‬
‫‪30‬‬
‫‪6‬‬
‫‪40‬‬
‫‪8‬‬
‫‪5‬‬
‫‪F(x)*l‬‬
‫|‪|Xi-6‬‬
‫שכיחות‬
‫המשיבים‬
‫‪L= 94‬‬
‫‪F(x)*l‬‬
‫|‪|Xi-7‬‬
‫שביעות הרצון‬
‫‪L= 93‬‬
‫‪F(x)*l‬‬
‫‪L= 103‬‬
‫‪33‬‬
‫‪X‬‬
‫‪1‬‬
‫סכום‬
‫‪ .III‬ניבוי שיצמצם את הסטיות הגדולות‬
‫אם הסטיות הקטנות מהניבוי לא כל כך חשובות אבל‬
‫חשוב לי לצמצם בעיקר את הסטיות הגדולות אני אשתמש‬
‫בפונקציה שמעלה את הסטיות בריבוע‪.‬‬
‫למשל בשביעות הרצון‪ ,‬אם חשוב שהניבוי יתחשב בכל‬
‫הערכים – שנתחשב גם בעובדה שיש עובדים שלא היו‬
‫מרוצים‪ .‬אז פונקצית ההפסד שלי תהיה ריבוע הסטיה‬
‫מהניבוי‪ .‬ככל שסכום ריבוע הסטיות יותר קטן כך יהיה‬
‫פחות הפסד‪.‬‬
‫‪n‬‬
‫) ˆ‪Lxˆ = ∑ ( xi − x‬‬
‫‪2‬‬
‫‪i =1‬‬
‫‪6‬‬
‫פונקצית הפסד שלישית לפי ריבוע הסטיה‬
‫שכיחות‬
‫המשיבים‬
‫שביעות הרצון‬
‫‪(9-Xi)2‬‬
‫)‪f(x‬‬
‫‪X‬‬
‫‪32‬‬
‫‪16‬‬
‫‪18‬‬
‫‪9‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪10‬‬
‫‪90‬‬
‫‪9‬‬
‫‪40‬‬
‫‪4‬‬
‫‪0‬‬
‫‪0‬‬
‫‪10‬‬
‫‪9‬‬
‫‪16‬‬
‫‪4‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪8‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪4‬‬
‫‪4‬‬
‫‪1‬‬
‫‪7‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪9‬‬
‫‪9‬‬
‫‪1‬‬
‫‪6‬‬
‫‪6‬‬
‫‪1‬‬
‫‪24‬‬
‫‪4‬‬
‫‪96‬‬
‫‪16‬‬
‫‪6‬‬
‫‪5‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪9‬‬
‫‪0‬‬
‫‪25‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪9‬‬
‫‪0‬‬
‫‪16‬‬
‫‪0‬‬
‫‪36‬‬
‫‪0‬‬
‫‪3‬‬
‫‪64‬‬
‫‪16‬‬
‫‪100‬‬
‫‪25‬‬
‫‪196‬‬
‫‪49‬‬
‫‪4‬‬
‫‪2‬‬
‫‪25‬‬
‫‪180‬‬
‫‪36‬‬
‫‪320‬‬
‫‪64‬‬
‫‪5‬‬
‫‪1‬‬
‫ממוצע‬
‫‪F(x)*l‬‬
‫חציון‬
‫‪(6-Xi)2‬‬
‫‪125‬‬
‫‪L= 334‬‬
‫‪F(x)*l‬‬
‫שכיח‬
‫‪(7-Xi)2‬‬
‫‪L= 367‬‬
‫‪F(x)*l‬‬
‫‪L= 631‬‬
‫‪33‬‬
‫סכום‬
‫‪7‬‬