דף נוסחאות

‫‪1‬‬
‫דף נוסחאות‬
‫סטטיסטיקה‬
‫התפלגות‬
‫אם‬
‫לדוגמא‪:‬‬
‫התפלגות‬
‫אם‬
‫התפלגות‬
‫אם‬
‫ערכים מתוך התפלגות זו נקבל‪:‬‬
‫וניקח דגימה של‬
‫∑‬
‫נקבל‪:‬‬
‫ו‪-‬‬
‫ו‪-‬‬
‫√‬
‫נקבל‪:‬‬
‫שני מסבירים (תחת הנחות רגילות)‬
‫מציאת אמדים‪:‬‬
‫∑‬
‫∑‬
‫תכונות‪:‬‬
‫̅‬
‫∑√‬
‫̅‬
‫)‬
‫̅‬
‫∑‬
‫∑‬
‫(‬
‫∑‬
‫)‬
‫∑‬
‫(‬
‫ניבוי‪:‬‬
‫∑‬
‫עבור מבחן ‪ t‬נצטרך אמד לשונות הרעש‪:‬‬
‫)‬
‫(‬
‫∑‬
‫)‬
‫∑‬
‫(‬
‫̅‬
‫כאשר‪:‬‬
‫‪ k‬מסבירים (תחת הנחות רגילות)‬
‫מציאת אמדים‪:‬‬
‫לחלופין ניתן להגדיר ‪ k‬משוואות לפי כל האילוצים‪:‬‬
‫∑‬
‫לחלופין‪:‬‬
‫כאשר * מסמל את מטריצת ההפרשים מהממוצע ו‪-‬‬
‫∑‬
‫̅‬
‫הם כל המקדמים ללא החותך‪.‬‬
‫‪2‬‬
‫̅‬
‫̅‬
‫̂ ̂‬
‫מתאם מתוקנן‪:‬‬
‫̅‬
‫מדד למורכבות המבחן (יותר גבוה – המודל פחות יעיל)‪:‬‬
‫תכונות‪:‬‬
‫כך ש‪:‬‬
‫∑‬
‫הוא המתאם בין המסביר ‪ k‬לכל שאר המסבירים‪.‬‬
‫מתואם חזק עם שאר המסבירים ולכן השונות גבוהה (מולטי‬
‫גבוה‪,‬‬
‫כאשר‬
‫לא מוגדרת (מולטי קולינאריות מושלמת)‬
‫‪ ,‬השונות של‬
‫קולינאריות)‪ .‬כאשר‬
‫בצורת הפרשים‪:‬‬
‫השערות‪:‬‬
‫∑‬
‫עבור מבחן ‪ t‬נצטרך אמד לשונות הרעש‪:‬‬
‫מבחן ‪F‬‬
‫כאשר ‪ R‬מטריצה מסדר‬
‫הינה‬
‫השערת‬
‫‪ ,‬ו‪ r -‬מטריצה מסדר‬
‫ולכן‪:‬‬
‫כמו כן‪:‬‬
‫ולכן ערך ‪ F‬יהיה‪:‬‬
‫במקרה מקרה פרטי‬
‫(רק על המקדמים בלי החותך) יתקיים‪:‬‬
‫‪3‬‬
‫במקרה מקרה פרטי‬
‫כאשר‬
‫כמו כן‪:‬‬
‫חותכים) יתקיים‪:‬‬
‫(על‬
‫)‬
‫הינו ה‪ RSS-‬מהרגרסיה המאולצת (‬
‫הינו המתאם בריבוע מהרגרסיה המאולצת‪.‬‬
‫כאשר‬
‫הערה‪ :‬אם כולל בדיקה על מקדם בודד ניתן לחשב‬
‫מבחן ‪.t‬‬
‫תנאי הדרגה לבדיקת מולטי קולניאריות‬
‫מנרמלים את מטריצת ‪ X‬כך ש‪:‬‬
‫‖‬
‫ולכן נקבל‪:‬‬
‫‖‬
‫לפי‬
‫√‬
‫√‬
‫נחשב למטריצה זו ערכים עצמים ונחשב את תנאי הדרגה‪:‬‬
‫כך ש‬
‫וליצור‬
‫‪ℴ‬‬
‫∞ ‪ .‬אם‬
‫√‬
‫‪ℴ‬‬
‫‪ ℴ‬ישנה מולטי קולניאריות‪.‬‬
‫בדיקת הטרוסקדסטיות‬
‫תחת הטרוסקדסטיות מתקיים‪:‬‬
‫במקרה כזה נקבל אמד לא יעיל‪:‬‬
‫מבחני ‪ t‬ו‪ F-‬לא תקפים‪.‬‬
‫מבחן ‪ White‬לבדיקת הטרוסקדסטיות‬
‫יוצרים רגרסיה על ה‪:RSS-‬‬
‫המהווה‬
‫‪ ,‬כאשר‬
‫לרגרסיה זו‪ .‬תחת השערת‬
‫נחשב‬
‫השערה להומוסקדסטיות המתאם בריבוע יתפלג‪:‬‬
‫‪.‬‬
‫אם הסטטיסטי מספיק גדול נדחה את השערת ההומוסקדסטיות ותתקיים‬
‫הטרוסקדסטיות‪.‬‬
‫מבחן ‪ B-P‬לבדיקת הטרוסקדסטיות‬
‫נניח הטרוסקדסטיות מהצורה הבאה‪:‬‬
‫תתקיים הומוסקדסטיות‪:‬‬
‫תחת‬
‫פרוצדורה‪ :‬נריץ ‪ OLS‬על מודל מקורי ונחשב את‪:‬‬
‫נריץ רגרסיה של‬
‫הסטטיסטי יהיה‪:‬‬
‫̃‬
‫∑‬
‫̃‬
‫על כל ה‪z-‬ים כמשתנים מסבירים ונחשב את ה‪ ESS-‬ברגרסיה זו‪.‬‬
‫‪4‬‬
‫תיקונים להטרוסקדסטיות‬
‫‪ – Robust s.e‬תיקון של סטיות התקן לסטיות תקן אשר עמידות להטרוסקדסטיות‬
‫̂‬
‫∑‬
‫) ( ̂ כאשר‬
‫היא השארית מהרגרסיה של‬
‫על כל שאר‬
‫הוא ה‪ RSS-‬מאותה רגרסיה ו‪ ̂ -‬זאת השארית מהרגרסיה‬
‫המסבירים‪.‬‬
‫המקורית‪.‬‬
‫מבחן ‪ t‬המתוקנן יהיה‪:‬‬
‫)‬
‫( ̂ √‬
‫‪GLS‬‬
‫ניתן להשתמש כאשר‬
‫כך ש‪:‬‬
‫̂‬
‫ידועה‪ .‬נחלק את כל הנתונים בסטיית התקן של‬
‫) (‬
‫) (‬
‫נריץ ‪ OLS‬על רגרסיה זו ונמצא את המקדמים בהם נשתמש במודל המקורי‪.‬‬
‫נקבל‪:‬‬
‫באופן כללי אם‬
‫כמו כן‪:‬‬
‫מבחן ‪ F‬יהיה‪:‬‬
‫כאשר‪:‬‬
‫‪FGLS‬‬
‫כאשר לא ידועה‪ ,‬נאמוד אותה ע"י הרצת רגרסיה של ̂‬
‫̂‬
‫̂‬
‫̂‬
‫̂ ‪ .‬נקבל את האמד‪:‬‬
‫לקבל את‬
‫ונעשה טרנספורמציה‪:‬‬
‫̂√‬
‫אוטו קורלציה מסדר )‪AR(1‬‬
‫במקרה כזה יתקיים‬
‫̂√‬
‫כאשר‬
‫נחשב סטטיסטי לפי מבחן דרבון –ווטסטון‪:‬‬
‫אם‬
‫אם‬
‫אם‬
‫)‬
‫לטובת‬
‫נדחה את‬
‫לא נדחה את‬
‫לטובת‬
‫נדחה את‬
‫̂√‬
‫(‬
‫על כל ה‪X-‬ים כדי‬
‫̂‬
‫̂√‬
‫משתנה נורמלי עם תוחלת ‪ 0‬ושונות‬
‫̂‬
‫‪ .‬כאשר‬
‫‪ .‬אחרת אין הכרעה‪.‬‬
‫∑‬
‫∑‬
‫‪5‬‬
‫התפלגות ‪Z‬‬
‫התפלגות ‪t‬‬
‫‪6‬‬
‫טבלת ‪ F‬עבור טעות מסוג ראשון‬
‫𝜶‬
‫‪7‬‬
‫מודל עם משתנה מסביר אחד‬
‫‪ .1‬חוקר ידוע ביקש לבדוק קשר בין ציון פסיכומטרי לבין ממוצע התואר בכלכלה‪ .‬הוא דגם שישה‬
‫תלמידים ומצא את הנתונים הבאים‪:‬‬
‫אלכס‬
‫‪000‬‬
‫‪22‬‬
‫תלמיד ‪i‬‬
‫‪ Xi‬ציון פסיכומטרי‬
‫‪ Yi‬ממוצע תואר‬
‫בוריס‬
‫‪050‬‬
‫‪07‬‬
‫א‪ .‬חשב את מקדם המתאם‬
‫דימה‬
‫‪066‬‬
‫‪00‬‬
‫מאשה‬
‫‪002‬‬
‫‪07‬‬
‫סאשה‬
‫‪020‬‬
‫‪05‬‬
‫דאשה‬
‫‪060‬‬
‫‪26‬‬
‫בין ציון הפסיכומטרי לממוצע התואר‪ .‬מה תוכל להסיק על הקשר בין‬
‫שני המשתנים?‬
‫כאשר מתקיימות ארבעת ההנחות הבאות‪:‬‬
‫ב‪ .‬הנח קשר לפי המודל‪:‬‬
‫)‬
‫חשב אמדים ל‪-‬‬
‫(‬
‫ו‪. -‬‬
‫עבור כל תצפית‪.‬‬
‫ג‪ .‬חשב את השגיאה‬
‫ד‪ .‬צייר את קו הרגרסיה על גרף והצב את הנקודות‪.‬‬
‫ה‪.‬חשב את השונות המוסברת ‪ ESS‬ואת השונות הלא מוסברת ‪ RSS‬והראה היכן הם מתבטאות בגרף‪.‬‬
‫‪.‬‬
‫ו‪ .‬הראה ש‪-‬‬
‫‪ .‬חשב את השונות של ‪ b‬ו‪ a-‬עבור התפלגות ‪ X‬א‪-‬סטוכסטית (כלומר‪ ,‬עבור‬
‫ז‪ .‬הנח ש‪-‬‬
‫‪X‬ים קבועים לפי הנתונים במדגם)‪.‬‬
‫ח‪ .‬עתה בדוק את ההשערה האם קיים קשר בין ציון פסיכומטרי לממוצע התואר‪ .‬נסח את השערת‬
‫האפס וקבע האם ניתן לדחות אותה ברמת ביטחון של ‪ 5%‬ומהי ההסתברות לטעות‪.‬‬
‫ט‪ .‬עתה הנח ש‪-‬‬
‫לא ידועה‪ .‬חזור על הסעיף הקודם‪ .‬היעזר בתשובתך גם בהתפלגות ‪ t‬וגם‬
‫בהתפלגות ‪.F‬‬
‫י‪ .‬בהמשך לסעיף הקודם‪ ,‬חשב רווח בר סמך ל‪ b-‬ברמת ביטחון של ‪.5%‬‬
‫‪ .2‬חוקר לכלכלה מעוניין לבדוק את הקשר בין שכר ממוצע בערים שונות ביחס למרחקן מת"א‪.‬‬
‫החוקר אסף את הנתונים הבאים‪:‬‬
‫עיר ‪i‬‬
‫‪ Xi‬מרחק מת"א בק"מ‬
‫‪ Yi‬שכר שעתי ממוצע‬
‫באר שבע‬
‫‪770‬‬
‫‪25‬‬
‫נתניה‬
‫‪00‬‬
‫‪22‬‬
‫הרצליה‬
‫‪00‬‬
‫‪00‬‬
‫א‪ .‬חשב את המתאם בין מרחק מת"א לשכר שעתי‪ .‬מה המשמעות של מתאם זה?‬
‫ב‪ .‬חשב את ‪ .RSS ,ESS‬מדוע קיבלת התוצאות הנ"ל?‬
‫ג‪ .‬חשב את ‪ b‬ו‪.a-‬‬
‫ד‪ .‬מהי המובהקות של ‪?b‬‬
‫‪8‬‬
‫רגרסיה רב מימדית‬
‫‪ .1‬חוקר בישראל מעוניין לבדוק את הקשר בין הכנסה שנתית של משק בית באלפי דולרים ( ) לבין‬
‫מספר הדורות שעברו מאז עליית המשפחה לארץ (‬
‫‪4‬‬
‫‪2‬‬
‫‪3‬‬
‫‪1‬‬
‫‪3‬‬
‫‪1‬‬
‫‪5‬‬
‫‪1‬‬
‫) ומספר הילדים במשפחה (‬
‫)‪.‬‬
‫‪17‬‬
‫‪18‬‬
‫‪28‬‬
‫‪37‬‬
‫א‪ .‬איזה קשר צפוי שיתקיים בין ההכנסה השנתית למשתנים המסבירים?‬
‫ב‪ .‬כתוב את הנתונים בצורה מטריציונית לפי המודל‬
‫ג‪ .‬חשב אומדים ל‪-‬‬
‫ו‪-‬‬
‫‪ .‬אל תשכח להוסיף את החותך‪.‬‬
‫‪.‬‬
‫ד‪ .‬מה תוכל להגיד על השפעת מספר הילדים במשפחה על ההכנסה השנתית?‬
‫ה‪ .‬חשב את השגיאה‬
‫ו‪ .‬נתון ש‪:‬‬
‫עבור כל תצפית וסכום את סך כל השגיאות‪.‬‬
‫‪ .‬חשב את‬
‫‪.‬‬
‫ואת‬
‫ז‪ .‬החוקר מעוניין לבדוק את מובהקות הרגרסיה‪ .‬בטא את השערת האפס בצורה לינארית‪:‬‬
‫ח‪ .‬חשב את ערך ‪ F‬וקבע האם ניתן לדחות את השערת האפס (שתי דרכים אפשריות)‪.‬‬
‫רמז‪:‬‬
‫]‬
‫]‬
‫[‬
‫[‬
‫]‬
‫[‬
‫]‬
‫[‬
‫‪9‬‬
‫מולטי קולניאריות ו‪GLS-‬‬
‫‪ .1‬סטודנט באוניברסיטת חיפה אשר כותב עבודת סמינריון מבקש לבדוק מהי הנטייה השולית לצרוך‬
‫במשק‪ .‬לשם כך הוא מדד נתונים על מספר משקי בית הכוללים את ההכנסה החודשית שלהם באלפי‬
‫שקלים ( )‪ ,‬את ההוצאה החודשית שלהם באלפי שקלים (‬
‫במונחים דולרים (‬
‫) ואת ההוצאה החודשית שלהם‬
‫)‪ .‬לשם ההמרה משקלים לדולרים השתמש הסטודנט בשער חליפין של ‪7‬‬
‫שקלים לדולר‪.‬‬
‫‪2‬‬
‫‪7‬‬
‫‪0‬‬
‫‪7‬‬
‫‪6‬‬
‫‪7‬‬
‫‪72‬‬
‫‪70‬‬
‫‪0‬‬
‫‪7‬‬
‫‪0‬‬
‫‪7‬‬
‫ו‪-‬‬
‫‪ .‬הסבר את ממצאיך‪.‬‬
‫חשב אומדים ל‪-‬‬
‫‪ .2‬חוקר אסף נתונים על שני משתנים וקיבל את התוצאות הבאות‪.‬‬
‫תצפית ‪i‬‬
‫‪7‬‬
‫‪7‬‬
‫חותך‬
‫‪2‬‬
‫‪5‬‬
‫‪Xi‬‬
‫‪00‬‬
‫‪70‬‬
‫‪Yi‬‬
‫לאחר שהריץ רגרסיה פשוטה על הנתונים קיבל את המקדמים‪:‬‬
‫‪7‬‬
‫‪7‬‬
‫‪70‬‬
‫‪.‬‬
‫עתה הנח שמתקיימת הטרוסקדסטיות בצורה הבאה‪:‬‬
‫א‪ .‬כתוב את מטריצת ‪.‬‬
‫ב‪ .‬מצא את מטריצת‬
‫המקיימת‪:‬‬
‫נתון‪:‬‬
‫]‬
‫]‬
‫ג‪ .‬מצא אמדים ל‪ -‬חשב אמדים ל‪-‬‬
‫[‬
‫ו‪( -‬שתי דרכים אפשריות)‪.‬‬
‫[‬