מבוא להסתברות וסטטיסטיקה למדעי ם הקורס סיכו , שנת - Notes

‫סיכום הקורס מבוא להסתברות וסטטיסטיקה למדעי‬
‫המחשב א' ‪ ,‬שנת הלימודים תשע"ב‬
‫מאת סשה גולדשטיין‪sashag@cs ,‬‬
‫הסיכום להלן מבוסס על הרצאותיו של ד"ר גל אלידן ושיעורי התרגול של מר לירון רבנר‪ .‬זהו אינו סיכום רשמי של‬
‫סגל הקורס‪ ,‬ואינני מתחייב על דיוק הנאמר בו‪ .‬לא כל הדוגמאות שהובאו בשיעור נמצאות בסיכום‪ .‬אם אתם‬
‫מוצאים טעות‪ ,‬אי‪-‬דיוק‪ ,‬השמטה – אשמח לקבל הערות למייל שלי‪.sashag@cs ,‬‬
‫הסתברות בסיסית‬
‫מטרת הקורס היא לבנות שפה פורמלית לטיפול באי‪-‬וודאות‪ .‬נעסוק במונחים ניסוי‪ ,‬מרחב מדגם‪ ,‬הסתברות‪.‬‬
‫מרחב מדגם ופונקציית הסתברות‬
‫הגדרה‪ :‬מרחב המדגם הוא אוסף כל התוצאות האפשריות בניסוי (מאורעות)‪ ,‬ונסמנו ‪.‬‬
‫הגדרה‪ :‬פונקציית הסתברות‬
‫הבאות (אקסיומות קולמוגורוב)‪:‬‬
‫) (‬
‫(‪)1‬‬
‫) (‬
‫(‪ )2‬לכל מאורע ‪,‬‬
‫(‪ )3‬לכל זוג מאורעות זרים‬
‫ממפה מאורעות למספרים‪ .‬פונקציית הסתברות מקיימת את האקסיומות‬
‫) (‬
‫‪( ),‬‬
‫(‬
‫)‬
‫הגדרה‪ :‬עבור מרחב מדגם בדיד וסופי‪ ,‬פונקציית הסתברות המקיימת‬
‫| |‬
‫| |‬
‫) ( לכל מאורע‬
‫נקראת פונקציית‬
‫הסתברות אחידה‪.‬‬
‫קל לראות שפונקציית הסתברות אחידה אכן מקיימת את האקסיומות הדרושות מפונקציית הסתברות‪.‬‬
‫הגדרה‪ :‬נחלק את מרחב המדגם למאורעות‬
‫נקרא מאורעות אלמנטריים‪.‬‬
‫למאורעות‬
‫מתקיים‬
‫כך שלכל‬
‫וגם‬
‫⋃‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫הטלת מטבע לא מוטה‪ .‬מרחב המדגם הוא‬
‫‪‬‬
‫בהטלת קובייה ‪ 5‬פעמים‪ ,‬ניתן להסתכל על מספר מרחבי מדגם‪:‬‬
‫תוצאות אפשריות‪ ,‬למשל‬
‫‪ o‬תוצאה ספציפית – יש‬
‫‪ o‬מקסימום בכל ‪ 5‬ההטלות – יש ‪ 6‬תוצאות אפשריות‬
‫‪ o‬כמה פעמים היה מספר זוגי בקובייה – יש ‪ 6‬תוצאות אפשריות‬
‫מרחב מדגם של הטלת קוביה לא מוטה פעמיים – ‪ 36‬תוצאות אפשריות‪ ,‬והוא סימטרי (או אחיד) – ההסתברות של כל מאורע‬
‫אלמנטרי היא אותו הדבר‬
‫מהי ההסתברות של‪ 12-‬אנשים יש ימי הולדת ב‪ 12-‬חודשים שונים?‬
‫מאורעות העונים על הדרישה‪ .‬בהנחה שמרחב המדגם הוא‬
‫מאורעות שונים‪ ,‬ומתוכם‬
‫‪ o‬במרחב המדגם‬
‫‪‬‬
‫‪‬‬
‫סימטרי‪ ,‬התוצאה היא‬
‫וכאן‬
‫) (‬
‫) ( ‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ ,‬ועבור כל אחר‪,‬‬
‫) ( עבור כל כך שקיים מאורע אלמנטרי שמקיים‬
‫נגדיר פונקציית הסתברות כך ש‪-‬‬
‫) ( ‪ .‬זוהי אכן פונקציית הסתברות‪ :‬שתי האקסיומות הראשונות מתקיימות באופן טריוויאלי‪ ,‬וגם השלישית מתקיימת‬
‫מבדיקה‪.‬‬
‫ניתן להגדיר גם פונקציית הסתברות על מרחבי מדגם רציפים (אינסופיים)‪:‬‬
‫)‬
‫( וכך‬
‫‪ o‬למשל‪ ,‬מסובבים גלגל מזל שהיקפו ‪ 1‬כך שהגלגל יכול להיעצר על כל מספר בין ‪ 0‬ל‪ .1-‬כאן‪ ,‬למשל‪,‬‬
‫גם לכל תוצאה ספציפית אחרת‪.‬‬
‫)] [ ]‬
‫[( ‪ ,‬ועבור איחוד של קטעים זרים‬
‫‪ o‬כדי להגיע להסתברויות חיוביות‪ ,‬נסתכל על קטעים ונגדיר‬
‫( )] [ ]‬
‫( )‬
‫)‬
‫[( ‪.‬‬
‫‪ o‬קל לראות שהאקסיומות מתקיימות עבור בנייה מהסוג הזה‪.‬‬
‫זורקים מטבע בקוטר ‪ 3‬ס"מ על שולחן אינסופי של משבצות ‪-4‬על‪ 4-‬ס"מ‪ .‬מה ההסתברות שהמטבע נופל בתוך משבצת?‬
‫‪ o‬במרכז כל משבצת ‪-4‬על‪ 4-‬יש ריבוע בגודל ‪-1‬על‪ 1-‬שאם מרכז המטבע נופל בתוכו – מקבלים את המאורע המבוקש‪.‬‬
‫בהנחה שההסתברות אחידה‪ ,‬ההסתברות לכך היא‬
‫‪‬‬
‫‪.‬‬
‫שני חברים שקבעו להיפגש מאחרים לפגישה בין ‪ 0‬ל‪ 60-‬דקות באופן אחיד; כל אחד מחכה לשני רבע שעה‪ ,‬ואם חברו לא מגיע‬
‫– עוזב את המקום‪ .‬מה ההסתברות שייפגשו?‬
‫‪ o‬ניתן להסתכל גם על הבעיה הזאת כבעיית שטח – השטח בין שני הישרים האדומים בגרף הבא‪:‬‬
‫איחור הראשון‬
‫‪A‬‬
‫‪B‬‬
‫איחור השני‬
‫קל לראות ששטח זה הוא‪:‬‬
‫‪o‬‬
‫טענה‪:‬‬
‫)‬
‫) (‬
‫(‬
‫) (‬
‫‪ ,‬וזהו הסיכוי שייפגשו‪.‬‬
‫) ( לכל פונקציית הסתברות‪.‬‬
‫הוכחה‪( ) :‬‬
‫) (‬
‫טענה‪( ) :‬‬
‫) (‬
‫הוכחה‪( ) :‬‬
‫)‬
‫טענה‪( ) :‬‬
‫(‬
‫)‬
‫(‬
‫) ( ומהעברת אגפים‪,‬‬
‫) (‬
‫(‬
‫))‬
‫) ( ‪∎.‬‬
‫) ( ‪∎.‬‬
‫(‬
‫) (‬
‫) (‬
‫הוכחה‪( ) :‬‬
‫)‬
‫(‬
‫מתקיים )‬
‫טענה‪ :‬לכל שני מאורעות‬
‫הוכחה‪ :‬ראשית‪) ,‬‬
‫)‬
‫(‬
‫את שתי התוצאות מקבלים )‬
‫)‬
‫(‬
‫) (‬
‫)‬
‫) (‬
‫)‬
‫) ( ‪ .‬באופן דומה‪) ,‬‬
‫)‬
‫(‬
‫) (‬
‫(‬
‫(‬
‫(‬
‫‪∎.‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫( ‪.‬‬
‫(‬
‫)‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫) ( ‪ .‬אם מחברים‬
‫) ( ‪ ,‬כלומר‪:‬‬
‫(‬
‫) (‬
‫כפי שרצינו‪∎ .‬‬
‫ניתן גם להכליל טענה זו למספר כלשהו של מאורעות‪ ,‬באמצעות נוסחת ההכלה וההדחה‪.‬‬
‫) (‬
‫טענה‪) :‬‬
‫)‬
‫(‬
‫הוכחה‪ :‬אינדוקציה על ‪ .‬המקרה‬
‫(‬
‫))‬
‫)‬
‫)‬
‫(‬
‫)‬
‫)‬
‫)‬
‫‪ ,‬למשל‪ ,‬נובע מפירוק‬
‫(‬
‫(‬
‫)‬
‫(‬
‫(‬
‫⋃(‬
‫לאיחוד של שלושה מאורעות זרים‪:‬‬
‫( ‪ .‬המקרה הכללי‪:‬‬
‫⋃(‬
‫⋃(‬
‫)‬
‫(‬
‫)‬
‫כאשר המעבר הראשון הוא מהנחת האינדוקציה על‬
‫)‬
‫)‬
‫)‬
‫⋃((‬
‫(‬
‫(‬
‫)‬
‫)‬
‫⋃(‬
‫והמעבר השני הוא מהנחת האינדוקציה וחוק דה‪-‬מורגן‬
‫⋃‪∎ .‬‬
‫המוכלל על הגורם‬
‫הסתברות מותנית‬
‫רוצים לשאול מה ההסתברות למאורע מסוים בהינתן שמאורע אחר כבר התרחש‪ ,‬כלומר בתנאי שמשהו כבר נתון‬
‫לנו‪ .‬ההתנייה משנה את העולם ההסתברותי – את פונקציית ההסתברות‪.‬‬
‫נסמן ב‪ ( | )-‬את ההסתברות של המאורע‬
‫הגדרה‪ :‬בהינתן מאורעות‬
‫הסתברות מותנית‪ .‬נגדיר‪:‬‬
‫טענה‪ :‬הפונקציה‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫בהינתן המאורע ‪ .‬זוהי‬
‫) | ( ‪.‬‬
‫) | ( היא אכן פונקציית הסתברות‪.‬‬
‫) (‬
‫הוכחה‪ :‬ברור ששתי האקסיומות הראשונות מתקיימות‪ .‬האקסיומה השלישית מתקיימת גם כן‪:‬‬
‫))‬
‫) |‬
‫( )‬
‫) (‬
‫(‬
‫) |‬
‫)‬
‫)‬
‫) (‬
‫)‬
‫(‬
‫) (‬
‫((‬
‫)‬
‫(‬
‫((‬
‫) |‬
‫(‬
‫(‬
‫כנדרש‪∎ .‬‬
‫טענה (חוק הכפל או חוק השרשרת)‪( ) ( | ) :‬‬
‫)‬
‫) | ( ) (‬
‫| (‬
‫)‬
‫)‬
‫⋂( ‪.‬‬
‫( וכן‬
‫הוכחה‪ :‬החלק הראשון בהעברת אגפים בהגדרת הסתברות מותנית‪ ,‬החלק השני באינדוקציה על ‪∎ .‬‬
‫מתקיים ) | ( ) (‬
‫טענה (נוסחת ההסתברות השלמה)‪ :‬עבור זוג מאורעות‬
‫הוכחה‪) :‬‬
‫(‬
‫)‬
‫(‬
‫))‬
‫(‬
‫)‬
‫((‬
‫) | ( ) (‬
‫) ( ‪.‬‬
‫) ( ומכאן המסקנה לפי חוק הכפל‪∎ .‬‬
‫ניתן להסתכל על הנוסחא כפירוק המאורע לשני עולמות – עולם שבו קרה‪ ,‬ועולם שבו לא קרה‪ .‬ניתן גם‬
‫שאיחודם ‪ ,‬ואז מתקבלת הנוסחא הכללית יותר‪ ,‬לפיה‬
‫להכליל את הנוסחא ל‪ -‬מאורעות זרים בזוגות‬
‫(‬
‫∑ )‬
‫) | ( ) (‬
‫∑ ) ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מה ההסתברות שיצא ‪ 3‬בקוביה‪ ,‬בהינתן שיצא מספר אי‪-‬זוגי?‬
‫‪o‬‬
‫אפשר לספור מאורעות אלמנטריים – מדובר במאורע ‪ 1‬מתוך ‪ ,3‬ולכן התוצאה היא ‪ .‬אפשר לקבל אותה תוצאה גם‬
‫בעזרת ההגדרה לעיל על חיתוך מאורעות‪ ,‬כמובן‪.‬‬
‫‪‬‬
‫להצליח הוא והסיכוי של‬
‫שתי קבוצות קידוד ברפא"ל התבקשו לכתוב את תוכנת ה"חץ" בתוך שנה‪ .‬הסיכוי של‬
‫להצליח‬
‫הוא ‪ .‬הסיכוי שלפחות אחת תצליח הוא ‪ .‬בהינתן שקבוצה אחת בלבד הצליחה‪ ,‬מה ההסתברות שזו ?‬
‫‪o‬‬
‫המאורעות האפשריים הם )‬
‫הנתונים‪,‬‬
‫((‬
‫))‬
‫()‬
‫()‬
‫))‬
‫((‬
‫))‬
‫משוואות בשלושה נעלמים ומקבלים‬
‫‪o‬‬
‫()‬
‫))‬
‫(‬
‫המייצגים הצלחה‪/‬כישלון של כל אחת מהקבוצות‪ .‬לפי‬
‫()‬
‫( ( ‪ ,‬וכך אפשר לבטא גם את שאר המידע‪ .‬פותרים שלוש‬
‫))‬
‫((‬
‫))‬
‫((‬
‫))‬
‫((‬
‫(( ‪.‬‬
‫כעת נשתמש בהסתברות מותנית ונקבל את התוצאה המבוקשת‪:‬‬
‫))‬
‫))‬
‫((‬
‫()‬
‫))‬
‫((‬
‫()‬
‫()‬
‫(|)‬
‫((‬
‫‪‬‬
‫תוכנת אבטחה מתריעה כשיש חדירה של וירוס בסיכוי של ‪ ,0.00‬וכשאין וירוס בסיכוי של ‪ .0.1‬הסיכוי לוירוס הוא ‪ .0.05‬מה‬
‫הסיכוי שיהיה במערכת וירוס והמערכת לא תתריע על כך?‬
‫‪ o‬נסמן ב‪ -‬את המאורע שוירוס חדר למערכת‪ ,‬וב‪ -‬את המאורע שהייתה התרעה‪ .‬אם כן‪,‬‬
‫) | ( ) (‬
‫() (‬
‫)) | (‬
‫(‬
‫)‬
‫‪‬‬
‫משחק הדלתות ‪ :‬במשחק שלוש דלתות‪ .‬בשלב הראשון שמים פרס מאחורי דלת ודחליל מאחורי האחרות‪ .‬המתחרה בוחר דלת‬
‫באקראי‪ .‬בשלב השני המנחה פותח דלת שמאחוריה דחליל שאינה זו שהמתחרה בחר‪ .‬בשלב השלישי נותנים למתחרה‬
‫אפשרות להחליף את הדלת – מה כדאי לו לעשות?‬
‫‪o‬‬
‫ברור שההסתברות להצלחה בהינתן שלא משנים את הדלת היא ‪ .‬השאלה מה ההסתברות להצלחה בהינתן‬
‫שמשנים את הדלת‪ .‬נניח שהפרס הוא מאחורי דלת מס' ‪ ,1‬ונכתוב את כל האפשרויות לפי נוסחת ההסתברות‬
‫השלמה‪:‬‬
‫) ( ) | (‬
‫‪o‬‬
‫) ( ) | (‬
‫) (‬
‫) ( ) | (‬
‫באופן דומה מתקבלת תוצאה של כאשר הפרס הוא מאחורי כל דלת אחרת‪ ,‬ולכן ההסתברות להצלחה אם מחליפים‬
‫דלת היא – וזה הדבר שכדאי לעשות‪.‬‬
‫‪‬‬
‫פרדוקס ימי ההולדת (‪ :)Birthday Paradox‬בכיתה של ‪ 40‬תלמידים‪ ,‬מה הסיכוי שלשניים או יותר יום הולדת באותו יום (תחת‬
‫ההנחה שהסיכוי להיוולד ביום מסוים שווה לכל יום אחר)?‬
‫– המאורע שיום ההולדת של התלמיד הראשון לא חופף עם קודמיו‬
‫‪ o‬נסדר את התלמידים שרירותית ונסמן‬
‫– המאורע שיום ההולדת של השני לא חופף עם קודמיו (הסתברות מאורע זה‬
‫(הסתברות מאורע זה היא ‪ ,)1‬נסמן‬
‫היא‬
‫‪o‬‬
‫)‪ ,‬וכו'‪ .‬אנו מחפשים את ההסתברות של המאורע‬
‫לפי חוק הכפל מקבלים‪:‬‬
‫)‬
‫|‬
‫)‬
‫(‬
‫נותן עדות חיובית ל‪ -‬אםם‬
‫הוכחה‪( ) :‬‬
‫) | (‬
‫טענה (חוק בייס – ‪:)Bayes‬‬
‫) (‬
‫) ( ) | (‬
‫) (‬
‫נותן עדות חיובית ל‪. -‬‬
‫(‬
‫)‬
‫הוכחה‪ :‬מיידית מההגדרה‪,‬‬
‫)‬
‫) (‬
‫) (‬
‫(‬
‫) (‬
‫) | ( ‪ ,‬והכיוון השני הוא סימטרי‪∎ .‬‬
‫) | ( ‪.‬‬
‫בניסוח אחר‪ ,‬באמצעות נוסחת ההסתברות השלמה‪:‬‬
‫) ( ) | (‬
‫) (‬
‫|‬
‫( )‬
‫|‬
‫( )‬
‫(‬
‫)‬
‫(‬
‫) | ( ‪.‬‬
‫הגדרה‪ :‬נאמר ש‪ -‬נותן עדות חיובית ל‪ -‬אם ) (‬
‫טענה‪:‬‬
‫‪.‬‬
‫) (‬
‫(‬
‫)‬
‫) (‬
‫) (‬
‫) ( ) | (‬
‫) ( ) | ( ) ( ) | (‬
‫(‬
‫)‬
‫) (‬
‫) | ( ‪∎.‬‬
‫) | ( ‪.‬‬
‫ניתן להכליל את החוק עבור כל אוסף מאורעות‬
‫ולקבל את הניסוח הבא‪:‬‬
‫)‬
‫) ( ) | (‬
‫) ( ) | (‬
‫∑‬
‫המהווים חלוקה של‬
‫( ) | (‬
‫) (‬
‫(זרים בזוגות שאיחודם )‬
‫) | ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫מבחן למחלה נדירה מחזיר תשובה חיובית (רעה) ב‪ 05%-‬מהמקרים אם יש את המחלה‪ ,‬ותשובה שלילית בסיכוי ‪ 05%‬אם אין‬
‫את המחלה‪ .‬שכיחות המחלה באוכלוסיה היא ‪ .0.1%‬מה איכות המבחן?‬
‫‪ o‬נסמן כעת – המאורע התשובה חיובית‪ – ,‬המאורע שיש מחלה‪ ,‬ונמצא את ההסתברות שיש מחלה בהינתן‬
‫שהתשובה הייתה חיובית‪:‬‬
‫) ( ) | (‬
‫) | (‬
‫) ( ) | (‬
‫) ( ) | (‬
‫‪ o‬וזו תוצאה גרועה ממש – המבחן מדייק בזיהוי המחלה בפחות מ‪ 2%-‬מהמקרים!‬
‫פרדוקס סימפסון‪ :‬במחקר להשוואת שני טיפולים בכליות נמצא שטיפול א' מצליח בסיכוי של ‪ 87%‬וטיפול ב' מצליח בסיכוי של‬
‫‪.73%‬‬
‫‪ o‬מידע נוסף – בטיפול א' הייתה הצלחה של ‪ 03%‬בטיפול באבנים קטנות והצלחה של ‪ 83%‬בטיפול באבנים גדולות‪,‬‬
‫ואילו בטיפול ב' הייתה הצלחה של ‪ 78%‬בטיפול באבנים קטנות והצלחה של ‪ 60%‬בטיפול באבנים גדולות‪.‬‬
‫‪ o‬התוצאות נראות כאילו טיפול א' דווקא עדיף! – אבל העניין הוא שבטיפול א' היו הרבה יותר אנשים עם אבנים גדולות‪,‬‬
‫מה שגרם לטיפול ב' להיראות מוצלח יותר באופן אבסולוטי‪ .‬נסתכל על טיפול א' (הצלחה = ‪ ,H‬אבנים קטנות = ‪,S‬‬
‫אבנים גדולות = ‪:)B‬‬
‫) (‬
‫) ( ) | (‬
‫) ( ) | (‬
‫(‬
‫)‬
‫‪ o‬כלומר‪ ,‬בטיפול א' היו ל‪ 85%-‬אבנים גדולות‪ ,‬ובאופן דומה בטיפול ב' היו ‪ 22%‬בלבד עם אבנים גדולות‪ .‬זו הסיבה‬
‫להטיית התוצאות האבסולוטיות‪.‬‬
‫) | ( אז נאמר שהמאורע‬
‫הגדרה‪ :‬אם מתקיים ) (‬
‫)‬
‫) ( ) (‬
‫‪.‬‬
‫( ‪ .‬לפעמים גם נסמן‬
‫בלתי‪-‬תלוי במאורע ‪ .‬בניסוח אחר‪ ,‬נאמר‬
‫אינטואיטיבית‪ ,‬התרחשות המאורע לא משפיע על ההסתברות המאורע ‪ .‬אי‪-‬תלות היא סימטרית – אם‬
‫בלתי‪-‬תלוי ב‪ , -‬אזי גם בלתי‪-‬תלוי ב‪( -‬ישירות מהגדרת הסתברות מותנית)‪ ,‬ולכן פשוט נאמר שהמאורעות‬
‫בלתי‪-‬תלויים‪.‬‬
‫טענה‪:‬‬
‫הוכחה‪) :‬‬
‫) ( ) (‬
‫(‬
‫)) (‬
‫) ( ) (‬
‫)‬
‫() (‬
‫הגדרה‪ :‬נאמר שהמאורעות‬
‫(‬
‫) ( ) (‬
‫)‬
‫(‬
‫) (‬
‫הם בלתי‪-‬תלויים בהינתן‬
‫) (‬
‫)‬
‫וכעת מעבירים אגפים ומקבלים‬
‫( כנדרש‪∎ .‬‬
‫אם ) | ( ) | (‬
‫) |‬
‫( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫מאורעות זרים אינם בלתי‪-‬תלויים (כמעט תמיד)‪ :‬אם אחד מהם קרה‪ ,‬אז השני בוודאי לא קרה‪ ,‬ולכן הם משפיעים זה על זה‪.‬‬
‫) (‬
‫) ( ‪.‬‬
‫האפשרות היחידה שבה הם בלתי‪-‬תלויים היא המקרה המנוון‬
‫בכד ‪ 10‬כדורים ממוספרים‪ ,‬ומוציאים מתוכו ‪ 3‬כדורים ללא החזרה‪ .‬המאורע שהכדור הראשון הוא ‪ ,1‬ו‪ -‬המאורע שהכדור‬
‫אינם בלתי‪-‬תלויים כיוון שההוצאה היא ללא החזרה‪.‬‬
‫השני הוא ‪ .3‬המאורעות‬
‫מסובבים סביבון הוגן פעמיים‪ .‬ההסתברות לכל אפשרות היא‬
‫שבסיבוב השני יצא ‪ .‬האם‬
‫‪o‬‬
‫מהנתון‪,‬‬
‫)‬
‫) ( ) (‬
‫‪‬‬
‫מסובבים סביבון הוגן פעמיים‪.‬‬
‫בלתי‪-‬תלויים?‬
‫ו‪-‬‬
‫בלתי‪-‬תלויים לכל‬
‫( ‪ .‬מספירה‪,‬‬
‫)‬
‫– המאורע שבסיבוב הראשון יצא ‪ ,‬ו‪-‬‬
‫‪ .‬נגדיר‬
‫– המאורע‬
‫?‬
‫))‬
‫(‬
‫)‬
‫((‬
‫) ( וכך גם לגבי‬
‫‪ .‬לכן מתקיים‬
‫( ואכן המאורעות הם ב"ת‪.‬‬
‫– המקסימום בשני הסיבובים הוא ‪,2‬‬
‫– המינימום בשני הסיבובים הוא ‪ .2‬האם המאורעות‬
‫‪o‬‬
‫)‬
‫כאן‬
‫) ( ‪ .‬אפילו לא צריך לחשב את ) ( כעת‪ ,‬כי זה לא יכול לצאת על פני ‪16‬‬
‫( ‪ ,‬ואילו‬
‫) ( ) ( ‪.‬‬
‫מאורעות אלמנטריים שווי הסתברות‪ .‬מספירה‪,‬‬
‫‪‬‬
‫מטילים פעמיים מטבע הוגן‪ ,‬שתי ההטלות בלתי‪-‬תלויות‪ .‬נסמן‬
‫?‬
‫– אך האם |‬
‫יצא משהו שונה‪ .‬מהנתון‪,‬‬
‫‪o‬‬
‫נסתכל על ההסתברויות‪) :‬‬
‫) |‬
‫(‬
‫– יצא ראש בהטלה הראשונה‪ ,‬כנ"ל‬
‫( ‪ ,‬כלומר‬
‫ובאופן דומה גם‬
‫‪ ,‬ו‪ – -‬בשתי ההטלות‬
‫‪ .‬אלא ש‪-‬‬
‫( כי לא ייתכן שהיו שתי הטלות שיצא בכל אחת משהו אחר ובשתיהן יצא ראש‪ ,‬ולכן אין כאן אי‪-‬‬
‫‪‬‬
‫) |‬
‫תלות מותנית‪.‬‬
‫נתונים שני מטבעות‪ ,‬אחד עם הסתברות ‪ 0.00‬לראש והשני עם הסתברות ‪ 0.01‬לראש‪ .‬בוחרים בהסתברות שווה מטבע (א' או‬
‫כמו בסעיף הקודם‪.‬‬
‫ב') ואז מטילים שתי הטלות בלתי‪-‬תלויות‪ .‬יהי המאורע שנבחר מטבע א'‪ ,‬והמאורעות‬
‫‪.‬‬
‫‪ o‬מהנתון‪| ,‬‬
‫) ( ) | (‬
‫) ( ‪ .‬מצד שני‪ ,‬מקבלים‬
‫) ( וכך גם‬
‫) ( ) | (‬
‫? ובכן‪,‬‬
‫‪ o‬האם‬
‫( )‬
‫מתקיים )‬
‫(‬
‫) ( ) |‬
‫(‬
‫) ( ) |‬
‫( ולכן המאורעות האלה אינם בלתי‪-‬תלויים‪.‬‬
‫)‬
‫הגדרה‪ :‬נאמר שהמאורעות‬
‫(‬
‫)‬
‫מתקיים ) (‬
‫בלתי‪-‬תלויים אם לכל‬
‫( ‪ ,‬כלומר כאן לא‬
‫∏‬
‫)‬
‫⋂( ‪.‬‬
‫הסיבה שאנו דורשים את זה לכל תת‪-‬קבוצה ולא משהו חלש יותר היא שאנו לא רוצים "לפספס" תלות‪ .‬למשל‪ ,‬אם‬
‫היינו דורשים רק אי‪-‬תלות בזוגות‪ ,‬ייתכן שצירוף של שלושה מאורעות היה יוצר תלות‪ .‬לחלופין‪ ,‬אם היינו דורשים‬
‫רק אי‪-‬תלות של כל הקבוצה‪ ,‬ייתכן שזוג מאורעות היה יוצר תלות שהייתה נעלמת עם מאורעות אחרים בקבוצה‪.‬‬
‫הגדרה‪ :‬ניסוי ברנולי (‪ )Bernoulli‬הוא ניסוי עם שתי תוצאות אפשריות‪ .‬נקרא לאחת מהן "הצלחה" ונסמן את‬
‫ההסתברות להצלחה ב‪. -‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪ .‬בכל זמן נתון לקוח מתחבר בהסתברות‬
‫ספק אינטרנט מתקין מודמים המיועדים לשרת אנשים‪ ,‬כאשר‬
‫מהאחרים‪ .‬מה ההסתברות שיותר מ‪ -‬לקוחות יתחברו (נסמן מאורע זה ב‪?) -‬‬
‫‪ o‬נחשב ישירות כאשר אנו משתמשים בהגדרת אי‪-‬תלות על קבוצת המאורעות של כל הלקוחות‪:‬‬
‫)‬
‫‪‬‬
‫(‬
‫) ( ∑‬
‫‪ o‬למשל‪ ,‬עבור‬
‫נניח שהשמש זורחת בכל יום בהסתברות‬
‫}‬
‫) (‬
‫באופן ב"ת‬
‫) (‬
‫∑‬
‫) ( ‪.‬‬
‫מקבלים‬
‫לא ידועה‪ .‬ההנחה היא שכל יום הוא ניסוי ברנולי‪ ,‬כאשר‬
‫נבחר אקראית מהאוסף‬
‫{‪ .‬רוצים להשתמש בניסיון של ‪ 5,000‬שנים כדי לקבוע את ‪.‬‬
‫‪o‬‬
‫נסמן ב‪-‬‬
‫את המאורע שהשמש זרחה‬
‫למצוא את )‬
‫‪o‬‬
‫פעמים‪ ,‬וב‪ -‬את המאורע שהשמש תזרח מחר (בפעם ה‪-‬‬
‫| ( ‪ ,‬ולמעשה מספיק למצוא את‬
‫נשתמש בנוסחת ההסתברות השלמה על כל ערכי‬
‫∑‬
‫∑‬
‫) (‬
‫כי‬
‫(‬
‫)‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‪ .‬רוצים‬
‫| ( ‪.‬‬
‫האפשריים‪:‬‬
‫)‬
‫|‬
‫( )‬
‫( ∑‬
‫)‬
‫(‬
‫∫‬
‫‪o‬‬
‫‪‬‬
‫כעת כאשר‬
‫מקבלים‬
‫)‬
‫( ו‪-‬‬
‫)‬
‫| ( ‪ .‬לסיכום‪ ,‬ככל שהשמש זורחת יותר ימים ברציפות‪,‬‬
‫אנו נעשים יותר ויותר משוכנעים שהיא תזרח מחר‪.‬‬
‫מטבעות‪ .‬אבי מטיל מטבעות ובתיה מטילה‬
‫לאבי ולבתיה‬
‫תלויות‪ .‬מהי ההסתברות שלבתיה יהיה יותר "עץ" מאשר לאבי?‬
‫‪ o‬נסמן – לבתיה יש יותר "עץ" מלאבי‪ .‬נסתכל על ההטלות הראשונות שלהם (ולבתיה נותרה עוד הטלה אחת)‬
‫– לשניהם אותו מספר הטלות "עץ"‪ .‬נחשב את ההסתברויות‬
‫– לאבי יותר "עץ"‪,‬‬
‫– לבתיה יותר "עץ"‪,‬‬
‫ונסמן‪:‬‬
‫של המאורעות‪:‬‬
‫) (‬
‫) (‬
‫) (‬
‫) (‬
‫) (‬
‫) (‬
‫מטבעות‪ .‬המטבעות הוגנים‪ ,‬וההטלות הן בלתי‪-‬‬
‫))‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫( )‬
‫)‬
‫| (‬
‫| (‬
‫( )‬
‫)‬
‫| (‬
‫( )‬
‫) (‬
‫משתנים מקריים בדידים‬
‫‪ .‬תומך זהו אוסף הערכים שהמ"מ יכול לקבל (תמונת הפונקציה)‪.‬‬
‫הגדרה‪ :‬משתנה מקרי הוא פונקציה‬
‫נשתמש במשתנים מקריים כדי לסנן מתוך מרחב המדגם (שיכול להיות עצום ומפחיד) את המספרים שמעניינים‬
‫" מגדירה מאורע‬
‫אותנו שנוכל לבצע עליהם חישובים בקלות רבה יותר‪ .‬בהינתן משתנה מקרי ‪ ,‬האמירה "‬
‫) (‬
‫הם‬
‫‪ ,‬המאורעות‬
‫‪ .‬נשים לב גם שלכל‬
‫– זהו אוסף המאורעות כך ש‪-‬‬
‫מאורעות זרים‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪ .‬נגדיר משתנה מקרי הסופר את מספר הפעמים שיצא‬
‫בניסוי מטילים שני מטבעות‪,‬‬
‫‪.‬‬
‫‪.‬‬
‫מסובבים שני סביבונים‪ .‬נגדיר – מספר התוצאות הזוגיות‪ .‬התומך הוא‬
‫‪ .‬נגדיר מ"מ המקבל ‪ 1‬אם מספר ה‪ -‬זוגי‪ ,‬ו‪0-‬‬
‫מבצעים הטלות מטבע‪ ,‬ורואים רק את מספר ה‪ -‬שיצאו‪:‬‬
‫אחרת‪ .‬כעת זהו ניסוי ברנולי‪.‬‬
‫‪.‬‬
‫מסובבים שני סביבונים‪ .‬נגדיר – המינימום שיצא בשני הסיבובים‪ .‬התומך‪:‬‬
‫זורקים חץ על הישר ] [‪ .‬התוצאות האפשריות‪[ ] :‬‬
‫‪ .‬נגדיר מ"מ המקבל ‪ 1‬אם פגענו בין ‪ 0‬ל‪ ,0.5-‬ו‪ 0-‬אחרת‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫הגדרה‪ :‬פונקציית התפלגות (‪ Probability Mass Function‬או ‪ )Probability Distribution‬של מ"מ‬
‫(‬
‫∑ )‬
‫) (‬
‫) ( ‪.‬‬
‫) (‬
‫כמובן‪ ,‬תמיד מתקיים‬
‫)‬
‫(‬
‫∑‪ ,‬כיוון ש‪ -‬היא פונקציית הסתברות ו‪-‬‬
‫)‬
‫בשתי ההטלות‪:‬‬
‫זו הפונקציה‬
‫( ⋃‪.‬‬
‫משתנים מקריים טיפוסיים‬
‫הגדרה‪ :‬משתנה מקרי אחיד מסומן )‬
‫מקיימת‬
‫) (‬
‫(‬
‫עם תומך‬
‫לכל‬
‫אם פונקציית ההתפלגות שלו‬
‫‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫המספר שיוצא בקוביה הוגנת‪.‬‬
‫)‪.‬‬
‫המספר שיוצא בכדור הראשון בלוטו (‬
‫– המספר שיצא בכדור הראשון ()‬
‫לוטו עם ‪ 10‬מספרים בכל כדור‪,‬‬
‫הגדרה‪ :‬משתנה מקרי ברנולי מסומן ) (‬
‫)‬
‫(‬
‫)‬
‫( ‪.‬‬
‫בכתיב אחר (שנשתמש בו בהמשך)‪,‬‬
‫הגדרה‪ :‬משתנה מקרי בינומי המסומן )‬
‫זהה‬
‫לכל אחד‪ .‬התומך הוא‬
‫עם תומך‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‪.‬‬
‫אם פונקציית ההתפלגות שלו מקיימת‬
‫( ‪.‬‬
‫הוא מספר ההצלחות ב‪ -‬ניסויי ברנולי ב"ת בעלי הסתברות‬
‫ופונקציית ההתפלגות היא‬
‫)‬
‫(‬
‫) (‬
‫)‬
‫( ‪.‬‬
‫פורמלית‪ ,‬יש להראות שזוהי אכן פונקציית הסתברות‪ .‬כרגיל‪ ,‬החלק המאתגר הוא להראות שההסתברויות‬
‫(‬
‫)‬
‫ולכן זהו למעשה‬
‫מסתכמות ל‪ 1-‬על פני כל ערכי ‪ ,‬וזה נובע טריוויאלית מנוסחת הבינום (כי‬
‫פיתוח של )‪.‬‬
‫הגדרה‪ :‬משתנה מקרי היפר‪-‬גיאומטרי מסומן )‬
‫)‬
‫() (‬
‫)‬
‫)‬
‫(‬
‫(‬
‫ופונקציית התפלגות‬
‫הוא בעל תומך‬
‫( ‪.‬‬
‫זהו מ"מ המייצג את המצב שבו יש שתי קבוצות פריטים (בגודל ובגודל ) ואנו מבצעים ניסויים שבהם‬
‫בוחרים פריטים מהקבוצות‪ ,‬ורוצים לדעת את ההסתברות שייבחרו פריטים מהקבוצה בגודל ‪.‬‬
‫הוא מספר ניסויי ברנולי ב"ת בעלי הסתברות זהה‬
‫הגדרה‪ :‬משתנה מקרי גיאומטרי המסומן ) (‬
‫( )‬
‫)‬
‫( ‪.‬‬
‫ופונקציית ההתפלגות היא‬
‫להצלחה‪ ,‬כולל‪ .‬התומך הוא‬
‫עד‬
‫פורמלית‪ ,‬יש להראות שזוהי אכן פונקציית הסתברות‪ .‬אכן‪ ,‬מסכום סדרה הנדסית אינסופית מתכנסת מקבלים‪:‬‬
‫)‬
‫)‬
‫(‬
‫∑‪.‬‬
‫(‬
‫הגדרה‪ :‬ההסתברות לשרוד (‪ )Survival Function‬על מ"מ ) (‬
‫∑‬
‫(‬
‫)‬
‫∑‬
‫(‬
‫)‬
‫(‬
‫)‬
‫זוהי ההסתברות )‬
‫)‬
‫(‬
‫)‬
‫‪ ,‬אזי )‬
‫טענה (תכונת חוסר הזיכרון של מ"מ גיאומטרי)‪ :‬יהי ) (‬
‫( ‪ ,‬ומתקיים‪:‬‬
‫( ‪.‬‬
‫)‬
‫(‬
‫( ‪.‬‬
‫|‬
‫הוכחה‪:‬‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫))‬
‫)‬
‫)‬
‫((‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫|‬
‫(‬
‫(‬
‫כנדרש‪∎ .‬‬
‫הגדרה‪ :‬משתנה מקרי פואסוני (‪ )Poisson‬המסומן ) (‬
‫בקצב היסטורי של‬
‫‪ .‬התומך הוא‬
‫הוא מספר מאורעות ביחידת זמן המתרחשים‬
‫)‬
‫ופונקציית ההתפלגות היא‬
‫( ‪.‬‬
‫זהו משתנה מקרי המשמש לעתים קרובות לתכנון וניתוח קצב או קצב הגעה (למשל‪ ,‬מספר פצצות בקמ"ר של‬
‫לונדון במלחמת העולם השנייה‪ ,‬או מספר טלפונים למרכזייה בשעה)‪.‬‬
‫נראה שזו אכן פונקציית התפלגות‪ ,‬שוב האתגר הוא להראות הסתכמות ל‪ ,1-‬ונשתמש לשם כך בתוצאה מאינפי‪:‬‬
‫]‬
‫טענה‪ :‬יהי )‬
‫הוכחה‪ :‬נסמן‬
‫(‬
‫∑‬
‫[‬
‫(‬
‫‪ .‬הגבול )‬
‫‪ .‬נתחיל מ‪-‬‬
‫)‬
‫∑‪.‬‬
‫(‬
‫זהה להסתברות )‬
‫‪ ,‬אכן מתקיים‪:‬‬
‫⇒ )‬
‫( עבור )‬
‫)‬
‫(‬
‫(‬
‫)‬
‫נסתכל על המקרה הכללי‪:‬‬
‫)‬
‫)‬
‫( )‬
‫( )‬
‫(‬
‫(‬
‫) (‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫(‬
‫‪.‬‬
‫( ‪ .‬כעת‬
‫)‬
‫(‬
‫( )‬
‫כעת נתבונן בכל גורם בנפרד כאשר‬
‫)‬
‫בגלל כל נכפל בנפרד‪ .‬לבסוף‪,‬‬
‫)‬
‫מקבלים‪:‬‬
‫(‬
‫‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫זהו קבוע‪ ,‬ואינו מושפע מכך‪ .‬הגורם‬
‫( שואף ל‪ 1-‬ונותרנו עם )‬
‫)‬
‫(‬
‫( )‬
‫( שכמו קודם‪ ,‬שואף ל‪-‬‬
‫שואף ל‪1-‬‬
‫‪ .‬מכאן‬
‫כפי שרצינו‪∎ .‬‬
‫(‬
‫טענה זו מראה את הקשר בין התפלגות בינומית להתפלגות פואסונית – במובן מסוים‪ ,‬התפלגות פואסונית היא‬
‫מודל טוב להתפלגות בינומית שבה מספר רב מאוד של ניסויים והסתברות נמוכה להצלחה בכל ניסוי‪.‬‬
‫תוחלת של משתנה מקרי‬
‫הגדרה‪ :‬יהי‬
‫היא‪) :‬‬
‫מ"מ‪ .‬התוחלת של‬
‫(‬
‫] [ ‪.‬‬
‫∑‬
‫נתייחס רק לתוחלות קיימות‪ ,‬כלומר כאלה שעבורן הטור מתכנס בהחלט‪ .‬זה לא בהכרח המצב‪ .‬כעת נחשב‬
‫תוחלות של משתנים מקריים מסוגים שכבר ראינו‪ ,‬שלכולם התוחלת קיימת‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫במשחק מזל‪ ,‬מקבלים ‪ 5.5‬ש"ח בהסתברות ‪ 3 ,0.1‬ש"ח בהסתברות ‪ 0.5‬וכלום בהסתברות ‪ .0.4‬עלות ההשתתפות היא ‪2.5‬‬
‫ש"ח‪ .‬מהי תוחלת הרווח? – חישוב ממוצע משוקלל‪.‬‬
‫התוחלת של ערך ההטלה בקוביה היא ‪.3.5‬‬
‫) ( היא מאוד קרובה ל‪.6-‬‬
‫התוחלת של ערך ההטלה בקוביה מוטה עם‬
‫טענה‪ :‬יהי ) (‬
‫] [ ‪.‬‬
‫‪ .‬אזי‬
‫הוכחה‪:‬‬
‫)‬
‫∑‬
‫(‬
‫)‬
‫∑‬
‫(‬
‫)‬
‫∑‬
‫)‬
‫] [‬
‫( ∑‬
‫(‬
‫∑‬
‫כאשר השתמשנו בכך שכבר ראינו שפונקציית ההתפלגות של מ"מ פואסוני מסתכמת ל‪ 1-‬על כל ערכי התומך‪∎ .‬‬
‫טענה‪ :‬יהי‬
‫מ"מ ונגדיר ) (‬
‫( ) (‬
‫פונקציה כלשהי‪ .‬מתקיים‪) :‬‬
‫כאשר‬
‫∑‬
‫הוכחה‪ :‬נתייחס ל‪ -‬כמשתנה מקרי ונחשב את התוחלת שלו‪:‬‬
‫)‬
‫(‬
‫∑‬
‫∑‬
‫)‬
‫(‬
‫) (‬
‫∑‬
‫)‬
‫(‬
‫∑‬
‫) (‬
‫)‬
‫( ) ( ∑‬
‫)‬
‫( ) (‬
‫∑‬
‫) (‬
‫כנדרש‪∎ .‬‬
‫∑‬
‫] [‬
‫] [ ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫(‬
‫מוכר פלאפל מכין מנות בתחילת היום‪ .‬מספר הלקוחות הוא )‬
‫המוכר להכין כדי למקסם את תוחלת הרווח?‬
‫‪.‬‬
‫‪ o‬נסמן – הרווח‪ ,‬מספר המנות שנכין‪ ,‬וכאן‬
‫‪ o‬כעת ניתן לחשב את התוחלת של ולמצוא את מספר המנות שיש להכין‪:‬‬
‫]‬
‫‪o‬‬
‫∑‬
‫]‬
‫∑ [‬
‫‪ .‬כל מנה עולה ‪ 3‬ש"ח ונמכרת ב‪ 0-‬ש"ח‪ .‬כמה מנות על‬
‫)‬
‫∑ [‬
‫(‬
‫] [‬
‫∑‬
‫לביטוי שהתקבל אפשר למצוא מינימום כפונקציה של ‪ .‬הנה גרף הפונקציה‪:‬‬
‫‪150‬‬
‫‪100‬‬
‫‪50‬‬
‫‪80‬‬
‫‪‬‬
‫‪60‬‬
‫‪40‬‬
‫)‬
‫(כלומר‪ 5 ,‬משלוחים) יוחזרו‪:‬‬
‫‪‬‬
‫‪20‬‬
‫חנות אלקטרוניקה מקבלת בכל שבוע משלוח של ‪ 04‬מכשירים מהמפעל‪ .‬ההסתברות לקבל מוצר פגום היא ‪ ,%7‬באופן ב"ת‬
‫מהמוצרים האחרים‪ .‬מהי ההסתברות שבמשלוח יהיו לפחות ‪ 0‬מוצרים פגומים?‬
‫(‬
‫‪ o‬נגדיר מ"מ )‬
‫המייצג את מספר הפריטים הפגומים‪ ,‬ועלינו למצוא את ההסתברות הבאה‪:‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫‪ o‬את ההסתברות הזאת אנו יודעים לחשב לפי פונקציית ההתפלגות של מ"מ בינומי‪.‬‬
‫‪ o‬כעת נניח שמגיע משלוח‪ ,‬בחנות בוחרים ‪ 04‬מוצרים ללא החזרה‪ ,‬ואם נמצא מכשיר לא תקין – מחזירים את המשלוח‪.‬‬
‫נשלחו ‪ 04‬משלוחים שבכל אחד ‪ 3‬מוצרים פגומים‪ ,‬מהי ההסתברות שבדיוק חצי יוחזרו?‬
‫(‬
‫‪ o‬נגדיר כאן מ"מ )‬
‫מספר המוצרים הפגומים בבדיקה‪ .‬ההסתברות שמשלוח אחד יוחזר מתקבלת לפי‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫ונמצא את ההסתברות שחצי מהמשלוחים‬
‫‪ .‬כעת נגדיר מ"מ נוסף‬
‫)‬
‫(‬
‫( ‪.‬‬
‫מבצעים הטלות ב"ת של מטבע עם הסתברות ‪ .‬מהי ההסתברות שמספר ה"עץ" יהיה זוגי?‬
‫הסופר את מספר ה"עצים" ואנו מחפשים את ההסתברות שערכו יהיה זוגי‪ .‬כעת נכתוב נוסחת‬
‫(‬
‫‪ o‬נגדיר מ"מ )‬
‫נסיגה להסתברות הרצויה‪ .‬נסמן ההסתברות למס' זוגי של "עץ" לאחר הטלות‪ .‬מקרה הבסיס הוא ‪ 4‬הטלות‪ ,‬ושם‬
‫(‬
‫( )‬
‫)‬
‫(‬
‫)‬
‫‪ .‬ניתן להוכיח באינדוקציה ש‪-‬‬
‫‪ .‬נוסחת הנסיגה היא‪:‬‬
‫) )‬
‫‪o‬‬
‫(‬
‫(‬
‫‪.‬‬
‫דרך אחרת – נפתח ישירות‪:‬‬
‫)‬
‫]‬
‫()‬
‫() (∑‬
‫[‬
‫]‬
‫)‬
‫(‬
‫) ( )‬
‫) )‬
‫(‬
‫(∑‬
‫)‬
‫(‬
‫] ))‬
‫(‬
‫) ( ∑[‬
‫)‬
‫טענה‪ :‬יהי )‬
‫(‬
‫(‬
‫(‬
‫[‬
‫(‬
‫] [ ‪.‬‬
‫‪ ,‬אזי‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫)‬
‫כנדרש‪∎ .‬‬
‫()‬
‫(‬
‫∑‬
‫∑‬
‫] [‬
‫(‬
‫טענה‪ :‬יהי )‬
‫] [ ‪.‬‬
‫‪ ,‬אזי‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫)‬
‫)‬
‫)‬
‫(‬
‫(‬
‫(‬
‫(‬
‫)‬
‫( )‬
‫)‬
‫(‬
‫)‬
‫∑‬
‫)‬
‫)‬
‫∑‬
‫)‬
‫(‬
‫()‬
‫(‬
‫(‬
‫)‬
‫(‬
‫) ( ∑‬
‫( )‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫((‬
‫] [‬
‫∑‬
‫∑‬
‫כנדרש‪∎ .‬‬
‫טענה‪ :‬יהי‬
‫מ"מ אי‪-‬שלילי‪ ,‬אזי ] [‬
‫)‬
‫∑‪.‬‬
‫(‬
‫הוכחה‪:‬‬
‫]‬
‫)‬
‫(‬
‫( [‬
‫)‬
‫]‬
‫(‬
‫)‬
‫( [‬
‫)‬
‫)‬
‫)‬
‫] [‬
‫( ∑‬
‫(‬
‫( ∑‬
‫)‬
‫∑‬
‫כנדרש‪∎ .‬‬
‫טענה (ליניאריות התוחלת)‪ :‬יהי‬
‫משתנה מקרי‪ ,‬אזי‬
‫] [‬
‫[ ‪.‬‬
‫]‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫] [‬
‫)‬
‫( ∑‬
‫(‬
‫)‬
‫∑‬
‫)‬
‫( )‬
‫(∑‬
‫]‬
‫[‬
‫כנדרש‪∎ .‬‬
‫לא נכון באופן כללי ש‪( [ ])-‬‬
‫]) ( [ עבור פונקציה‬
‫כלשהי‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫אם מזג האוויר הוא טוב (בהסתברות ‪ ,)4.0‬אז שולה הולכת ‪ 2‬ק"מ לכיתה במהירות ‪ 5‬קמ"ש; אחרת‪ ,‬שולה משתמשת באופנוע‬
‫(באותו מסלול) במהירות ‪ 34‬קמ"ש‪ .‬מהו זמן ההגעה הממוצע של שולה?‬
‫‪o‬‬
‫נסמן אותו ב‪ , -‬ונשים לב ש‪-‬‬
‫)‬
‫(‬
‫ו‪-‬‬
‫)‬
‫( ‪ .‬התוחלת מתקבלת משני הערכים האפשריים‪,‬‬
‫] [ ‪.‬‬
‫] [ ‪.‬‬
‫‪‬‬
‫‪ o‬נסמן כעת ב‪ -‬את המהירות של שולה‪ ,‬ומתקיים‬
‫‪ o‬אמנם‪ ,‬הדרך = זמן כפול המהירות‪ ,‬אך עבור התוחלת זה לא נכון!‬
‫בחידון שתי שאלות‪ .‬הסיכוי לענות על שאלה ‪ 0‬נכון הוא ‪ 4.0‬והפרס הוא ‪ ,$044‬הסיכוי לענות על שאלה ‪ 2‬הוא ‪ 4.5‬והפרס הוא ‪.$244‬‬
‫אחרי שנכשלים בשאלה‪ ,‬אי אפשר להמשיך‪ .‬על איזו שאלה כדאי לענות קודם?‬
‫‪‬‬
‫ערכי הזכייה‪ .‬נסתכל על תוחלת הרווח בכל אסטרטגיה‪:‬‬
‫ההסתברויות ו‪-‬‬
‫‪ o‬נסתכל על המקרה הכללי כאשר‬
‫] [‬
‫(‬
‫)‬
‫(‬
‫)‬
‫] [‬
‫(‬
‫)‬
‫(‬
‫)‬
‫‪ o‬ברור שההבדל נקבע ע"י הגורם הראשון‪ .‬במקרה הספציפי של נתוני השאלה‪ ,‬עדיף לענות קודם על השאלה הקלה יותר‪.‬‬
‫דולרים כאשר הוא מספר ההטלות (הכולל)‪.‬‬
‫פרדוקס סנט‪-‬פטרסבורג‪ :‬במשחק מזל מטילים מטבע הוגן עד שיוצא ‪ .‬מקבלים‬
‫כמה אתם מוכנים לשלם עבור ההשתפות במשחק?‬
‫‪ o‬נחשב את תוחלת הרווח במשחק‪:‬‬
‫] [‬
‫‪o‬‬
‫הטור לא מתכנס – כביכול‪ ,‬ב"ממוצע" מקבלים החזר של ‪ ,‬אז כדאי להמר בכל סכום‪ .‬ה"פרדוקס" הוא ההבדל בין‬
‫התוחלת לבין מה שסביר – התוחלת מייצג את הרווח על פני הרבה משחקים‪ ,‬בעוד שאם נהמר ‪ ,$0420‬הסיכוי שנחזיר את‬
‫‪.‬‬
‫מה שהימרנו במשחק אחד הוא בסך הכל‬
‫שונות של משתנים מקריים‬
‫מסומנת ומוגדרת ] )] [‬
‫הגדרה‪ :‬השונות של מ"מ‬
‫ומוגדרת ) (‬
‫) (‬
‫√‬
‫([‬
‫) (‬
‫מסומנת‬
‫‪ .‬סטיית התקן של‬
‫‪.‬‬
‫השונות היא מדד לפיזור של המשתנה המקרי סביב התוחלת שלו‪ .‬מכאן הרצון לחסר מהמשתנה המקרי את‬
‫התוחלת שלו‪ ,‬כאשר הריבוע נועד להבטיח שלכל ערך של המ"מ שרחוק מהתוחלת‪ ,‬אנו מוסיפים לסטייה – אילו‬
‫היינו לוקחים ]] [‬
‫[ ‪ ,‬הסטיות היו מבטלות זו את זו והיינו מקבלים תמיד שונות ‪.0‬‬
‫הוא ]‬
‫הגדרה‪ :‬המומנט ה‪ -‬של מ"מ‬
‫]‬
‫טענה‪[ ] :‬‬
‫[‬
‫[ ‪.‬‬
‫) (‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫] ] [‬
‫]‬
‫] [‬
‫] [‬
‫[‬
‫] )] [‬
‫[‬
‫] [ ] [‬
‫] [‬
‫([‬
‫] [‬
‫) (‬
‫כנדרש‪∎ .‬‬
‫טענה‪ :‬יהי‬
‫)‬
‫משתנה מקרי‪ ,‬אזי ) (‬
‫(‬
‫‪.‬‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫] )] [‬
‫) (‬
‫(‬
‫[‬
‫] )]‬
‫[‬
‫)‬
‫([‬
‫)‬
‫(‬
‫כנדרש‪∎ .‬‬
‫בפרט‪ ,‬קיבלנו שהזזה בקבוע של מ"מ לא משנה את השונות שלו – וזה אכן הגיוני‪ ,‬כי הזזה בקבוע משנה את‬
‫התוחלת אבל לא יכולה לשנות את הפיזור שהיה קיים במילא סביב התוחלת‪.‬‬
‫טענה‪ :‬יהי )‬
‫(‬
‫‪ ,‬אזי )‬
‫) (‬
‫(‬
‫‪.‬‬
‫הוכחה‪ :‬הרבה אלגברה מגעילה‪∎ .‬‬
‫טענה‪ :‬יהי )‬
‫(‬
‫‪ ,‬אזי‬
‫)‬
‫(‬
‫) (‬
‫‪.‬‬
‫הוכחה‪ :‬ראשית נחשב את השונות של )‬
‫(‬
‫)‬
‫)‬
‫)‬
‫(‬
‫(‬
‫()‬
‫)‬
‫(‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‬
‫))‬
‫(‬
‫‪ ,‬ו‪)-‬‬
‫נסמן‬
‫)‬
‫המקורי לפי הטענה שראינו קודם‪ .‬לכן‪,‬‬
‫טענה‪ :‬יהי ) (‬
‫)‬
‫()‬
‫)‬
‫כעת‪ ,‬בהינתן )‬
‫(‬
‫ואז נסתכל עליו כהזזה של ‪:‬‬
‫(‬
‫] [ ו‪-‬‬
‫‪ ,‬אזי‬
‫∑‬
‫] [‬
‫]‬
‫)‬
‫()‬
‫(‬
‫)‬
‫(‬
‫) (‬
‫) (‬
‫[‬
‫( ()‬
‫) (‬
‫(‬
‫והשונות שלו זהה לשונות של המ"מ‬
‫) (‬
‫כנדרש‪∎ .‬‬
‫‪.‬‬
‫הוכחה‪ :‬נתחיל מהתוחלת‪:‬‬
‫(‬
‫))‬
‫)‬
‫(‬
‫(‬
‫] [‬
‫∑‬
‫נסתכל על שתי הנגזרות הראשונות של הטור הגיאומטרי שיעזרו לנו בהמשך (משתמשים באותו טור כמו בשוויון‬
‫הקודם)‪:‬‬
‫)‬
‫∑‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫∑‬
‫∑‬
‫)‬
‫∑(‬
‫)‬
‫(‬
‫∑‬
‫)‬
‫∑(‬
‫)‬
‫(‬
‫∑‬
‫וכעת ניגש למומנט השני שבאמצעותו נחשב את השונות‪:‬‬
‫)‬
‫(‬
‫)‬
‫∑‬
‫( )‬
‫(∑‬
‫)‬
‫] [‬
‫כנדרש‪∎ .‬‬
‫טענה‪ :‬יהי ) (‬
‫הוכחה‪ :‬בתרגיל ‪∎ .6‬‬
‫‪ .‬אזי‬
‫) (‬
‫‪.‬‬
‫(‬
‫∑‬
‫]‬
‫[‬
‫]‬
‫) (‬
‫[‬
‫(‬
‫טענה‪ :‬יהי )‬
‫)‬
‫] [‬
‫‪ .‬השכיחות היחסית היא מ"מ ‪ ,‬ומתקיים‬
‫(‬
‫ו‪-‬‬
‫) (‬
‫‪.‬‬
‫הוכחה‪ :‬מליניאריות התוחלת והתכונה שהוכחנו לגבי שונות‪∎ .‬‬
‫מהתוצאה הזאת נובע ש‪-‬‬
‫‪ ,‬כלומר ככל שעושים יותר ניסויים‪ ,‬השונות של השכיחות היחסית‬
‫) (‬
‫הולכת ומתקרבת ל‪( 0-‬כלומר‪ ,‬השכיחות היחסית מתקרבת לתוחלת שלה)‪.‬‬
‫דוגמא‪:‬‬
‫‪‬‬
‫וההסתברות לעץ במטבע ‪ 2‬היא ‪ .‬נגדיר מ"מ – סופר את מספר העצים כאשר בוחרים‬
‫ההסתברות לעץ במטבע ‪ 0‬היא‬
‫באקראי מטבע ומטילים אותו פעמיים‪ ,‬ומ"מ – סופר את מספר העצים כאשר לפני כל הטלה בוחרים מטבע באקראי (פעמיים)‪ .‬בשני‬
‫המקרים ההטלות ב"ת‪ .‬נחשב את התוחלת והשונות של המשתנים‪.‬‬
‫‪ o‬עבור ‪ ,‬מקבלים‪:‬‬
‫(‬
‫)‬
‫)‬
‫‪o‬‬
‫))‬
‫(‬
‫)‬
‫( (‬
‫)‬
‫(‬
‫))‬
‫(‬
‫)‬
‫( (‬
‫)‬
‫(‬
‫עבור ‪ ,‬ההסתברות של עץ בהטלה הראשונה היא‬
‫היא ))‬
‫‪o‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫(‬
‫] [ ו‪)) -‬‬
‫ו‪-‬‬
‫כלומר‪ ,‬התוחלת בשני המקרים זהה‪ ,‬אבל השונות של‬
‫אינטואיטיבית)‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫] [‬
‫(‬
‫[‬
‫]‬
‫) (‬
‫וכנ"ל גם בהטלה השנייה‪ .‬לכן אפשר לומר שההתפלגות‬
‫()‬
‫(‬
‫) (‬
‫(‬
‫גדולה יותר למעט המקרה ש‪-‬‬
‫‪.‬‬
‫‪( .‬וזה גם מתבקש‬
‫התפלגות משותפת והתפלגות שולית‬
‫הגדרה‪ :‬יהיו‬
‫(‬
‫מ"מ‪ .‬ההתפלגות המשותפת‪) :‬‬
‫(‬
‫)‬
‫)‬
‫(‬
‫‪.‬‬
‫כזאת היא אכן פונקציית הסתברות חוקית‪ .‬כרגיל‪ ,‬הקושי הוא להראות הסתכמות ל‪1-‬‬
‫(‬
‫צריך להראות ש‪)-‬‬
‫על כל הערכים‪ ,‬אבל כאן זה נובע מנוסחת ההסתברות השלמה‪:‬‬
‫)‬
‫שכן הקבוצה }‬
‫הגדרה‪ :‬יהיו‬
‫( ∑‬
‫)‬
‫( ∑∑‬
‫)‬
‫∑∑‬
‫(‬
‫{ מהווה חלוקה של ‪.‬‬
‫מ"מ‪ .‬ההתפלגות השולית של‬
‫מוגדרת להיות )‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מבצעים ‪ 3‬הטלות מטבע הוגן‪ ,‬נסמן ב‪ -‬את אורך הרצף הארוך ביותר‪ ,‬וב‪ -‬את מספר הראשים שהתקבלו‪.‬‬
‫‪ o‬נצייר את זה בטבלה‪:‬‬
‫) (‬
‫‪.‬‬
‫‪‬‬
‫מסובבים שני סביבונים‪ ,‬נסמן ב‪ -‬התוצאה המקסימלית וב‪ -‬התוצאה המינימלית‪.‬‬
‫‪ o‬נצייר את ההתפלגות המשותפת בטבלה‪:‬‬
‫) (‬
‫) (‬
‫‪o‬‬
‫כעת קל לחשב את התוחלת של כל משתנה באמצעות ההתפלגויות השוליות‪.‬‬
‫נסתכל על פונקציה של משתנים מקריים‪ ,‬למשל‬
‫) ( ) (∑‬
‫(‬
‫פונקציית התפלגות‪) ,‬‬
‫של משתנה מקרי יחיד‪ ,‬גם כאן מתקיים ) (‬
‫להכללה למספר סופי כלשהו של משתנים מקריים‪.‬‬
‫מ"מ‪ .‬גם למ"מ החדש ניתן לבנות‬
‫כאשר‬
‫) ( ‪ .‬כמו כן‪ ,‬בדומה למה שראינו עבור תוחלת של פונקציה‬
‫)‬
‫∑ ] [ ; כמובן‪ ,‬תופעה זו ניתן‬
‫( ∑ ∑ ) (‬
‫משתנים מקריים‪ ,‬אזי ] [‬
‫טענה (ליניאריות התוחלת)‪ :‬יהיו‬
‫] [‬
‫[ ‪.‬‬
‫]‬
‫הוכחה‪ :‬נחשב ישירות‪:‬‬
‫)‬
‫] [‬
‫] [‬
‫) (‬
‫(‬
‫∑∑‬
‫∑‬
‫) (‬
‫)‬
‫(‬
‫∑‬
‫)‬
‫)‬
‫∑∑‬
‫(‬
‫(‬
‫)‬
‫(∑ ∑‬
‫(‬
‫∑ ∑‬
‫)‬
‫∑ ∑‬
‫]‬
‫[‬
‫כנדרש‪∎ .‬‬
‫את הטענה הזאת אפשר להכליל באינדוקציה על מספר סופי כלשהו של משתנים מקריים‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫אנשים זורקים לאוויר את כובעיהם וכל אחד תופס כובע באופן אקראי‪ .‬מה תוחלת מספר האנשים שיקבלו את הכובע שלהם‬
‫בחזרה?‬
‫‪ o‬נסמן ב‪ -‬את מספר התופסים את הכובע שלהם‪ .‬נפרק את המ"מ המורכב הזה לסכום של משתנים מקריים מציינים ‪-‬‬
‫מקבל ‪ 0‬אם האיש ה‪ -‬תפס את כובעו‪ ,‬ו‪ 4-‬אחרת‪ .‬כעת‪:‬‬
‫∑‬
‫‪‬‬
‫)‬
‫נשתמש בליניאריות התוחלת כדי לחשב את התוחלת של מ"מ בינומי‪) ,‬‬
‫אחד מ‪ -‬ניסויי ברנולי‪ ,‬ומליניאריות התוחלת מקבלים‪:‬‬
‫))‬
‫‪‬‬
‫(∑‬
‫] [ ∑‬
‫(‬
‫(∑‬
‫] [ ∑‬
‫(‬
‫]‬
‫∑[‬
‫] [‬
‫‪ .‬נפרק את המ"מ המורכב למ"מ מציינים עבור כל‬
‫]‬
‫∑[‬
‫] [‬
‫חברת קורנפלקס יוצאת במבצע שבו בכל חבילה שמים תמונה של אחד מ‪ 044-‬הספורטאים הגדולים בכל הזמנים באופן אחיד‪ .‬כמה‬
‫קופסאות בממוצע נצטרך לקנות כדי להשלים את סדרת ‪ 044‬הספורטאים?‬
‫‪o‬‬
‫‪o‬‬
‫נסמן ב‪ -‬את המ"מ הזה ורוצים לחשב את תוחלתו‪ .‬נפרק אותו למ"מ‬
‫לקנות עד שקיבלנו את התמונה ה‪ , -‬כולל הקופסא האחרונה‪ .‬מתקיים‪:‬‬
‫מתפלגים גיאומטרית‪ ,‬בפרט‪) :‬‬
‫ניתן לראות בבירור ש‪-‬‬
‫– מספר הקופסאות הנוספות שהיה עלינו‬
‫∑‪.‬‬
‫(‬
‫‪ .‬לכן נוכל לחשב את התוחלת כולה‬
‫באמצעות התוחלת של כל אחד מהמ"מ הגיאומטריים‪:‬‬
‫(‬
‫)‬
‫] [ ∑‬
‫∑‬
‫] [‬
‫נניח שמטילים קוביה עם פאות‪ ,‬כשלפאה ה‪ -‬הסתברות ‪ .‬נסמן ב‪ -‬את מספר הפעמים שיצאה הפאה ה‪-‬‬
‫(‬
‫ב‪ -‬הטלות‪ .‬רוצים להסתכל על ההתפלגות המשותפת‪) :‬‬
‫‪ .‬ברור שיש תלות ביניהם‪ :‬ה‪-‬‬
‫ערכים הראשונים קובעים את הערך האחרון‪ .‬זה נקרא התפלגות מולטינומית ומתקיים‪:‬‬
‫)‬
‫)‬
‫(‬
‫(‬
‫יתר על כן‪ ,‬אפשר עכשיו לכתוב את ההתפלגות השולית של משתנה מסוים‪:‬‬
‫(‬
‫)‬
‫) (‬
‫∑‬
‫ההתפלגות הזאת היא התפלגות בינומית – על כל משתנה אפשר לחשוב כהצלחה‪/‬כישלון בבחירת ‪ .‬כלומר‪,‬‬
‫(‬
‫זהו ניסוי שבו או שיוצא או שלא‪ ,‬ולכן זו התפלגות בינומית‪) :‬‬
‫‪.‬‬
‫התפלגות מותנית של משתנים מקריים‬
‫הגדרה‪ :‬יהי‬
‫מ"מ ו‪ -‬מאורע‪ ,‬נגדיר‬
‫(‬
‫)‬
‫) |‬
‫) (‬
‫) (‬
‫(‬
‫ההתפלגות המותנית של‬
‫|‬
‫בהינתן המאורע ‪.‬‬
‫כצפוי‪ ,‬זוהי אכן פונקציית התפלגות חוקית (יש לבדוק זאת – נובע מנוסחת ההסתברות השלמה שכן }‬
‫{‬
‫זוהי חלוקה של )‪.‬‬
‫הגדרה‪ :‬יהיו‬
‫המותנית של‬
‫מ"מ‪ ,‬נגדיר‬
‫(‬
‫)‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫|‬
‫(‬
‫)‬
‫(‬
‫|‬
‫ההתפלגות‬
‫בהינתן ‪.‬‬
‫)‬
‫(‬
‫( )‬
‫( ‪ ,‬שזהו חוק הכפל (או חוק השרשרת) עבור‬
‫|‬
‫בניסוח אחר‪) :‬‬
‫משתנים מקריים‪ .‬באופן דומה אפשר לקבל גם את נוסחת ההסתברות השלמה‪:‬‬
‫)‬
‫|‬
‫( )‬
‫( ∑‬
‫)‬
‫( ∑‬
‫)‬
‫(‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫פעמים‪ ,‬עם הסתברות הצלחה‬
‫בכל ניסיון‪ .‬מה התפלגות מספר הניסיונות בהינתן שעבר בסופו‬
‫סטודנט ניגש למבחן לכל היותר‬
‫של דבר?‬
‫‪.‬‬
‫‪ o‬נסמן ב‪ -‬את מספר הניסיונות עד להצלחה‪( ) ,‬‬
‫‪ o‬בעצם אנחנו שואלים מה התפלגות מספר הניסיונות בהינתן שלא נבחן יותר מ‪ -‬פעמים‪ .‬נסמן ב‪ -‬את המאורע ש‪-‬‬
‫וכעת ניתן למצוא את ההתפלגות המותנית המבוקשת‪:‬‬
‫‪,‬‬
‫)‬
‫)‬
‫)‬
‫‪‬‬
‫()‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫∑‬
‫) |‬
‫{‬
‫) (‬
‫(‬
‫מרצה מפוזר טועה בתשובה לשאלות תלמידים בסיכוי ‪ 4.25‬ללא תלות בשאלות קודמות‪ .‬בכיתה הוא נשאל ‪ ,0 ,4‬או ‪ 2‬שאלות בסיכוי‬
‫אחיד‪ – .‬מספר השאלות שנשאלו‪ – ,‬מספר השאלות שנענו לא נכון‪ .‬רוצים למצוא את ההסתברות לְטעּות אחת לפחות‪.‬‬
‫‪ o‬נכתוב התפלגות משותפת בטבלה‪:‬‬
‫) (‬
‫‪‬‬
‫)‬
‫( ‪.‬‬
‫(‬
‫‪ o‬ואנו יכולים כבר אחרי השורה הראשונה להשיב ש‪)-‬‬
‫‪ ,‬באופן ב"ת בשידורים קודמים‪ .‬נגדיר‬
‫משדר שולח ‪ 0‬בהסתברות ו‪ 4-‬בהסתברות‬
‫‪ .‬מה ההתפלגות של ה‪-0-‬ים ביחידת זמן?‬
‫) (‬
‫‪ o‬נסמן ב‪ -‬את מספר ה‪-0-‬ים‪ ,‬מספר ה‪-4-‬ים ונחשב את ההתפלגות המשותפת‪:‬‬
‫)‬
‫(‬
‫|‬
‫( )‬
‫)‬
‫)‬
‫)‬
‫(‬
‫)‬
‫‪o‬‬
‫הגדרה‪ :‬יהיו‬
‫)‬
‫∑‬
‫(‬
‫( (‬
‫))‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫|‬
‫(‬
‫∑‬
‫) |‬
‫(‬
‫∑‬
‫] | [‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‪ .‬לבסוף קיבלנו ש‪)-‬‬
‫(‬
‫| [‬
‫]] | [‬
‫הוכחה‪ :‬נפתח ישירות‪:‬‬
‫) ( ) |‬
‫]] | [‬
‫[‬
‫] | [ ) ( ∑‬
‫( ∑ ∑‬
‫) |‬
‫)‬
‫(‬
‫(‬
‫∑‬
‫] [‬
‫∑) ( ∑‬
‫כנדרש‪∎ .‬‬
‫טענה (נוסחת התוחלת השלמה עבור משתנים מקריים)‪ :‬יהיו‬
‫הוכחה‪ :‬שוב נפתח ישירות‪:‬‬
‫‪ ,‬מה‬
‫מוגדרת להיות‪:‬‬
‫חלוקה של ‪ .‬אזי ] [‬
‫טענה (נוסחת התוחלת השלמה עבור מאורעות)‪ :‬תהי‬
‫(‬
‫(‬
‫∑‬
‫(‬
‫או‬
‫]‬
‫)‬
‫)‬
‫( ∑‬
‫(‬
‫(במקרה הזה‪) ,‬‬
‫מ"מ ו‪ -‬מאורע‪ .‬התוחלת המותנית של‬
‫(‬
‫)‬
‫בהינתן‬
‫(‬
‫)‬
‫∑‬
‫(‬
‫כאשר כאן המעבר האחרון היה לפי טור טיילור של‬
‫שדי סביר אינטואיטיבית‪.‬‬
‫)‬
‫(‬
‫)‬
‫– מספר השידורים ליחידת זמן‪ ,‬וידוע ש‪-‬‬
‫מ"מ‪ .‬אזי ] [‬
‫]] | [‬
‫[‬
‫‪.‬‬
‫[ ‪.‬‬
‫)‬
‫(‬
‫|‬
‫∑)‬
‫)‬
‫( ∑‬
‫|‬
‫( )‬
‫]] | [‬
‫( ∑ ∑‬
‫]‬
‫[‬
‫)‬
‫( ∑‬
‫| [ )‬
‫( ∑‬
‫] [‬
‫כנדרש‪∎ .‬‬
‫הסימון המעט‪-‬מבלבל ]] | [ [ בסה"כ אומר שאנו מגדירים פונקציה ] | [‬
‫) ( ‪ ,‬שהיא בעצמה מהווה‬
‫| [‬
‫משתנה מקרי‪ .‬הפונקציה עבור מסוים נותנת מספר‪] :‬‬
‫) ( ‪ ,‬שזו תוחלת מותנית של מ"מ‪ .‬כיוון‬
‫ש‪ -‬בעצמה משתנה מקרי‪ ,‬ניתן לחשב את התוחלת שלה (ע"פ ערכי )‪.‬‬
‫הגדרה‪ :‬מ"מ‬
‫ייקראו בלתי‪-‬תלויים אם לכל‬
‫מ"מ‪ .‬המ"מ‬
‫הגדרה‪ :‬יהיו‬
‫(‬
‫|‬
‫( )‬
‫|‬
‫)‬
‫( )‬
‫מתקיים )‬
‫ייקראו בלתי‪-‬תלויים בהינתן‬
‫|‬
‫)‬
‫( ‪.‬‬
‫(‬
‫אם לכל‬
‫)‬
‫( ‪.‬‬
‫מתקיים‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫כותבים תרגיל תכנות שוב ושוב שבכל פעם הוא עובד בהסתברות‬
‫שנעבוד על התרגיל עד שנצליח?‬
‫‪o‬‬
‫(באופן ב"ת בניסיונות הקודמים)‪ .‬מהו מספר הפעמים הממוצע‬
‫ראינו כבר שמדובר בתוחלת של מ"מ גיאומטרי‪( ) ,‬‬
‫]‬
‫] [‬
‫| [ )‬
‫‪ ,‬שהיא ‪ .‬נפתח את זה בדרך אחרת‪:‬‬
‫(‬
‫)] [‬
‫] [‬
‫]‬
‫| [ )‬
‫(‬
‫( )‬
‫(‬
‫] [‬
‫] [‬
‫‪o‬‬
‫‪‬‬
‫בדרך השתמשנו בתכונת חוסר הזיכרון של מ"מ גיאומטרי‪ ,‬שבגללה ] [‬
‫מ"מ שהוא ההסתברות שהשמש זורחת מחר (אחיד‪ ,‬עם תומך }‬
‫יהי‬
‫| [ ‪.‬‬
‫]‬
‫{) ו‪ -‬מ"מ הסופר את מספר הזריחות ב‪044-‬‬
‫הימים הקרובים אז‪:‬‬
‫(‬
‫‪) o‬‬
‫] | [ (תוחלת של מ"מ בינומי)‪.‬‬
‫‪ ,‬ומתקיים‬
‫‪ o‬כעת אפשר להשתמש בנוסחת התוחלת השלמה ולקבל‪:‬‬
‫∑‬
‫‪‬‬
‫בכד ‪ 3‬כדורים ממוספרים‪ .‬מוציאים ‪ 2‬כדורים ללא החזרה‪,‬‬
‫)‬
‫‪o‬‬
‫‪o‬‬
‫‪‬‬
‫]‬
‫| [ )‬
‫(‬
‫( ∑‬
‫– הכדור הראשון‪,‬‬
‫]] | [ [‬
‫] [‬
‫– הכדור השני‪ .‬ניתן להראות שמתקיים‬
‫) ‪.‬‬
‫נכתוב טבלת התפלגות משותפת כדי לראות האם המ"מ בלתי‪-‬תלויים‪:‬‬
‫‪...‬ורואים מכאן שהמ"מ אינם ב"ת‪ ,‬כי קביעת ערך של‬
‫) למין הנבדק (‬
‫מתעניינים בקשר בין נוכחות וירוס (‬
‫‪ o‬נסתכל על שתי קבוצות נבדקים‪:‬‬
‫ב'‬
‫א'‬
‫)‪.‬‬
‫משפיעה על ההסתברויות של ‪.‬‬
‫(‬
‫‪‬‬
‫‪ o‬בקבוצה א' המשתנים אינם ב"ת; בקבוצה ב' המשתנים אכן ב"ת‪.‬‬
‫מטילים מטבע עם הסתברות לעץ עד לקבלת עץ בפעם הראשונה‪ .‬לאחר מכן מטילים שוב את אותו מספר הטלות וסופרים כמה עץ‬
‫יצא‪ .‬מה ההסתברות שלא יצא עץ בכלל בסיבוב השני?‬
‫‪ .‬נסמן גם – מספר ההטלות בסיבוב השני‪ ,‬וכאן יש תלות בין‬
‫‪ o‬נסמן – מספר ההטלות בסיבוב הראשון‪( ) ,‬‬
‫‪.‬‬
‫(‬
‫| ‪ ,‬כלומר )‬
‫(‬
‫המשתנים‪) :‬‬
‫( ‪:‬‬
‫‪ o‬כעת אנו מחשבים את )‬
‫)‬
‫‪o‬‬
‫)‬
‫(‬
‫(∑‬
‫( )‬
‫)‬
‫|‬
‫( ∑‬
‫( ∑‬
‫)‬
‫(‬
‫)‬
‫אם התקבלו ‪ 4‬עצים בסיבוב השני‪ ,‬מהי ההסתברות שמספר הניסיונות היה ‪ ?2‬כאן עלינו להשתמש בכלל בייס על‬
‫מאורעות‪:‬‬
‫(‬
‫|‬
‫( )‬
‫( )‬
‫( )‬
‫)‬
‫(‬
‫|‬
‫)‬
‫(‬
‫)‬
‫‪‬‬
‫יהיו ) (‬
‫‪‬‬
‫באופן בלתי תלוי בציפורים‬
‫בלהקה יש ציפורים‪ .‬בכל יחידת זמן כל ציפור הולכת לאכול בהסתברות או לשמור בהסתברות‬
‫האחרות‪ .‬בכל יחידת זמן מופיע נץ ואם אין אף ציפור במשמר‪ ,‬אוכל ציפור אחת‪ .‬מה תוחלת אורך החיים של הלהקה?‬
‫‪ o‬נסמן – מספר יחידות הזמן עד להיכחדות הלהקה‪( .‬כיוון שלא בוקעים גוזלים חדשים‪ ,‬הזמן הזה סופי‪).‬‬
‫ציפורים ל‪ -‬ציפורים‪.‬‬
‫‪ o‬נסמן גם – מספר יחידות הזמן עד שהאוכלוסיה עוברת מ‪-‬‬
‫‪ o‬ההסתברות שציפור מסוימת תיאכל ביחידת זמן מסוימת כשיש ציפורים היא ‪ ,‬וזה חוזר על עצמו באופן ב"ת כל יום‪,‬‬
‫∑‬
‫(‬
‫ולכן )‬
‫ולכן ניתן לחשב את התוחלת ישירות‪:‬‬
‫‪ .‬כמו כן‪,‬‬
‫‪ .‬אזי ))‬
‫) (‬
‫)‬
‫(‬
‫()‬
‫) (∑‬
‫(‬
‫(‬
‫‪ .‬הוכחה‪ :‬בתרגיל ‪.5‬‬
‫∑‬
‫] [ ∑‬
‫מ"מ‪ .‬הם ייקראו בלתי‪-‬תלויים אם ) (‬
‫הגדרה‪ :‬יהיו‬
‫] [‬
‫∏‬
‫(‬
‫)‬
‫‪.‬‬
‫נשים לב שעבור מ"מ זה מספיק‪ ,‬בניגוד למאורעות – שם היינו צריכים לדרוש אי‪-‬תלות על כל תת‪-‬קבוצה של‬
‫המאורעות‪ .‬הסיבה לכך תתבהר מהמקרה הפרטי הבא‪ ,‬שאפשר להכלילו באמצעות אינדוקציה‪:‬‬
‫טענה‪ :‬אי‪-‬תלות בשלשות גוררת אי‪-‬תלות בזוגות‪.‬‬
‫( )‬
‫הוכחה‪ :‬נתון ש‪)-‬‬
‫על פני ערכי ‪:‬‬
‫המ"מ‬
‫)‬
‫( )‬
‫)‬
‫(‬
‫( )‬
‫( )‬
‫( )‬
‫( ∑‬
‫(‬
‫)‬
‫( ‪ .‬נתבונן בהסתברות השולית של‬
‫)‬
‫( ∑‬
‫)‬
‫( ∑)‬
‫( )‬
‫(‬
‫)‬
‫(‬
‫באופן דומה מקבלים את התוצאה עבור כל זוג אחר של מ"מ‪∎ .‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מ"מ גיאומטריים בלתי‪-‬תלויים עם פרמטר ‪ .‬מהי ההתפלגות )‬
‫‪ o‬נחשב אותה‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫( )‬
‫( )‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫|‬
‫(‬
‫(‬
‫( ?‬
‫)‬
‫|‬
‫(‬
‫(‬
‫)‬
‫)‬
‫‪o‬‬
‫כעת נשים לב ש‪-‬‬
‫‪o‬‬
‫וכאן הגורם בתוך הסכום הוא קבוע‪ ,‬ויש‬
‫(‬
‫)‬
‫)‬
‫‪‬‬
‫‪o‬‬
‫∑‬
‫|‬
‫|‬
‫גורמים כאלה‪ ,‬ולכן ההסתברות שחיפשנו שווה בדיוק ל‪-‬‬
‫לכל ‪.‬‬
‫] [‬
‫| ‪ ,‬וכן‬
‫] | [ (משתנה בינומי עם פרמטר )‪.‬‬
‫כעת נשתמש בנוסחת התוחלת השלמה‪:‬‬
‫] [‬
‫‪‬‬
‫)‬
‫( ∑‬
‫‪ .‬בשלה ‪,2‬‬
‫בהסתברות לאו דווקא אחידה‪ ,‬אבל יודעים את ] [‬
‫מספר טבעי‪ .‬בשלב ‪ 0‬מגרילים מתוך‬
‫נתון‬
‫‪.‬‬
‫איברים ללא החזרה בהסתברות אחידה‪ ,‬ונסמנם ‪ .‬נסמן גם – מספר האיברים ב‪ -‬שהם ב‪-‬‬
‫דוגמים מתוך‬
‫) מ"מ המקבל ‪ 0‬אם המספר ה‪ -‬שנבחר הוא ב‪-‬‬
‫‪ o‬נמצא את התוחלת של ‪ :‬בהינתן ‪ ,‬נסמן (עבור‬
‫ו‪ 4-‬אחרת‪ .‬מתקיים‬
‫‪‬‬
‫(‬
‫∑‬
‫(‬
‫]‬
‫]]‬
‫[‬
‫[‬
‫]] |‬
‫[‬
‫]] | [ [‬
‫∑[ [‬
‫] [‬
‫‪ o‬כעת בהינתן ‪ ,‬נמצא את ההתפלגות של ‪ .‬זוהי התפלגות היפר‪-‬גיאומטרית‪ :‬יש שני סוגים של איברים (‪ 0,2,3‬וכל השאר)‪,‬‬
‫(‬
‫מוציאים איברים ושואלים מה ההסתברות ש‪ -‬מתוכם הם מהסוג הראשון‪ .‬כלומר‪) ,‬‬
‫‪.‬‬
‫(‪.)xor‬‬
‫נבצע שתי הטלות של מטבע הוגן באופן ב"ת‪ – ,‬ההטלה הראשונה‪ – ,‬השנייה‪ .‬נגדיר‬
‫‪ ,‬כלומר מתקיימת אי‪-‬תלות בזוגות‪.‬‬
‫ב"ת מהנתון‪ ,‬אבל אפשר לראות גם ש‪-‬‬
‫‪ o‬ברור ש‪-‬‬
‫קובעים את ערכו של ‪.‬‬
‫‪ o‬עם זאת‪ ,‬בשלשה המ"מ אינם ב"ת‪ ,‬וזה ברור ‪-‬‬
‫עצים‪ .‬מהי תוחלת מס' ההטלות?‬
‫מטילים מטבע שהסתברותו לעץ היא ‪ ,‬עד שמתקבל רצף של‬
‫‪ .‬כעת נסתכל על‬
‫(‬
‫‪ o‬נסמן את מספר ההטלות‪ ,‬מספר ההטלות עד שהתקבל פלי (לראשונה)‪ .‬כמובן‪) ,‬‬
‫התוחלת באמצעות נוסחת התוחלת השלמה‪:‬‬
‫) (‬
‫‪o‬‬
‫| [ )‬
‫]‬
‫( ∑‬
‫‪ ,‬אז‬
‫זאת משום שאם‬
‫מה שקיבלנו לשני סכומים‪:‬‬
‫)‬
‫‪o‬‬
‫]] | [ [‬
‫על התוחלת המותנית אנו יכולים לומר את הדבר הבא‪:‬‬
‫]‬
‫{‬
‫‪o‬‬
‫] [‬
‫(‬
‫] [‬
‫] [‬
‫ניסיונות כבר קרו‪ ,‬ועכשיו שוב ממשיכים עם‬
‫] [ )‬
‫)‬
‫(‬
‫כך נוכל לחשב גם את השונות‪ ,‬שכן‬
‫מ"מ ב"ת‪ .‬אזי ] [ ] [‬
‫טענה‪ :‬יהיו‬
‫| [‬
‫] )‬
‫]‬
‫([‬
‫(‬
‫{‬
‫)‬
‫∑‬
‫]‬
‫|‬
‫כאילו שחזרנו להתחלה‪ .‬לכן אפשר לפרק את‬
‫()] [‬
‫(∑‬
‫) (‬
‫[ ‪.‬‬
‫[ ‪.‬‬
‫הוכחה‪ :‬נוכיח ישירות‪:‬‬
‫)‬
‫( )‬
‫(‬
‫∑ ∑‬
‫] [ ] [‬
‫(‬
‫)‬
‫] [ )‬
‫)‬
‫∑ ∑‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫(‬
‫∑)‬
‫∑∑‬
‫(‬
‫]‬
‫[‬
‫∑‬
‫כנדרש‪∎ .‬‬
‫כמובן‪ ,‬ניתן להכליל את הטענה לגבי הפעלת פונקציות כלשהן על המ"מ‪ ,‬כלומר על ) ( ) ( (הפעלת פונקציה‬
‫על מ"מ לא יכולה לגרום לו להיות תלוי במ"מ אחר)‪.‬‬
‫) (‬
‫מ"מ ב"ת‪ .‬אזי ) (‬
‫טענה‪ :‬יהיו‬
‫(‬
‫)‬
‫‪.‬‬
‫הוכחה‪ :‬באמצעות הטענה הקודמת‪:‬‬
‫] ))] [‬
‫)] [‬
‫(‬
‫] )] [‬
‫([‬
‫] )] [‬
‫) (‬
‫) (‬
‫] ))] [‬
‫(([‬
‫] [ (‬
‫)‬
‫)‬
‫(([‬
‫)] [‬
‫()] [‬
‫( )] [‬
‫(‬
‫] )] [‬
‫([‬
‫()] [‬
‫])] [‬
‫[ ]] [‬
‫]] [‬
‫) (‬
‫) (‬
‫[‬
‫(‬
‫([‬
‫([‬
‫כאשר בדרך השתמשנו באי‪-‬תלות כדי לפתוח את התוחלת של המכפלה‪∎ .‬‬
‫כמובן‪ ,‬גם טענה זו ניתנת להכללה (באמצעות אינדוקציה) למספר סופי כלשהו של מ"מ ב"ת‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫באמצעות הטענה הקודמת‪:‬‬
‫‪ .‬נחשב את ) (‬
‫(‬
‫יהי )‬
‫∑‬
‫בלתי‪-‬תלויים כולם‪.‬‬
‫כאשר ) (‬
‫‪ o‬נסמן‬
‫‪ o‬כעת אפשר מיידית להגיע לתוצאה – שהיינו צריכים נגזרות של טורים כדי לקבל‪ ,‬בהוכחה המקורית‪:‬‬
‫)‬
‫‪‬‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(∑‬
‫[ (∑‬
‫∑(‬
‫נניח שיש מחוזות בחירה ואחוז התמיכה במועמד מסוים במחוז ה‪ -‬הוא ‪ .‬אנו מבצעים סקר ובו שואלים נסקר אחד מכל מחוז‪.‬‬
‫∑‬
‫‪ .‬המטרה היא להקטין את השונות של‬
‫נסמן מ"מ מציין המקבל ‪ 0‬אם הנסקר תמך במועמד ו‪ 4-‬אחרת‪ .‬נסמן גם‬
‫תכנון המחוזות – האם כדאי שכל ה‪ -‬יהיו קרובים זה לזה‪ ,‬או שיהיו שונים זה מזה?‬
‫∑ ] [‬
‫∑ ] [‬
‫‪( .‬אנו מניחים שהמחוזות ב"ת‪).‬‬
‫‪ o‬נסמן‬
‫‪ o‬כעת אפשר לחשב את השונות‪:‬‬
‫∑‬
‫‪o‬‬
‫∑‬
‫‪o‬‬
‫)‬
‫∑‬
‫(‬
‫) (‬
‫∑‬
‫∑‬
‫ע"י‬
‫) (‬
‫החלק שאפשר להשפיע עליו הוא הגורם השני – ככל שהוא קטן יותר‪ ,‬זה יקטין את השונות‪ .‬ובכן‪:‬‬
‫)‬
‫‪‬‬
‫) ] [‬
‫]‬
‫) (‬
‫∑‬
‫)‬
‫) (‬
‫) (‬
‫(∑‬
‫∑‬
‫הביטוי השמאלי כאן מגיע למינימום כאשר‬
‫)‬
‫∑‬
‫(∑‬
‫לכל ‪ ,‬ואז השונות היא מקסימלית! כלומר‪ ,‬כדי לקבל שונות מינימלית‬
‫צריך מחוזות הטרוגניים‪.‬‬
‫בעקבות התחרות החדשה (רמי לוי)‪ ,‬סניפי אורנג' רוצים להתאחד‪ .‬ידוע כי בכל סניף מספר הלקוחות היומי‬
‫פרמטר באופן ב"ת בסניפים האחרים‪ .‬נתעניין במספר הלקוחות בסניף המאוחד‪ ,‬שנסמנו ‪:‬‬
‫∑ ] [ ‪.‬‬
‫∑ ] [‬
‫‪ o‬ראשית נמצא את התוחלת‪:‬‬
‫ואפשר להכליל אחר כך לערכים‬
‫‪ o‬נפתח את פונקציית ההתפלגות לסניף המאוחד – לצורך הנוחות נסתכל כרגע על‬
‫גדולים יותר באמצעות אינדוקציה‪:‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫((‬
‫מתפלג פואסון עם‬
‫)‬
‫)‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫( )‬
‫)‬
‫(‬
‫( ∑‬
‫∑‬
‫)‬
‫)‬
‫(‬
‫( ∑‬
‫)‬
‫∑‬
‫(‬
‫()‬
‫)‬
‫‪o‬‬
‫‪o‬‬
‫)‬
‫‪ ,‬מה שיהיה נכון גם עבור‬
‫(‬
‫כלומר‪ ,‬קיבלנו ש‪)-‬‬
‫ואז‪:‬‬
‫‪ ,‬מהי התפלגות ? בה"כ‬
‫כעת‪ ,‬בהינתן‬
‫)‬
‫(‬
‫( )‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫סניפים‪.‬‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫|‬
‫(‬
‫(‬
‫)‬
‫)‬
‫)‬
‫)‬
‫(‬
‫( )‬
‫()‬
‫)‬
‫(‬
‫(‬
‫()‬
‫)‬
‫∑‬
‫∑‬
‫)‬
‫‪o‬‬
‫וכעת אם נסמן‬
‫‪ ,‬אז מקבלים ש‪) -‬‬
‫∑‬
‫(‬
‫(‬
‫(‬
‫( )‬
‫∑‬
‫() (‬
‫‪( .‬במובן מסוים‪ ,‬זה אינטואיטיבי‪ :‬יש לנו‬
‫|‬
‫לקוחות ואנו‬
‫רוצים לדעת כמה מהם באו לסניף הראשון‪ .‬ההגעה של לקוח מסוים לסניף הראשון היא ניסוי ברנולי והפרמטר שקיבלנו‪, ,‬‬
‫מייצג את היחס בין "משקל" הסניף הראשון למשקל כל סניפים‪ ,‬כלומר חלקו היחסי של הסניף הראשון בעומס הלקוחות‪).‬‬
‫משתנים מקריים רציפים‬
‫)‬
‫הגדרה‪ :‬מ"מ רציף הוא פונקציה‬
‫‪ ,‬כך שקיימת פונקציה ) ( המקיימת ) ( ∫‬
‫הנקראת פונקציית צפיפות הסתברות (באנגלית‪ ,)PDF, Probability Density Function :‬והמקיימת את האקסיומות‬
‫הבאות‪:‬‬
‫) (‬
‫(‪)0‬‬
‫( ‪,‬‬
‫לכל‬
‫) (‬
‫(‪ )2‬מתקיים‬
‫בדרך כלל הקבוצה‬
‫∫‬
‫| | קטן‪ ,‬ניתן‬
‫תהיה קטע או איחוד של מספר קטעים‪ .‬נשים לב שכאשר גודל הקטע‬
‫) (‬
‫לקרב את האינטגרל (ולכן את ההסתברות) באמצעות ) (‬
‫∫‪.‬‬
‫כמו כן‪ ,‬כיוון שאינטגרל של פונקציית הצפיפות נותן את פונקציית ההסתברות‪ ,‬מתבקש להסתכל על הנגזרת של‬
‫פונקציית הסתברות מסוימת – שתיתן פונקציית צפיפות‪.‬‬
‫)‬
‫( ‪ ,‬כלומר אין יותר צורך לדון במה שקורה בקצוות הקטע –‬
‫(‬
‫לבסוף‪ ,‬מתקיים )‬
‫האינטגרל יקבל אותו ערך על קטעים פתוחים או סגורים‪.‬‬
‫הגדרה‪ :‬מ"מ רציף אחיד על קטע ]‬
‫[ מסומן )‬
‫(‬
‫והוא בעל פ' צפיפות‬
‫) ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫] [‬
‫תהי‬
‫] [‬
‫עבור כל קטע אחר‪.‬‬
‫זמן נסיעתו של משה לעבודה מתפלג אחיד בין ‪ 05‬ל‪ 24-‬דקות ביום שמש ובין ‪ 24‬ל‪ 25-‬דקות ביום חורף (ההסתברות ליום חורף‬
‫{‬
‫) ( ‪ .‬מהתכונה השנייה מתקיים‬
‫) (‬
‫∫‬
‫‪ ,‬כלומר הקבוע נכפה עלינו‪ .‬המצב יהיה דומה‬
‫היא )‪ .‬מה פ' הצפיפות של זמן הנסיעה?‬
‫{‬
‫‪o‬‬
‫ברור מהנתונים שהפונקציה נראית כך‪:‬‬
‫‪o‬‬
‫כדי למצוא את הקבועים‪ ,‬ניזכר בכך שהאינטגרל של‬
‫) ( ‪.‬‬
‫על הקטע הראשון (יום שמש) הוא ועל הקטע השני הוא ‪.‬‬
‫תוחלת של משתנה מקרי רציף‬
‫הגדרה‪ :‬אם‬
‫מ"מ רציף ו‪-‬‬
‫פונקציית הצפיפות שלו‪ ,‬התוחלת שלו היא‪:‬‬
‫באופן דומה‪ ,‬לכל פונקציה של מ"מ‬
‫הגדרה‪ :‬אם‬
‫מ"מ רציף ו‪-‬‬
‫‪,‬‬
‫) ( ) (‬
‫∫‬
‫) (‬
‫∫‬
‫] [ ‪.‬‬
‫]) ( [ ‪.‬‬
‫פונקציית הצפיפות שלו‪ ,‬השונות שלו היא‪:‬‬
‫) (‬
‫)] [‬
‫( ∫‬
‫) (‬
‫‪.‬‬
‫] [‬
‫כמו עבור מ"מ בדידים‪ ,‬גם כאן נכון ש‪[ ] -‬‬
‫) (‬
‫‪ .‬למעשה‪ ,‬רוב התכונות של תוחלת ושונות‬
‫(למשל‪ ,‬ליניאריות) מתקיימות גם במקרה הרציף ולא נוכיח אותן או נזכיר אותן בנפרד‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪ ,‬נחשב את התוחלת והשונות שלו‪:‬‬
‫(‬
‫יהי )‬
‫‪ o‬התוחלת‪:‬‬
‫] [‬
‫‪o‬‬
‫∫‬
‫השונות‪:‬‬
‫]‬
‫)‬
‫‪‬‬
‫] [‬
‫[‬
‫]‬
‫∫‬
‫(‬
‫[‬
‫) (‬
‫נשים לב שהתוחלת לא תמיד קיימת‪ .‬למשל‪ ,‬יהי‬
‫) ( ‪ .‬זוהי אכן פונקציית‬
‫‪ ,‬כלומר בעל פונקציית צפיפות‪:‬‬
‫צפיפות חוקית‪ ,‬האינטגרל על כל הישר הוא ‪ .1‬לעומת זאת‪ ,‬התוחלת לא קיימת‪ ,‬כלומר האינטגרל הלא‪-‬אמיתי‬
‫‪ ,‬לא מתכנס‪ ,‬ואפילו לא ניתן לומר אם הוא‬
‫∫‬
‫‪‬‬
‫‪ ,‬כי זה מושפע מסדר האינטגרציה‪ .‬לעומת‬
‫או‬
‫‪ ,‬ולכן אפשר לומר שהתוחלת קיימת והיא אינסוף‪.‬‬
‫זאת‪ [| |] ,‬זהו אינטגרל שעדיין לא מתכנס‪ ,‬אבל בבירור שואף ל‪-‬‬
‫]|) ( |[ ‪.‬‬
‫באופן כללי נוכל לומר ש‪ [ ( )]-‬קיימת וסופית אםם‬
‫הגדרה‪ :‬עבור קבוע‬
‫‪ ,‬ו‪ 4-‬אחרת‪.‬‬
‫עבור‬
‫‪ ,‬מ"מ אקספוננציאלי (מעריכי) מסומן ) (‬
‫והוא בעל פ' צפיפות‬
‫)‬
‫נראה שזו פ' צפיפות – האי‪-‬שליליות ברורה‪ ,‬וההסתכמות ל‪:1-‬‬
‫) (‬
‫(‬
‫]‬
‫∫‪.‬‬
‫[‬
‫המ"מ הזה‪ ,‬כפי שתיכף נראה‪ ,‬מזכיר מ"מ גיאומטרי מבחינת היחס של התוחלת שלו לפרמטר‪.‬‬
‫טענה‪ :‬יהי ) (‬
‫‪ ,‬אזי‬
‫] [ ו‪-‬‬
‫) (‬
‫‪.‬‬
‫הוכחה‪ :‬נחשב ישירות באמצעות אינטגרציה בחלקים‪:‬‬
‫]‬
‫∫‬
‫[‬
‫)‬
‫( ∫‬
‫]‬
‫]‬
‫[‬
‫[‬
‫()‬
‫)‬
‫()‬
‫)‬
‫) (‬
‫( ∫‬
‫( ∫‬
‫∫‬
‫] [‬
‫∫‬
‫]‬
‫∫‬
‫) (‬
‫כנדרש‪∎ .‬‬
‫טענה (תכונת חוסר הזיכרון)‪ :‬יהי ) (‬
‫הוכחה‪ :‬בפתרון תרגיל ‪∎ .6‬‬
‫‪ ,‬אזי )‬
‫(‬
‫)‬
‫|‬
‫( ‪.‬‬
‫) (‬
‫[‬
‫פונקציית התפלגות מצטברת‬
‫הגדרה‪ :‬יהי מ"מ עם פ' צפיפות ) ( ‪ ,‬לפונקציה‬
‫(‬
‫∫ )‬
‫) (‬
‫) ( ‪( .‬באנגלית‪)CDF, Cumulative Distribution Function :‬‬
‫הבאה נקרא פונקציית ההתפלגות המצטברת של ‪:‬‬
‫מתקיים‪ ,‬כמובן‪ ,‬הקשר בין אינטגרל לנגזרת‪:‬‬
‫(‪)1‬‬
‫(‪)2‬‬
‫(‪)3‬‬
‫(‪)4‬‬
‫(‪)5‬‬
‫) (‬
‫) (‬
‫) (‬
‫∫‬
‫) ( לא יורדת‬
‫) (‬
‫מתקיים‬
‫) (‬
‫מתקיים‬
‫) ( רציפה מימין‪ ,‬כלומר ) (‬
‫) (‬
‫) ( ‪ .‬כמו כן‪ ,‬מתקיימות עוד מספר תכונות חשובות‪:‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫לכל‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫פונקציית הצפיפות המצטברת של מ"מ אחיד )‬
‫‪‬‬
‫הציונים‪ ,‬ונסמן‬
‫מותר לגשת למבחן ‪ 3‬פעמים והציון יהיה המקסימום מה‪ .3-‬יהיו‬
‫מתפלגים אחיד (בדיד) בין ‪ 0‬ל‪ 04-‬ובלתי‪-‬תלויים ביניהם‪ .‬השאלה‪ :‬מה ה‪ CDF-‬של ?‬
‫‪ o‬נכתוב במפורש‪:‬‬
‫(‬
‫היא‪:‬‬
‫) (‬
‫{‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪o‬‬
‫‪‬‬
‫מסקנה כללית‪ :‬לכל‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫‪ ,‬וכן נניח שהציונים‬
‫(‬
‫(‬
‫) (‬
‫) (‬
‫(‬
‫)‬
‫) (‬
‫מתקיים‪( ) :‬‬
‫קבוצת מ"מ ב"ת ו‪-‬‬
‫) (‬
‫‪.‬‬
‫פונקציית התפלגות מצטברת מאפשרת לערבב משתנים מקריים בדידים ורציפים‪ ,‬כי היא מאפיינת את כל המקרים‪ .‬למשל‪ ,‬יהיו שני‬
‫‪.‬‬
‫ב"ת‪ ,‬ונגדיר‬
‫ו‪( )-‬‬
‫מ"מ ) (‬
‫‪ o‬נמצא את ה‪ CDF-‬שלו‪:‬‬
‫)‬
‫{‬
‫‪o‬‬
‫)‬
‫כעת נתבונן על האפשרויות האמצעיות‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫)‬
‫( )‬
‫(‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫‪ o‬המ"מ שקיבלנו ( ) אינו רציף ואינו בדיד‪.‬‬
‫מ"מ רציפים בלתי‪-‬תלויים שווי התפלגות עם פ' צפיפות ) ( ‪.‬‬
‫יהיו‬
‫‪o‬‬
‫‪‬‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪‬‬
‫(‬
‫)‬
‫( )‬
‫) (‬
‫אם‬
‫אז )) (‬
‫) (‬
‫(‬
‫אז )) (‬
‫‪ o‬אם‬
‫‪ o‬הוכחת שתי הטענות – בפתרון תרגיל ‪.8‬‬
‫∑(‬
‫מ"מ ב"ת‪ ,‬אזי )‬
‫יהיו ) (‬
‫טענה‪ :‬יהי‬
‫מ"מ רציף אי‪-‬שלילי‪ ,‬אזי‬
‫הוכחה‪ :‬תמיד מתקיים ש‪( )-‬‬
‫)‬
‫) (‬
‫(‬
‫‪.‬‬
‫‪ .‬הוכחה – בפתרון תרגיל ‪.8‬‬
‫(‬
‫) (‬
‫‪.‬‬
‫] [ ‪.‬‬
‫∫‬
‫∫‬
‫)‬
‫( ‪ .‬לכן נסתכל על האינטגרל הכפול שלפנינו‪:‬‬
‫) (‬
‫] [‬
‫∫‬
‫) (‬
‫) (‬
‫∫‬
‫) (‬
‫∫ ∫‬
‫)‬
‫∫ ∫‬
‫(‬
‫∫‬
‫כאשר בדרך נדרשנו להחליף את סדר האינטגרציה‪∎ .‬‬
‫נקרא משתנה מקרי נורמלי )‬
‫הגדרה‪:‬‬
‫(‬
‫אם פונקציית הצפיפות שלו היא‬
‫)‬
‫(‬
‫√‬
‫) ( ‪.‬‬
‫יש להראות שזו פונקציית צפיפות חוקית‪ ,‬כלומר שהאינטגרל שלה על הישר הוא ‪ .1‬זה לא אינטגרל פשוט‪ ,‬אבל‬
‫נשתמש בעובדה זו בהמשך כדי לפשט חישובים אחרים‪ .‬כמו כן נשים לב שהפונקציה הזאת סימטרית‪ ,‬כלומר‬
‫‪.‬‬
‫) ( לכל‬
‫) (‬
‫(‬
‫טענה‪ :‬יהי )‬
‫] [ ‪.‬‬
‫‪ .‬אזי‬
‫הוכחה‪ :‬נחשב את האינטגרל‪:‬‬
‫∫‬
‫√‬
‫כאשר במעבר האחרון השתמשנו בכך שהפונקציה ) (‬
‫ובכך שבגורם הימני יש לנו אינטגרל של פ' צפיפות של )‬
‫(‬
‫טענה‪ :‬יהי )‬
‫‪ .‬אזי‬
‫√‬
‫∫‬
‫√‬
‫) (‬
‫)‬
‫(‬
‫√‬
‫∫‬
‫] [‬
‫∫‬
‫היא אי‪-‬זוגית‪ ,‬ולכן האינטגרל שלה על הישר הוא ‪,0‬‬
‫( ‪∎.‬‬
‫‪.‬‬
‫הוכחה‪ :‬אינטגרציה בחלקים‪∎ .‬‬
‫נקרא משתנה נורמלי סטנדרטי‪ ,‬וה‪ CDF-‬שלו מסומנת ) ( ‪ .‬עבור‬
‫הגדרה‪ :‬מ"מ ) (‬
‫)‬
‫( ‪.‬‬
‫ב‪ -‬את הערך המקיים‬
‫טענה‪ :‬אם )‬
‫(‬
‫אז )‬
‫(‬
‫נסמן גם‬
‫‪.‬‬
‫הוכחה‪ :‬בפתרון תרגיל ‪∎ .7‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫דרך ערוץ עם רעש )‬
‫רוצים לשדר מסר‬
‫אז ) (‬
‫‪ o‬טרם הוכחנו‪ ,‬אבל אם‬
‫‪o‬‬
‫‪ ,‬כלומר המקלט רואה‬
‫‪.‬‬
‫{‬
‫המקלט מחליט על האות שנשלח כך‪:‬‬
‫)‬
‫‪o‬‬
‫(‬
‫‪.‬‬
‫(‬
‫המספר שהתקבל הוא ערך של ה‪ CDF-‬של )‬
‫)‬
‫(‬
‫) ( ‪ .‬מה הסתברות השגיאה כאשר שולחים את האות "‪?"1‬‬
‫(‬
‫‪ ,‬כלומר )‬
‫)‬
‫( ‪.‬‬
‫(‬
‫מ"מ רציפים במשותף‬
‫הגדרה‪ :‬מ"מ‬
‫כאשר‬
‫נקראים רציפים במשותף אם לכל‬
‫)‬
‫מתקיים‪:‬‬
‫(‬
‫∬‬
‫)‬
‫)‬
‫(( ‪,‬‬
‫נקראת פונקציית הצפיפות המשותפת שלהם‪.‬‬
‫פונקציית הצפיפות המשותפת (‪ )Joint Probability Density Function‬מקיימת את התכונות הבאות‪:‬‬
‫(‪ )1‬לכל‬
‫)‬
‫מתקיים‬
‫(‪ )2‬מתקיים‬
‫)‬
‫(‬
‫(‬
‫∫‬
‫הגדרה‪ :‬פונקציית הצפיפות השולית של‬
‫∫‬
‫אם‬
‫)‬
‫רציפים במשותף היא‬
‫( מ"מ‪ .‬הפונקציה )‬
‫הגדרה‪ :‬יהיו )‬
‫(‪.)Joint Cumulative Distribution Function‬‬
‫)‬
‫(‬
‫(‬
‫(‬
‫∫‬
‫) ( ‪.‬‬
‫נקראת פונקציית הצטברות משותפת‬
‫(‬
‫)‬
‫) (‬
‫( רציפים במשותף‪ ,‬מתקיים‬
‫כאשר )‬
‫∫ ∫‬
‫(‬
‫∑ )‬
‫∑‬
‫) (‬
‫‪ .‬אפשר לדבר על ‪ JCDF‬גם על וקטורים מקריים שאינם רציפים במשותף‬
‫ואינם בדידים במשותף‪.‬‬
‫‪ .‬כאשר המ"מ בדידים‪ ,‬מתקיים‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫פונקציית הצפיפות המשותפת של‬
‫)‬
‫היא‬
‫(‬
‫)‬
‫{‬
‫(‬
‫‪ ,‬כאשר הקבוצה‬
‫היא שני המלבנים האדומים בציור‬
‫הבא‪:‬‬
‫‪4‬‬
‫‪3‬‬
‫𝑆‬
‫‪2‬‬
‫‪1‬‬
‫‪3‬‬
‫‪o‬‬
‫‪2‬‬
‫‪1‬‬
‫ניתן לחשב מכאן את ערכו של ‪:‬‬
‫()‬
‫)‬
‫(‬
‫‪o‬‬
‫כעת ניתן לחשב הסתברות של תת‪-‬קבוצה מסוימת‪:‬‬
‫‪o‬‬
‫וניתן גם למצוא את ההסתברות השולית של ‪:‬‬
‫] [‬
‫()‬
‫)‬
‫)‬
‫]‬
‫‪‬‬
‫‪‬‬
‫[‬
‫(‬
‫)‬
‫)‬
‫(‬
‫∬‬
‫(‬
‫∫‬
‫) (‬
‫] [‬
‫{‬
‫המחט של בופון – דוגמה שניתנה בכיתה‪ ,‬אבל אפשר למצוא הסבר מלא בוויקיפדיה‪.‬‬
‫( רציפים במשותף?‬
‫‪ .‬האם )‬
‫ונגדיר‬
‫יהי ) (‬
‫(‬
‫∬‬
‫נניח שקיימת פונקציית צפיפות משותפת‬
‫)‬
‫(( כי‬
‫)‬
‫הסתברות‪,‬‬
‫שפונקציה כזו בכלל קיימת‪.‬‬
‫בכל מקרה‪ ,‬קיימת פונקציית הצטברות משותפת‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‬
‫כנדרש מההגדרה‪ .‬כעת נבחר‬
‫‪o‬‬
‫‪ .‬מאידך‪ ,‬האינטגרל על‬
‫‪o‬‬
‫הגדרה‪ :‬יהיו‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪ ,‬אז התוחלת המשותפת על )‬
‫מ"מ רציפים במשותף ו‪-‬‬
‫∬‬
‫(‬
‫‪ .‬נשים לב שמשיקולי‬
‫הוא ‪ 0‬כי זהו נפח של קו נטול שטח‪ .‬זוהי סתירה לכך‬
‫)‬
‫(‬
‫( מוגדרת להיות‬
‫( [ ‪.‬‬
‫])‬
‫ניתן להראות בקלות את כל העובדות שכבר ראינו על תוחלת‪ ,‬למשל ליניאריות בכמה משתנים‪ ,‬ועוד‪.‬‬
‫אפשר גם להכליל את הדיון על וקטור של מ"מ רציפים במשותף‪) ,‬‬
‫שעבורה לכל‬
‫)‬
‫מתקיים‬
‫(‬
‫(‪ ,‬שאז קיימת פונקציה‬
‫∫‬
‫)‬
‫)‬
‫∫‬
‫(( ‪.‬‬
‫התניה על מ"מ רציפים‬
‫מ"מ רציף ו‪ -‬מאורע‪ .‬פונקציית התפלגות מצטברת מותנית של‬
‫הגדרה‪ :‬יהי‬
‫להיות ) |‬
‫) (‬
‫(‬
‫|‬
‫בהינתן המאורע‬
‫‪ ,‬ופונקציית הצפיפות המותנית מוגדרת להיות ) (‬
‫) (‬
‫ההגדרה נבנתה כך שכעת מתקיים‬
‫|‬
‫) |‬
‫∫‬
‫( ‪ ,‬לכל‬
‫|‬
‫|‬
‫‪.‬‬
‫‪.‬‬
‫חלוקה של ‪ ,‬אזי ) (‬
‫טענה (נוסחת ההסתברות השלמה)‪ :‬אם‬
‫) (‬
‫מוגדרת‬
‫) (‬
‫|‬
‫∑‬
‫) ( ‪.‬‬
‫הוכחה‪ :‬ישירות מההגדרה‪:‬‬
‫}) |‬
‫( ) ( ∑{‬
‫) (‬
‫|‬
‫)‬
‫) ( ∑‬
‫(‬
‫}) (‬
‫) (‬
‫|‬
‫) (‬
‫) ( ∑{‬
‫כנדרש‪∎ .‬‬
‫עבור‬
‫טענה‪ :‬אם‬
‫[‬
‫הוכחה‪ :‬נסמן ]‬
‫קטע כלשהו‪ ,‬אזי‬
‫{‬
‫) (‬
‫|‬
‫‪.‬‬
‫ונפתח מההגדרה‪:‬‬
‫(‬
‫)‬
‫)‬
‫) (‬
‫)‬
‫(‬
‫(‬
‫)‬
‫|‬
‫) |‬
‫(‬
‫) (‬
‫(‬
‫‪ ,‬המנה היא ‪ 0‬ולכן גם נגזרתה ‪ .0‬אם‬
‫כעת לפנינו שלושה מקרים‪ .‬אם‬
‫יש לנו משהו מעניין‪:‬‬
‫שוב ‪ .0‬בחלק‬
‫) (‬
‫)‬
‫(‬
‫שזה מה שרצינו‪∎ .‬‬
‫) (‬
‫)‬
‫) (‬
‫(‬
‫[‬
‫)]‬
‫)‬
‫(‬
‫(‬
‫)]‬
‫[‬
‫)‬
‫) (‬
‫|‬
‫|‬
‫‪ ,‬המנה היא ‪ 1‬ולכן נגזרתה‬
‫(‬
‫(‬
‫ניתן להרחיב את הטענה ל‪ -‬שמהווה איחוד סופי של קטעים‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מגיעים לתחנת הרכבת בין ‪ 8:10‬ל‪ .8:30-‬הרכבת מגיעה בדיוק בכל רבע שעה (‪ 8:15 ,8:00‬וכו')‪ .‬נסמן את זמן ההגעה מ‪8:10-‬‬
‫‪ .‬רוצים למצוא את התפלגות הזמן שנצטרך לחכות לרכבת‪ ,‬שנסמנו ‪.‬‬
‫(‬
‫ב‪ -‬דקות ונניח )‬
‫{‬
‫) (‬
‫‪ .‬מהנתון‪,‬‬
‫‪o‬‬
‫מתקיים‪:‬‬
‫‪o‬‬
‫כעת נוכל לכתוב את פונקציית הצפיפות המותנית‪:‬‬
‫[‬
‫עבור ]‬
‫ו‪ 0-‬אחרת‪.‬‬
‫) (‬
‫{‬
‫‪o‬‬
‫)‬
‫( {‬
‫) (‬
‫|‬
‫{‬
‫) (‬
‫|‬
‫עכשיו אפשר לעבור לטפל במ"מ המקורי – נסמן‬
‫) ( ‪ .‬נפתח את שני החלקים‪:‬‬
‫) ( ) ( |‬
‫) ( ) ( |‬
‫) |‬
‫) |‬
‫(‬
‫(‬
‫)‬
‫(‬
‫))‬
‫|‬
‫) |‬
‫(‬
‫(‬
‫) (‬
‫})‬
‫(‬
‫|‬
‫ולפי נוסחת ההסתברות השלמה מתקיים כאן‬
‫(‬
‫‪o‬‬
‫|‬
‫{‬
‫|‬
‫)‬
‫זה נותן לנו אפיון מלא של הפונקצייה‪ ,‬כיוון שאנו יודעים את‬
‫) (‬
‫|‬
‫(‬
‫) (‬
‫|‬
‫|‬
‫המותנית‪.‬‬
‫|] [‬
‫כעת אנו רוצים להרחיב את ההגדרה עבור מ"מ ולא מאורעות‪ ,‬למשל )‬
‫( ‪ .‬הבעיה היא‬
‫שבהגדרה יש לנו )‬
‫( במכנה‪ ,‬וזהו ‪ .0‬לכן נזדקק להגדרה קצת עדינה יותר‪ ,‬שיהיה צריך להראות שתמיד‬
‫עובדת‪:‬‬
‫הגדרה‪ :‬יהיו‬
‫)‬
‫|‬
‫)‬
‫(‬
‫|‬
‫|‬
‫מ"מ רציפים‪ ,‬ההסתברות של‬
‫)‬
‫|(‬
‫|‬
‫מוגדרת להיות‪:‬‬
‫בהינתן‬
‫( ‪.‬‬
‫נראה שההגדרה כשרה‪ ,‬כלומר שהגבול תמיד קיים‪:‬‬
‫)‬
‫(‬
‫|‬
‫)‬
‫(‬
‫)‬
‫(‬
‫∫∫‬
‫)‬
‫|‬
‫)‬
‫∫‬
‫) (‬
‫) (‬
‫∫‬
‫|‬
‫) (‬
‫∫‬
‫|‬
‫)‬
‫) (‬
‫(‬
‫|(‬
‫(‬
‫)‬
‫|‬
‫(‬
‫∫‬
‫) (‬
‫של פונקציה רציפה‬
‫‪ ,‬האינטגרל על קטע באורך‬
‫כאשר כאן היה לנו מעבר שבו השתמשנו בכך שכאשר‬
‫מתקרב כדי ) ( ל‪ -‬כפול ערך הפונקציה במרכז הקטע‪ .‬כדי להיפטר מ‪ , ( )-‬ניתן לחלק את המונה והמכנה‬
‫ב‪ , -‬ואז לפי ההגדרה‪,‬‬
‫) (‬
‫‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫במשחק קליעה למטרה נגדיר )‬
‫סביב הראשית ברדיוס ‪.‬‬
‫( מ"מ המייצגים את קואורדינטות הפגיעה של החץ‪ ,‬ונניח שהם מפולגים יוניפורמית על המעגל‬
‫‪o‬‬
‫כלומר‪,‬‬
‫‪o‬‬
‫נמצא את הצפיפות המותנית‬
‫{‬
‫)‬
‫)‬
‫(‬
‫) (‬
‫(‬
‫‪.‬‬
‫)‬
‫(‬
‫|‬
‫‪ ,‬ולשם כך רק צריך למצוא את הצפיפות השולית של ‪:‬‬
‫√‬
‫)‬
‫√‬
‫(‬
‫) (‬
‫∫‬
‫√‬
‫‪‬‬
‫שוברים מקל באוך באופן מקרי ואחיד בנקודה מסוימת‪ ,‬נסמן אורך המקל שנותר‪ .‬כעת שוברים את המקל שנותר שוב באופן מקרי‬
‫‪.‬‬
‫ואחיד‪ ,‬ונסמן אורך המקל הסופי‪ .‬רוצים למצוא את הצפיפות המשותפת‬
‫‪o‬‬
‫ראשית נשים לב ש‪)-‬‬
‫(‬
‫(‬
‫) ( ‪ .‬לכן‬
‫‪ ,‬כלומר‬
‫‪o‬‬
‫כמו כן‪) ,‬‬
‫‪o‬‬
‫כעת אפשר למצוא את ההסתברות השולית של ‪:‬‬
‫)‬
‫) ( )‬
‫( {‬
‫(‬
‫)‬
‫|‬
‫]) (‬
‫(‬
‫)‬
‫) (‬
‫(‬
‫[‬
‫)‬
‫)‬
‫∫‬
‫(‬
‫(‬
‫|‬
‫) (‬
‫∫‬
‫וכעת אפשר לחשב את התוחלת של ‪ ,‬נשתמש לשם כך שתוחלת מותנית‪:‬‬
‫] [‬
‫‪o‬‬
‫‪ ,‬וגם‬
‫| ‪ .‬כעת מהגדרת צפיפות מותנית אנו יכולים למצוא את הצפיפות המשותפת‪:‬‬
‫{‬
‫‪o‬‬
‫) (‬
‫] [ ‪.‬‬
‫] [‬
‫]] | [ [‬
‫]] | [‬
‫באופן דומה אפשר לחשב את ] [‬
‫טענה (חוק בייס הרציף)‪ :‬יהיו‬
‫] | [‬
‫מ"מ רציפים‪ ,‬אזי‬
‫)‬
‫]] |‬
‫[‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫[ [‬
‫|‬
‫[ וגם את השונות המותנית‪.‬‬
‫)‬
‫) (‬
‫בגרסה אחרת‪ ,‬אפשר לכתוב במפורש את ההתפלגות השולית של‬
‫|‬
‫]‬
‫]‬
‫∫‬
‫| [‬
‫(‬
‫‪.‬‬
‫|‬
‫) (‬
‫ולקבל‪:‬‬
‫)‬
‫) (‬
‫(‬
‫(‬
‫)‬
‫|‬
‫)‬
‫∫‬
‫|‬
‫(‬
‫|‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫לנורה יש אורך חיים אקספוננציאלי עם פרמטר ‪ ,‬כאשר )‬
‫עכשיו על ?‬
‫‪ o‬נתחיל במציאת הצפיפות המותנית‪:‬‬
‫(‬
‫‪ .‬בוחנים את המנורה ומודדים אורך חיים ; מה ניתן לומר‬
‫(‬
‫‪o‬‬
‫) ( )‬
‫) (‬
‫) (‬
‫כעת אפשר למצוא את המקסימום של הפונקציה כדי לראות מה ה‪ -‬הסביר ביותר בהינתן‬
‫]‬
‫טענה (כלל בייס המעורב)‪ :‬יהיו‬
‫[‬
‫מ"מ בדיד‪,‬‬
‫])‬
‫|‬
‫(‬
‫)‬
‫(‬
‫|‬
‫)‬
‫[‬
‫מ"מ רציף‪ ,‬אז מתקיים‪:‬‬
‫)‬
‫(‬
‫(‬
‫( )‬
‫שקיבלנו מהמדידה‪:‬‬
‫|‬
‫|‬
‫)‬
‫) (‬
‫(‬
‫‪.‬‬
‫|‬
‫הוכחה‪ :‬באופן דומה למה שעשינו עבור שני מ"מ רציפים‪:‬‬
‫(‬
‫)‬
‫)‬
‫) (‬
‫)‬
‫) (‬
‫)‬
‫(‬
‫( )‬
‫) (‬
‫(‬
‫|‬
‫|‬
‫|‬
‫)‬
‫)‬
‫(‬
‫|‬
‫( )‬
‫) (‬
‫)‬
‫)‬
‫|(‬
‫(‬
‫|‬
‫∫‬
‫∫‬
‫( )‬
‫) (‬
‫כשגם כאן השתמשנו באותו רעיון של אינטגרל על קטע מצטמצם סביב נקודה‪∎ .‬‬
‫(‬
‫|‬
‫(‬
‫|‬
‫‪.‬‬
‫( )‬
‫הערה‪ :‬אפשר לכתוב את המכנה בעזרת נוסחת הסתברות שלמה‪) :‬‬
‫להימנע מהצורך לחשב ישירות את הצפיפות השולית‪.‬‬
‫מ"מ בדיד‪,‬‬
‫טענה (כלל בייס המעורב‪ :)2 ,‬יהיו‬
‫(‬
‫) (‬
‫מ"מ רציף‪ ,‬אז מתקיים‪:‬‬
‫) (‬
‫הוכחה‪ :‬בפתרון תרגיל ‪ .7‬במכנה מופיעה‪ ,‬למעשה‪ ,‬ההסתברות השולית ) (‬
‫∑‬
‫|‬
‫)‬
‫)‬
‫(‬
‫) ( ‪ ,‬כדי‬
‫|‬
‫( |‬
‫)‬
‫∫‬
‫(‬
‫‪.‬‬
‫|‬
‫‪∎.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהי ) (‬
‫‪‬‬
‫יהי ) (‬
‫(‬
‫ו‪)-‬‬
‫)‬
‫| ‪ ,‬ומחפשים את )‬
‫(‬
‫‪:‬‬
‫|‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫( )‬
‫(‬
‫( )‬
‫(‬
‫|‬
‫(‬
‫|‬
‫)‬
‫|‬
‫)‬
‫( )‬
‫( )‬
‫)‬
‫)‬
‫‪o‬‬
‫(‬
‫( )‬
‫)‬
‫(‬
‫|‬
‫( )‬
‫)‬
‫(‬
‫)‬
‫( |‬
‫{‬
‫(‬
‫ו‪)-‬‬
‫)‬
‫הצפיפות‬
‫פונקציית‬
‫את‬
‫מחפשים‬
‫‪.‬‬
‫|‬
‫|‬
‫(‬
‫)‬
‫)‬
‫)‬
‫(‬
‫|‬
‫)‬
‫(‬
‫( |‬
‫( |‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) ( )‬
‫(‬
‫()‬
‫)‬
‫( |‬
‫(‬
‫()‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫()‬
‫)‬
‫∫‬
‫∫‬
‫|‬
‫כאשר כאן המעבר האחרון הוא שלב חישובי לא מעניין‪ ,‬והמעבר המסומן נובע מזהות (חוק בייס המעורב – מהצד‬
‫השני) שראינו בתרגיל‪.‬‬
‫(‬
‫הגדרה‪ :‬תוחלת מותנית של מ"מ רציפים‬
‫הגדרה‪ :‬מ"מ רציפים‬
‫מוגדרת ע"י‬
‫(‬
‫)‬
‫נקראים בלתי‪-‬תלויים אם ) ( ) (‬
‫|‬
‫{‬
‫‪:‬‬
‫∫‬
‫|‬
‫)‬
‫(‬
‫|‬
‫(‬
‫| [ ‪.‬‬
‫]‬
‫‪.‬‬
‫מהגדרה זו אפשר לקבל גם הסתברות משותפת‪:‬‬
‫) (‬
‫∫) (‬
‫∫‬
‫)‬
‫) ( ) (‬
‫( )‬
‫(‬
‫)‬
‫∫∫‬
‫)‬
‫) (‬
‫(‬
‫) (‬
‫∫( )‬
‫ולכן האי‪-‬תלות שקולה בהגדרה גם לגבי התפלגות מצטברת משותפת‪( ) :‬‬
‫טענה‪ :‬מ"מ‬
‫הם בלתי‪-‬תלויים אםם לכל זוג פונקציות‬
‫)‬
‫∫∫‬
‫(‬
‫∫(‬
‫)‬
‫) (‬
‫מתקיים ]) ( [ ]) ( [‬
‫(‬
‫‪.‬‬
‫]) ( ) ( [ ‪.‬‬
‫הוכחה‪ :‬בפתרון תרגיל ‪∎ .0‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫בהתקפת קניות שולה מבקרת במספר מקרי של חנויות‪ ,‬ובחנות ה‪ -‬מבזבזת סכום מקרי ‪ .‬נניח ש‪ -‬הוא שלם חיובי עם‬
‫פונקציית התפלגות ידועה ו‪ -‬כולם בעלי אותה תוחלת ושונות ‪ ,‬וכל המ"מ בשאלה ב"ת‪ .‬מהי תוחלת ושונות עלות מסע הקניות?‬
‫∑‬
‫‪ .‬כאן מתקיים‪:‬‬
‫‪ o‬נסמן ב‪ -‬את סך הכסף ששולה הוציאה‪,‬‬
‫] [ ∑‬
‫]‬
‫| [ ∑‬
‫] [‬
‫]‬
‫]‬
‫|‬
‫[‬
‫∑[‬
‫]] | [ [‬
‫]‬
‫] [‬
‫| [‬
‫| )‬
‫]‬
‫( ∑‬
‫([ )‬
‫]‬
‫[ )‬
‫( ∑‬
‫(‬
‫]‬
‫המעבר הזה נכון כיוון שהמ"מ כולם אותו דבר‪ ,‬ויש לנו רק שני סוגים שונים של גורמים – ריבועים של אותו מ"מ‪ ,‬ומכפלות‬
‫‪ .‬אפשר להמשיך מכאן‪:‬‬
‫כאן ב"ת אםם‬
‫של שני מ"מ שונים‪ .‬בשני המקרים תוחלות שונות כי‬
‫‪o‬‬
‫)‬
‫‪‬‬
‫]‬
‫)‬
‫|‬
‫[ )‬
‫( ∑‬
‫[‬
‫(‬
‫)‬
‫( ∑‬
‫()‬
‫) (‬
‫יהיו שני מ"מ ) (‬
‫‪ o‬נמצא את ההתפלגות שלו‪:‬‬
‫(‬
‫)‬
‫|‬
‫]]‬
‫( [‬
‫)‬
‫ב"ת‪ ,‬ונסמן‬
‫]‬
‫[ [)‬
‫‪.‬‬
‫(‬
‫)‬
‫)) (‬
‫|‬
‫( ∑‬
‫)‬
‫( )) (‬
‫(‬
‫)‬
‫(‬
‫)‬
‫( )‬
‫(‬
‫) (‬
‫(‬
‫אפשר גם לבדוק מי המינימום (גם כאן משתמשים באי‪-‬תלות)‪:‬‬
‫‪o‬‬
‫(‬
‫)‬
‫) (‬
‫∫‬
‫(‬
‫)‬
‫) (‬
‫)‬
‫)‬
‫∫ ∫‬
‫טענה (נוסחת השונות השלמה)‪ :‬יהיו‬
‫)‬
‫(‬
‫∫‬
‫]) | (‬
‫[‬
‫) (‬
‫( ∫‬
‫מ"מ‪ .‬אזי )] | [ (‬
‫(‬
‫∫ ∫‬
‫)‬
‫(‬
‫‪.‬‬
‫הוכחה‪ :‬בפתרון תרגיל ‪∎ .7‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהיו )‬
‫(‬
‫ו‪)-‬‬
‫(‬
‫| ‪.‬‬
‫) ] [‬
‫‪o‬‬
‫נחשב את התוחלת‪:‬‬
‫‪o‬‬
‫נחשב את השונות המותנית‪:‬‬
‫] | [‬
‫] |‬
‫[‬
‫(‬
‫) (‬
‫]‬
‫] |‬
‫[‬
‫[‬
‫]] | [ [‬
‫] [‬
‫] | )‬
‫‪o‬‬
‫∫‬
‫[‬
‫) | (‬
‫] |‬
‫[‬
‫|‬
‫]‬
‫] |‬
‫[‬
‫[‬
‫לבסוף‪ ,‬נציב בנוסחת השונות השלמה‪:‬‬
‫)‬
‫‪o‬‬
‫[‬
‫([‬
‫) | (‬
‫נחשב את התוחלת המותנית של המומנט השני‪:‬‬
‫]‬
‫‪o‬‬
‫] | )] | [‬
‫([‬
‫] |‬
‫] [‬
‫(‬
‫]‬
‫[‬
‫)] | [ (‬
‫]) | (‬
‫[‬
‫) (‬
‫מציאת הערכים האלה כרוכה בחישוב אינטגרלים קצת לא סימפטיים‪ ,‬ובכל מקרה בסוף מקבלים מספר‪.‬‬
‫טרנספורמציות על משתנים מקריים‬
‫‪ ,‬ונתונה ) ( ‪ .‬רוצים למצוא את ) (‬
‫יהיו מ"מ‪( ) ,‬‬
‫) ( (‬
‫) ( ∫ )‬
‫ההתפלגות המצטברת‪( ) :‬‬
‫וכל מה שנובע מזה‪ .‬כדי לעשות זאת‪ ,‬נעבור דרך‬
‫(‬
‫)‬
‫) ( ‪ .‬במקרים מסוימים‪ ,‬זה יהיה‬
‫מספיק פשוט כדי שנוכל לחשבו‪ ,‬לגזור את התוצאה ולהגיע ל‪. ( )-‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהיו )‬
‫‪‬‬
‫משה נוסע מרחק של ‪ 170‬ק"מ במהירות קבועה )‬
‫כמ"מ ?‬
‫‪ o‬כמו קודם‪ ,‬נעבור דרך פונקציית ההתפלגות המצטברת‪:‬‬
‫(‬
‫‪ .‬נמצא את ) ( ‪:‬‬
‫ו‪√ -‬‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫})‬
‫{‬
‫(‬
‫(‬
‫)‬
‫‪‬‬
‫יהי‬
‫‪‬‬
‫יהיו )‬
‫(‬
‫)‬
‫(‬
‫}‬
‫(‬
‫{‬
‫) (‬
‫(‬
‫})‬
‫) (‬
‫{‬
‫) ( ‪.‬‬
‫כלומר‪ ,‬עבור הערכים המעניינים של ‪ ,‬מקבלים‬
‫‪o‬‬
‫) (‬
‫‪ .‬מה פונקציית הצפיפות של משך נסיעתו של משה‪ ,‬שנסמנה‬
‫)‬
‫{‬
‫) (‬
‫)‬
‫√(‬
‫(‬
‫) (‬
‫ונתונה ) ( ‪ .‬כאן מתקיים‪ ,‬באופן כללי‪:‬‬
‫) √‬
‫)‬
‫√ (‬
‫)) √ (‬
‫ו‪√| |-‬‬
‫(‬
‫) √( (‬
‫(‬
‫)‬
‫}) √ (‬
‫√‬
‫) (‬
‫) (‬
‫{‬
‫) √(‬
‫‪ .‬הטרנספורמציה הזאת אינה מונוטונית ולכן נצטרך למצוא את מבוקשנו ידנית‪:‬‬
‫(‬
‫)‬
‫| |(‬
‫)‬
‫| |√(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫) (‬
‫במקרה של טרנספורמציה מונוטונית ממש‪ ,‬יש ל‪ -‬הופכית‪ ,‬ומכך אפשר לקבל נוסחא כללית‪:‬‬
‫טענה‪ :‬יהי‬
‫מ"מ‪( ) ,‬‬
‫כאשר‬
‫| )) (‬
‫מונוטונית ממש‪ .‬אזי |) (‬
‫) ( ‪.‬‬
‫(‬
‫הוכחה‪ :‬נניח ש‪ -‬יורדת (הכיוון השני סימטרי)‪:‬‬
‫})) (‬
‫(‬
‫)) (‬
‫{‬
‫)‬
‫(‬
‫| )) (‬
‫|) (‬
‫) ( (‬
‫) (‬
‫) (‬
‫(‬
‫)) (‬
‫) (‬
‫(‬
‫יורדת ולכן הנגזרת שלה שלילית‪∎ .‬‬
‫במעבר האחרון השתמשנו בכך ש‪ -‬יורדת ולכן גם‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫רומיאו ויוליה קובעים להיפגש‪ .‬כל אחד מאחר באופן ב"ת בזמן אקספוננציאלי עם פרמטר ‪ .‬מה הצפיפות של הפרש הזמנים בהם הם‬
‫מגיעים?‬
‫ההפרש המבוקש‪ .‬נתחיל מהמקרה שההפרש חיובי‪:‬‬
‫זמני ההגעה של האוהבים ו‪-‬‬
‫‪ o‬נסמן‬
‫∫) (‬
‫) (‬
‫)‬
‫)‬
‫∫‬
‫(‬
‫∫‬
‫(‬
‫)‬
‫∫ ∫‬
‫[‬
‫]‬
‫(‬
‫)‬
‫∫‬
‫(‬
‫∫‬
‫) (‬
‫∫‬
‫∫‬
‫}‬
‫‪o‬‬
‫{‬
‫במקרה שההפרש שלילי‪ ,‬אפשר לראות משיקולי סימטריה שמקבלים‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫) (‬
‫) (‬
‫) (‬
‫‪o‬‬
‫זאת משום של‪)-‬‬
‫( צריכה להיות אותה התפלגות – סימטריה מוחלטת בין המ"מ‪.‬‬
‫( ול‪)-‬‬
‫שונות משותפת‬
‫המטרה היא לנסח מדד לפיזור משותף של משתנים מקריים (התנהגות משותפת) המאפשר באופן מספרי להבין‬
‫האם יש התאמה מסוימת בין אופן השינוי של המשתנים‪.‬‬
‫היא‪[ ])] :‬‬
‫הגדרה‪ :‬השונות המשותפת (‪ )Covariance‬של מ"מ‬
‫הגדרה‪:‬‬
‫])] [‬
‫נשים לב שמתקיים‪( ) :‬‬
‫טענה‪ :‬יהיו‬
‫)‬
‫נקראים בלתי‪-‬מתואמים אם‬
‫(‬
‫()] [‬
‫)‬
‫‪.‬‬
‫()] [‬
‫)‬
‫מ"מ ב"ת‪ .‬אזי‬
‫(‬
‫([‬
‫(‬
‫‪.‬‬
‫([‬
‫(‬
‫)‬
‫‪.‬‬
‫‪.‬‬
‫הוכחה‪ :‬נחשב ישירות ונשתמש באי‪-‬תלות כדי לפרק את תוחלת המכפלה‪:‬‬
‫] [ ] [‬
‫[‬
‫]‬
‫]] [ ] [‬
‫] [‬
‫] [‬
‫)‬
‫[‬
‫(‬
‫כנדרש‪∎ .‬‬
‫ההיפך לא נכון‪ :‬ייתכנו מ"מ בלתי‪-‬מתואמים שאינם בלתי‪-‬תלויים‪.‬‬
‫מ"מ‪ .‬אזי )‬
‫טענה‪ :‬יהיו‬
‫)‬
‫(‬
‫(‬
‫(‬
‫)‬
‫‪.‬‬
‫הוכחה‪ :‬ישירות מההגדרה‪:‬‬
‫)‬
‫(‬
‫)‬
‫])] [‬
‫])] [‬
‫(‬
‫[‬
‫()]‬
‫])] [‬
‫( )] [‬
‫()] [‬
‫])] [‬
‫([‬
‫()] [‬
‫)‬
‫()] [‬
‫()] [‬
‫(([‬
‫([‬
‫([‬
‫)‬
‫כנדרש‪∎ .‬‬
‫טענה‪ :‬יהיו‬
‫(‬
‫מ"מ‪ .‬אזי )‬
‫) (‬
‫) (‬
‫(‬
‫)‬
‫‪.‬‬
‫הוכחה‪ :‬ישירות מההגדרה‪:‬‬
‫] ))] [‬
‫])] [‬
‫(‬
‫()] [‬
‫)] [‬
‫([‬
‫(([‬
‫] )]‬
‫] )] [‬
‫(‬
‫)‬
‫[‬
‫)‬
‫)‬
‫(([‬
‫] )] [‬
‫([‬
‫) (‬
‫) (‬
‫([‬
‫כנדרש‪∎ .‬‬
‫הגדרה‪ :‬יהיו‬
‫מ"מ‪ .‬מקדם המתאם שלהם מוגדר להיות‬
‫מקדם המתאם מקיים כמה תכונות טובות‪:‬‬
‫)‬
‫) (‬
‫(‬
‫) (‬
‫√‬
‫)‬
‫( ‪.‬‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‪)1‬‬
‫( |‬
‫|)‬
‫(‪)2‬‬
‫(‪ )3‬הוא חסר יחידות (היחידות של המונה והמכנה מבטלות אלה את אלה)‬
‫‪ ,‬כלומר הוא תמיד נותן חיווי כמותי על "מידת ההתאמה"‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫בכד ‪ 3‬כדורים ממוספרים‪ ,‬ומוציאים ‪ 2‬כדורים‪.‬‬
‫המשותפת‪:‬‬
‫‪‬‬
‫ברשותנו כדורים ממוספרים שבוחרים כמה מתוכם‪ ,‬ו‪-‬‬
‫למספר הכדורים שמוציאים‪.‬‬
‫– מספר הכדור השני‪ .‬נמצא את השונות‬
‫– מספר הכדור הראשון‪,‬‬
‫]‬
‫] [ ] [‬
‫) (‬
‫‪o‬‬
‫נתחיל בחישוב התוחלת‪:‬‬
‫‪o‬‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫כעת נשתמש בכך ש‪-‬‬
‫‪o‬‬
‫מ"מ אחיד‪ ,‬ולכן‬
‫)‬
‫)‬
‫∑(‬
‫)‬
‫(‬
‫] [ ‪.‬‬
‫∑‬
‫∑‬
‫) (‬
‫∑(‬
‫)‬
‫‪ ,‬כי הסכום הזה הוא קבוע (הוצאנו את כל הכדורים!)‪ ,‬ולכן ניתן לבודד את‬
‫)‬
‫השונות המשותפת ולקבל‬
‫]‬
‫(‬
‫הכדור ה‪ -‬שהוצאנו‪ .‬ניתן להוכיח שכל המ"מ שווי התפלגות ללא קשר‬
‫נשתמש בהכללת הקשר שהוכחנו קודם ונקבל‪:‬‬
‫(‬
‫[‬
‫[‬
‫(‬
‫‪.‬‬
‫התוצאה הזאת לא משמחת כל כך‪ ,‬כי ככל שיש יותר כדורים‪ ,‬נראה שהשונות המשותפת גדלה – וזה לא אינטואיטיבי‪,‬‬
‫כיוון שככל שיש יותר כדורים‪ ,‬השפעת הוצאת כדור אחד "אמורה" להשפיע פחות על הוצאת כדור שני‪ .‬אם נסתכל על‬
‫‪o‬‬
‫)‬
‫מקדם המתאם‪,‬‬
‫( – הוא דווקא קטֵ ן ככל שיש יותר כדורים‪ ,‬מה שיותר נוח אינטואיטיבית‪.‬‬
‫‪‬‬
‫מבצעים‬
‫) (‬
‫‪‬‬
‫אנשים זורקים באוויר את כובעיהם ותופסים כובע באקראי‪ .‬נגדיר – מספר האנשים שתפסו את כובעם‪ ,‬ראינו כבר‬
‫שהתוחלת של מ"מ זה היא ‪ .1‬כעת נטפל גם בשונות – נגדיר – מ"מ ברנולי המקבל ‪ 1‬כאשר האדם ה‪ -‬קיבל את כובעו‪,‬‬
‫ונפתח לפי מה שראינו (ונזכור שכל המ"מ סימטריים)‪:‬‬
‫הטלות מטבע עם סיכוי לראש‪ ,‬כאשר‬
‫(‬
‫)‬
‫( [‬
‫] )] [‬
‫)] [ ] [‬
‫]‬
‫()‬
‫)‬
‫‪‬‬
‫[ ()‬
‫(‬
‫– מספר הראשים‪ – ,‬מספר הזנבות‪ .‬כמה הם מתואמים?‬
‫[‬
‫]‬
‫(‬
‫( )] [‬
‫)] [‬
‫) (‬
‫)‬
‫) (‬
‫) (‬
‫√‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫∑‬
‫)‬
‫()‬
‫(‬
‫‪o‬‬
‫(‬
‫)] [‬
‫(([‬
‫[‬
‫] )]‬
‫)‬
‫(([‬
‫) (‬
‫כעת נגזור את הפונקציה שקיבלנו כדי למצוא מינימום‪:‬‬
‫) (‬
‫)‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫(‬
‫̂ ‪ .‬המטרה היא‬
‫‪" .‬מנחשים" ש‪ -‬הוא בערך פונקציה ליניארית של ‪ .‬נבנה מודל עם‬
‫נתונים שני מ"מי‪,‬‬
‫שהשונות תהיה מינימלית‪ ,‬כלומר למזער את ) ̂‬
‫‪.‬‬
‫(‬
‫‪ o‬נתבונן בביטוי הזה‪:‬‬
‫] ))] [‬
‫(‬
‫))‬
‫(‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫) (‬
‫‪‬‬
‫) (‬
‫∑‬
‫)‬
‫∑(‬
‫(‬
‫̂‬
‫) (‬
‫‪.‬‬
‫ב"ת‪ .‬נגדיר‬
‫יהיו ) (‬
‫(‬
‫)‬
‫‪ o‬נמצא את הצפיפות של ‪ .‬לשם כך נצטרך לחשב אינטגרל‪:‬‬
‫∬‬
‫‪ .‬את זה נצטרך לעשות בשני אזורים שונים‪:‬‬
‫קבוצת הנקודות שעבורן‬
‫‪:‬‬
‫עבור‬
‫‪‬‬
‫)‬
‫(‬
‫)‬
‫( על‬
‫) ( ) (‬
‫∫ ∫‬
‫עבור‬
‫‪‬‬
‫‪o‬‬
‫את מה שקיבלנו אפשר עכשיו לגזור‪:‬‬
‫‪o‬‬
‫עכשיו נמצא את מקדם המתאם של‬
‫]‬
‫‪o‬‬
‫‪‬‬
‫] [ ] [‬
‫]‬
‫[‬
‫) (‬
‫נותר לחשב את‬
‫מטילים קובייה הוגנת‬
‫שני המשתנים‪.‬‬
‫∫ ∫‬
‫(‬
‫נעדיף לחשב את השטח של המשולש מעל האזור שמעניין אותנו‪:‬‬
‫∫‬
‫[‬
‫)‬
‫∫ ∫‬
‫)‬
‫∫‬
‫– נתחיל מהשונות המשותפת‪:‬‬
‫]‬
‫[‬
‫) (‬
‫] [‬
‫)‬
‫(‬
‫)‬
‫‪o‬‬
‫עוד נשים לב שאם נסמן‬
‫])‬
‫(‬
‫פעמים‪ .‬נסמן‬
‫‪o‬‬
‫) ( ‪.‬‬
‫{‬
‫– מספר תוצאות "‪,"1‬‬
‫ראשית נשים לב ש‪)-‬‬
‫(‬
‫ולכן‬
‫( [‬
‫) (‬
‫] [ ] [‬
‫ומכאן‬
‫[‬
‫]‬
‫)‬
‫√‬
‫√‬
‫)‬
‫(‬
‫( ‪.‬‬
‫– מספר תוצאות "‪ ."2‬רוצים למצוא את מקדם המתאם בין‬
‫)‬
‫(‬
‫– מספר תוצאות "‪ "1‬או "‪ ,"2‬אז )‬
‫]‬
‫(‬
‫(‬
‫]‬
‫[‬
‫[ ‪.‬‬
‫ולכן אנו יודעם איך‬
‫ומצד שני‬
‫מתפלג הסכום ויכולים לבודד את השונות המשותפת‪:‬‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) (‬
‫פונקציה יוצרת מומנטים‬
‫הגדרה‪ :‬יהי‬
‫[‬
‫מ"מ‪ .‬פונקציה יוצרת מומנטים שלו מוגדרת להיות ]‬
‫) ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫) (‬
‫‪‬‬
‫) (‬
‫והפונקציה יוצרת מומנטים שלו היא‪:‬‬
‫)‬
‫)‬
‫(‬
‫(‬
‫∑‬
‫) (‬
‫∑‬
‫והפונקציה יוצרת מומנטים שלו היא‪:‬‬
‫]‬
‫)‬
‫[‬
‫(‬
‫∫‬
‫∫‬
‫) (‬
‫נוכל להשתמש בפונקציה יוצרת מומנטים כדי לחשב את המומנטים של מ"מ יחסית בקלות‪ .‬ובכן‪:‬‬
‫טענה‪ :‬יהי‬
‫מ"מ‪( ) ,‬‬
‫פונקציה יוצרת מומנטים שלו‪ .‬אזי ) (‬
‫) (‬
‫]‬
‫[ ‪.‬‬
‫הוכחה‪ :‬נתחיל מהמומנט הראשון (התוחלת)‪:‬‬
‫] [‬
‫) (‬
‫) (‬
‫) (‬
‫∫‬
‫∫‬
‫) (‬
‫באופן דומה‪ ,‬אפשר להסתכל על הנגזרת השנייה‪:‬‬
‫]‬
‫[‬
‫) (‬
‫באופן כללי ניתן להראות באינדוקציה שמתקיים ]‬
‫) (‬
‫[‬
‫) (‬
‫∫‬
‫) (‬
‫) (‬
‫כנדרש‪∎ .‬‬
‫משפט‪( :‬ללא הוכחה) תחת תנאי חלקות מסוימים‪ ,‬המומנטים (מכל סדר) של מ"מ‬
‫קובעים את‬
‫ביחידות‪.‬‬
‫כלומר‪ ,‬אם אנו יודעים את הפונקציה יוצרת מומנטים של מ"מ מסוים‪ ,‬אנו בעצם יודעים מה ההתפלגות שלו‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫) (‬
‫יהיו ) (‬
‫‪ .‬נסתכל על הפונקציה יוצרת מומנטים שלו‪:‬‬
‫ב"ת ו‪-‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫()‬
‫)‬
‫) (‬
‫] [‬
‫[‬
‫]‬
‫] [ ] [‬
‫) ( ) (‬
‫[‬
‫]‬
‫(נקבע ע"י הפונקציה יוצרת מומנטים שלו)‪.‬‬
‫(‬
‫‪ o‬המסקנה‪) :‬‬
‫‪ o‬ניתן‪ ,‬כמובן‪ ,‬להרחיב תופעה זו באינדוקציה לכל מספר סופי של מ"מ פואסון ב"ת‪.‬‬
‫) (‬
‫מ"מ ב"ת‪ ,‬הראינו כרגע ש‪( ) ( )-‬‬
‫‪.‬‬
‫באופן כללי‪ ,‬אם‬
‫)‬
‫[‬
‫]‬
‫‪ ,‬אזי‪( ) :‬‬
‫) ( ‪.‬‬
‫( [‬
‫]‬
‫יהי‬
‫ב"ת‬
‫וכן כל ה‪-‬‬
‫זבובים נכנסים לחדר‪ ,‬ובחדר מלכודת‪ .‬הזבוב ה‪ -‬שנכנס ייתפס במלכודת בהסתברות ‪ ,‬כלומר ) (‬
‫וש"ה‪ .‬נסמן – מספר הזבובים שנכנסו לחדר‪ ,‬ונתון ) (‬
‫‪ .‬נגדיר – מספר הזבובים שנתפסו ורוצים למצוא את ההתפלגות‬
‫שלו‪.‬‬
‫(‬
‫)‬
‫( ) (‬
‫‪ o‬ניזכר ש‪)-‬‬
‫) ( ‪ .‬מכאן נפתח‪:‬‬
‫ו‪-‬‬
‫)‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫∑‬
‫]] |‬
‫כדי להמשיך נסתכל על‬
‫‪o‬‬
‫[ [‬
‫∑‬
‫]‬
‫]‬
‫[‬
‫[‬
‫(‬
‫) (‬
‫ספציפי‪:‬‬
‫(‬
‫)‬
‫(∏‬
‫)‬
‫∑‬
‫]‬
‫]‬
‫[‬
‫∑‬
‫|‬
‫[‬
‫ומכאן אפשר לחזור לתוחלת‪:‬‬
‫‪o‬‬
‫( (‬
‫))‬
‫)‬
‫∑‬
‫)‬
‫‪o‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫∑‬
‫טענה‪ :‬יהי )‬
‫()‬
‫))‬
‫(‬
‫וכעת קיבלנו את הפונקציה יוצרת מומנטים של מ"מ פואסון‪) :‬‬
‫(‬
‫(‬
‫( (‬
‫הוכחה‪ :‬נתחיל במ"מ נורמלי סטנדרטי‪) ,‬‬
‫∑‬
‫) (‬
‫‪.‬‬
‫‪ .‬עבורו‪:‬‬
‫∫‬
‫√‬
‫] )‬
‫‪.‬‬
‫‪ .‬הפונקציה יוצרת מומנטים שלו היא‬
‫(‬
‫( ∑‬
‫√‬
‫∫‬
‫√‬
‫)‬
‫]‬
‫∫‬
‫(‬
‫המעבר האחרון נובע מכך שקיבלנו אינטגרל על פונקציית הצפיפות של מ"מ נורמלי )‬
‫(‬
‫‪( .‬בתרגיל ראינו ש‪)-‬‬
‫‪ ).‬עבורו‪:‬‬
‫המ"מ המקורי‪,‬‬
‫)‬
‫(‬
‫[‬
‫) (‬
‫∫‬
‫√‬
‫( ‪ .‬כעת נתבונן על‬
‫) (‬
‫כפי שרצינו‪∎ .‬‬
‫מסקנה‪ :‬יהיו )‬
‫)‬
‫(‬
‫(‬
‫ב"ת‪ ,‬ו‪-‬‬
‫(‬
‫‪ .‬אזי )‬
‫הוכחה‪ :‬מפיתוח פ' יוצרת מומנטים‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫([‬
‫) (‬
‫) (‬
‫) (‬
‫‪.‬‬
‫התכנסות בהסתברות‬
‫) ( סדרת מ"מ‪ .‬נאמר שהסדרה )‬
‫‪.‬‬
‫|(‬
‫הגדרה‪ :‬תהי‬
‫|‬
‫)‬
‫טענה (אי‪-‬שוויון מרקוב)‪ :‬יהי‬
‫מ"מ אי‪-‬שלילי‪ .‬אזי‬
‫( מתכנסת בהסתברות ל‪ -‬אם לכל‬
‫] [‬
‫)‬
‫‪,‬‬
‫( ‪.‬‬
‫הוכחה‪ :‬מההגדרה‪:‬‬
‫)‬
‫) (‬
‫(‬
‫) (‬
‫∫‬
‫) (‬
‫∫‬
‫) (‬
‫∫‬
‫) (‬
‫∫‬
‫∫‬
‫] [‬
‫ומהעברת אגפים מתקבל הדרוש‪∎ .‬‬
‫טענה (אי‪-‬שוויון צ'בישב)‪ :‬יהי‬
‫מ"מ עם תוחלת‬
‫(‬
‫הוכחה‪ :‬נגדיר מ"מ חדש )‬
‫ושונות‬
‫)‬
‫‪ .‬אזי‬
‫|( ‪.‬‬
‫|‬
‫ונציב אותו בא"ש מרקוב‪:‬‬
‫([‬
‫] )‬
‫)‬
‫)‬
‫(‬
‫|(‬
‫|‬
‫כפי שרצינו‪∎ .‬‬
‫מסקנה‪:‬‬
‫)‬
‫)‬
‫(‬
‫|( ‪.‬‬
‫|‬
‫זה מאפשר לראות את ההסתברות שהמשתנה המקרי מתרחק מהתוחלת במכפלות של סטיית התקן‪ .‬למשל‪,‬‬
‫ההסתברות להתרחק ‪ 3‬סטיות תקן מהתוחלת היא פחות מ‪. -‬‬
‫משפט (החוק החלש של המספרים הגדולים)‪ :‬תהי )‬
‫הסדרה )‬
‫( סדרה של מ"מ ב"ת שווי התפלגות עם תוחלת ‪ .‬אזי‬
‫( מתכנסת בהסתברות ל‪. -‬‬
‫הוכחה‪ :‬ראינו כבר ש‪-‬‬
‫[‬
‫]‬
‫)‬
‫ו‪-‬‬
‫(‬
‫)‬
‫ועכשיו‪ ,‬עבור‬
‫|(‬
‫|‬
‫נתון‪ ,‬הגבול הנ"ל הוא ‪( 0‬כאשר‬
‫הגדרה‪ :‬סדרה )‬
‫‪ ,‬ונציב את זה בא"ש צ'בישב‪:‬‬
‫( של מ"מ מתכנסת בהתפלגות למ"מ‬
‫) ומכאן המסקנה‪∎ .‬‬
‫(שוויון פונקציות)‪.‬‬
‫אם‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מתקיימות בחירות‪,‬‬
‫והממוצע שלהם‬
‫‪o‬‬
‫שכולם ב"ת שווי התפלגות () (‬
‫ההסתברות לתמיכה במפלגה מסוימת‪ .‬נסתכל על מדגם‬
‫)‪,‬‬
‫‪.‬‬
‫)‬
‫אנו יודעים מא"ש צ'בישב ש‪-‬‬
‫לא יודעים את ‪.‬‬
‫(‬
‫)‬
‫|‬
‫|( ומכאן‬
‫)‬
‫|‬
‫|( ‪ ,‬שזו עובדה מועילה אפילו אם‬
‫‪o‬‬
‫דיוק ורוצים לדעת מהו ה‪ -‬שמשיג את זה‪ .‬ובכן‪:‬‬
‫במכון סקרים רוצים ‪ 05%‬ביטחון עבור‬
‫)‬
‫‪‬‬
‫‪ o‬למשל‪ ,‬עבור‬
‫יהיו ) (‬
‫ב"ת ש"ה‪ ,‬ו‪-‬‬
‫‪o‬‬
‫נראה ש‪-‬‬
‫(‬
‫‪‬‬
‫יהיו‬
‫‪...‬‬
‫‪.‬‬
‫)‬
‫נגדיר‬
‫)‬
‫( ∏‬
‫)‬
‫(‬
‫)‬
‫(‬
‫|(‬
‫|‬
‫‪ .‬סדרה זו לא מתכנסת בהסתברות ל‪:0-‬‬
‫→ )‬
‫‪o‬‬
‫|‬
‫(מתכנסת בהסתברות ל‪.)0-‬‬
‫→ )‬
‫‪o‬‬
‫מקבלים‬
‫|(‬
‫)) (‬
‫(‬
‫)‬
‫(‬
‫לכן אנו מסיקים ש‪( )-‬‬
‫מ"מ ב"ת כך ש‪( )-‬‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫→) (‬
‫בעצם‪ ,‬מה שקיבלנו כאן זה ש‪-‬‬
‫)‬
‫(‬
‫(‬
‫לכל ‪ ,‬וזו פונקציית ההתפלגות המצטברת של מ"מ אקספוננציאלי‪.‬‬
‫)‪.‬‬
‫(מתכנסת בהתפלגות ל‪( )-‬‬
‫‪ .‬נראה ש‪-‬‬
‫ונגדיר‬
‫)‬
‫(‬
‫)‬
‫→‬
‫)‬
‫) (‬
‫))‬
‫(‬
‫(‬
‫מתכנסת בהסתברות ל‪:0-‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)) (‬
‫)‬
‫(‬
‫| |(‬
‫(‬
‫משפט הגבול המרכזי‬
‫משפט (משפט הגבול המרכזי – ‪ :)Central Limit Theorem‬יהיו‬
‫ונגדיר‬
‫מ"מ בלתי‪-‬תלויים שווי התפלגות‬
‫‪ .‬נניח גם תוחלת ושונות סופיים לכל‬
‫נגדיר מ"מ חדש‬
‫‪ .‬אזי מתקיים ) (‬
‫√‬
‫נורמלי סטנדרטי‪) ,‬‬
‫(‬
‫)‬
‫) (‬
‫‪ .‬נסמן‬
‫‪ ,‬כלומר‬
‫] [ ‪.‬‬
‫מתכנסת בהתפלגות למ"מ‬
‫( ‪.‬‬
‫הוכחה‪ :‬תהי ) (‬
‫המ"מ היא ‪ .0‬כעת‪:‬‬
‫פונקציה יוצרת מומנטים של‬
‫]‬
‫[ ∏‬
‫√‬
‫]‬
‫√‬
‫‪ ,‬סופית בתחום‬
‫]‬
‫∏[‬
‫))‬
‫כעת נשתמש בפיתוח טיילור של ) (‬
‫סביב‬
‫√‬
‫‪:‬‬
‫(‬
‫) (‬
‫‪ .‬נניח גם בה"כ שהתוחלת של‬
‫√‬
‫(‬
‫) (‬
‫]‬
‫[‬
‫)‬
‫√‬
‫∑‬
‫(‬
‫[‬
‫) (‬
‫∏‬
‫) (‬
‫‪ ,‬וניקח שלושה איברים‬
‫מהטור‪:‬‬
‫) (‬
‫תחת ההנחות שלנו‪,‬‬
‫[‬
‫]‬
‫] [‬
‫] [ ולכן ]‬
‫זה בביטוי שהיה לנו קודם‪:‬‬
‫) (‬
‫[‬
‫) (‬
‫) (‬
‫) (‬
‫‪ ,‬כלומר נשארנו עם ) (‬
‫) (‬
‫) (‬
‫)‬
‫(‬
‫‪ .‬נציב את‬
‫))‬
‫(‬
‫(‬
‫)‬
‫))‬
‫(‬
‫)‬
‫כאשר‬
‫(‬
‫(‬
‫(יש להצדיק את השמטת )‬
‫‪ ,‬הביטוי שקיבלנו שואף ל‪-‬‬
‫√‬
‫(‬
‫) (‬
‫(‬
‫ולא נעשה זאת)‪ .‬לסיכום‪ ,‬קיבלנו‬
‫מתכנסת ל‪ , -‬שהיא הפונקציה יוצרת מומנטים של מ"מ נורמלי סטנדרטי‪.‬‬
‫שהפונקציה יוצרת מומנטים של‬
‫לכן (לפי משפט שלא למדנו שלפיו התכנסות נקודתית של פונקציה יוצרת מומנטים גוררת התכנסות בהסתברות‬
‫של מ"מ – ויקידפיה)‪) ,‬‬
‫(‬
‫כנדרש‪∎ .‬‬
‫באמצעות המשפט ניתן לבצע קירוב נורמלי – אנו יודעים שהממוצע של קבוצת משתנים מקריים ב"ת ש"ה בעלי‬
‫תוחלת‬
‫ושונות‬
‫( ‪ ,‬והסכום שלהם ניתן לקירוב ע"י )‬
‫ניתן לקירוב ע"י )‬
‫( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מעלים למטוס ‪ 100‬חבילות שמשקל כל אחת מתפלג )‬
‫– נוכל לעשות קירוב נורמלי‪:‬‬
‫‪o‬‬
‫נגדיר‬
‫(‬
‫והן ב"ת זו בזו‪ .‬מה ההסתברות שסך המשקל יהיה גדול מ‪ 3000-‬ק"ג?‬
‫] [‬
‫משקל החבילה ה‪ , -‬ומתקיים‬
‫)‬
‫והשונות של הסכום היא לפיכך‬
‫)‬
‫ולכן‬
‫(‬
‫)‬
‫‪,‬‬
‫‪ .‬מכאן‪:‬‬
‫(‬
‫(‬
‫)‬
‫(‬
‫) (‬
‫)‬
‫‪,‬‬
‫(‬
‫(‬
‫‪‬‬
‫)‬
‫(‬
‫)‬
‫√‬
‫√‬
‫√‬
‫ההסתברות שמערכת תקרוס ביום מסוים היא ‪ .5%‬בשנה יש ‪ 300‬ימי עבודה – מהי ההסתברות שהמערכת תקרוס בלא יותר מ‪5-‬‬
‫ימים בשנה?‬
‫∑‬
‫ורוצים לדעת מה ההסתברות‬
‫וכעת אנו מסתכלים על‬
‫(‬
‫‪ o‬נסמן את המ"מ של הקריסה בכל יום ב‪)-‬‬
‫(‬
‫שערכו יהיה קטן או שווה ל‪ .5-‬במקום החישוב ע"י )‬
‫נבצע קירוב נורמלי‪ ,‬שהרי‬
‫) (‬
‫) (‬
‫] [ ‪:‬‬
‫] [ ו‪-‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫√‬
‫√‬
‫)‬
‫(‬
‫סטטיסטיקה‬
‫באופן כללי בפרק זה נניח שה"טבע" מייצר דוגמאות‪ ,‬וננסה להבין מהדוגמאות האלה מה המאפיינים של‬
‫האקראיות בטבע – בדרך כלל‪ ,‬פרמטר מסוים של התפלגות מסוים‪ .‬למשל‪ ,‬נניח שהטבע מתנהג לפי התפלגות‬
‫אקספוננציאלית‪ ,‬ונרצה לאמוד את הפרמטר שלה מדוגמאות שקיבלנו בניסוי‪.‬‬
‫אמידה נקודתית‬
‫כלשהו‪ ,‬והדגימות‬
‫‪ ,‬שיש לה פרמטר‬
‫כאן אנו מניחים צורה הסתברותית מסוימת של הטבע‪( ) ,‬‬
‫שאנו מקבלים תמיד בלתי‪-‬תלויות ושוות התפלגות‪ .‬כדי לאמוד את הפרמטרים של הטבע‪ ,‬מגדירים פונקציה‪:‬‬
‫הגדרה‪ :‬אומד (או סטטיסטי) הוא פונקציה‬
‫פשוט ) אומדן – את הערך של הפרמטר‬
‫)‬
‫( ̂ ‪ ,‬המחזירה עבור מדגם אקראי (לעתים נסמנו‬
‫)‬
‫(̂ ‪.‬‬
‫שמתאים למדגם שהתקבל‪:‬‬
‫הגדרה‪ :‬הטייה של אומד ̂ מסומנת ומוגדרת‬
‫]) (̂ [‬
‫הפרמטר‪ .‬אומד שההטייה שלו היא ‪ 0‬נקרא אומד חסר‪-‬הטייה‪.‬‬
‫)̂ (‬
‫‪ ,‬כאשר‬
‫הערך ה"אמיתי" של‬
‫) (̂ ‪.‬‬
‫הגדרה‪ :‬אומד ייקרא קונסיסטנטי (עקבי) אם‬
‫תכונות שנרצה שיהיו לאומד‪:‬‬
‫(‪ )1‬אם נחזור על התהליך‪ ,‬נקבל תוצאות (אומדנים) דומים – כלומר‪( ̂( )) ,‬‬
‫נמוך‬
‫) (̂ (קונסיסטנטיות)‬
‫(‪ )2‬כשיש הרבה דגימות‪ ,‬נקבל את הדבר ה"נכון"‪:‬‬
‫̂‬
‫) ( [ יהיה קטן‪ ,‬כלומר‬
‫(‪" )3‬טעות קטנה" – לכל נרצה שהאומדן ̂ יהיה קרוב לאמת‪] :‬‬
‫שההטייה של האומד תהיה קטנה‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מטילים מטבע‪ .‬מניחים ש‪( )-‬‬
‫‪o‬‬
‫∑‬
‫‪ .‬נגדיר אומד‪:‬‬
‫] [‬
‫אומד זה הוא חסר‪-‬הטייה‪:‬‬
‫(‬
‫)‬
‫) (̂ ‪ ,‬כלומר הממוצע של כל ההטלות‪.‬‬
‫]) (̂ [ ‪.‬‬
‫∑ [‬
‫]‬
‫) (‬
‫∑ (‬
‫)‬
‫‪o‬‬
‫השונות מקיימת‪:‬‬
‫‪o‬‬
‫כאשר גדל‪.‬‬
‫משני הסעיפים הקודמים‪ ,‬תוחלת האומד היא‬
‫התכנסות בהסתברות ל‪( -‬אומד קונסיסטנטי)‪.‬‬
‫)) (̂ (‬
‫– ולפחות השונות קְ טֵ נה‬
‫והשונות שלו שואפת ל‪ 0-‬ככל שמספר הדגימות גדל‪ ,‬ולכן קיבלנו‬
‫כדי לבדוק את איכותם של אומדים‪ ,‬מגדירים פונקציות נוספות הדומות להטייה‪ .‬באופן כללי‪ ,‬אפשר להשתמש בכל‬
‫פונקציית מרחק כדי למדוד כמה רחוק האומדן (בתוחלת) מהערך האמיתי של הפרמטר‪:‬‬
‫הגדרה‪ :‬פונקציית הפסד (או טעות) של אומד ̂ מוגדרת )‬
‫כזאת מוגדר ]) ) (̂ ( [ ‪.‬‬
‫) (̂‬
‫למשל‪ ,‬הטייה היא פונקציית הפסד‪ ,‬שבה‬
‫) (̂ ( וההפסד (או סיכון) תחת פונקציית הפסד‬
‫) (̂ ( (פונקציית ההפרש)‪.‬‬
‫)‬
‫הגדרה‪ Mean Squared Error :‬היא פונקציית הפסד המוגדרת )‬
‫) (̂ ([‬
‫פונקציה זו מסומן ] )‬
‫)) (̂ (‬
‫מתקיים‪( ̂) :‬‬
‫) (̂ (‬
‫)‬
‫) (̂ ( ‪ ,‬וההפסד לפי‬
‫‪.‬‬
‫]‬
‫) (̂ [‬
‫) (̂ (‬
‫)‬
‫‪ ,‬כלומר זהו מדד התלוי גם‬
‫בשונות וגם בהטייה – ואנו‪ ,‬בעיקרון‪ ,‬שואפים להקטין את שניהם‪ .‬לעתים יהיה ‪ trade-off‬ביניהם שלא יאפשר‬
‫להקטין את שניהם‪.‬‬
‫אומד ניראות מירבית‬
‫הגדרה‪ :‬יהיו )‬
‫להיות )‬
‫(‬
‫( )‪ .‬אומד הניראות המירבית (‪ )Maximum Likelihood Estimator‬מוגדר‬
‫) (̂ ‪.‬‬
‫(או )‬
‫(‬
‫הרעיון‪ :‬לבחור את ה‪ -‬שבדיעבד אילו הוא היה הפרמטר של הטבע‪ ,‬המדגם שקיבלנו היה הכי סביר‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהיו ) (‬
‫‪ .‬נמצא את אומד הניראות המירבית‪:‬‬
‫‪ o‬נתחיל מלכתוב את ההסתברות‪:‬‬
‫)‬
‫(‬
‫∏‬
‫)‬
‫( ∏‬
‫)‬
‫(‬
‫‪o‬‬
‫כעת כדי למצוא את המקסימום נוציא לוג‪ ,‬נגזור‪ ,‬נשווה ל‪ ,0-‬ונחלץ את ‪:‬‬
‫))‬
‫∑‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫∑‬
‫) (‬
‫)‬
‫(∑‬
‫)‬
‫}))‬
‫(∑‬
‫(‬
‫(‬
‫(‬
‫)‬
‫∏‬
‫) (‬
‫(∑{‬
‫וזו התוצאה שגם הצענו אינטואיטיבית כדי לאמוד הטלות מטבע‪.‬‬
‫(‬
‫ונמצא אומד ניראות מירבית ל‪: -‬‬
‫‪‬‬
‫‪o‬‬
‫יהיו )‬
‫‪‬‬
‫‪ ,‬אחרת הוא המדגם‬
‫‪ o‬ברור שהביטוי הזה מקבל מקסימום כאשר קטן ככל האפשר‪ .‬עם זאת‪ ,‬אנו מוגבלים ל‪-‬‬
‫‪ ,‬וזה צריך להיות האומד שלנו‪:‬‬
‫לא אפשרי עבורו‪ .‬אם כן‪ ,‬ה‪ -‬הקטן ביותר שעבורו הביטוי הזה הוא לא ‪ 0‬הוא‬
‫) (̂ ‪.‬‬
‫̂‬
‫̂‬
‫̂‬
‫̂‬
‫̂‬
‫̂‬
‫) (‬
‫∑‬
‫) (‬
‫) ( ) (‬
‫(‬
‫נשווה אומדים ל‪)-‬‬
‫) ( ‪.‬‬
‫‪( ) :‬‬
‫) (‬
‫))‬
‫∑‬
‫( (‬
‫))‬
‫∑‬
‫‪o‬‬
‫עבור ̂ ‪ ,‬מתקיים‪:‬‬
‫‪o‬‬
‫עבור ̂ (שהוא אומד הניראות המירבית שקיבלנו קודם)‪ ,‬מתקיים‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫] [‬
‫)‬
‫) (‬
‫‪o‬‬
‫)‬
‫() ( ̂‬
‫) (‬
‫‪o‬‬
‫]‬
‫( (‬
‫]) ( ̂ [ ולכן הוא חסר הטייה‪.‬‬
‫(‬
‫() ( ̂‬
‫) ( ̂(‬
‫)‬
‫)‬
‫({‬
‫)‬
‫) ()‬
‫( ̂‬
‫(‬
‫באמצעות מה שקיבלנו אפשר גם לחשב תוחלת‪:‬‬
‫]‬
‫) (‬
‫‪o‬‬
‫∑‬
‫[‬
‫) (̂‬
‫[‬
‫)‬
‫∫‬
‫(‬
‫)‬
‫) (‬
‫∫‬
‫(‬
‫]) ( ̂ [‬
‫כלומר‪ ,‬זהו אומד בעל הטייה (למרות שכאשר מספר הדגימות גדל‪ ,‬התוחלת מתקרבת לפרמטר האמיתי)‪.‬‬
‫]) ( ̂‬
‫[‬
‫(‬
‫)‬
‫עבור ̂ ‪ ,‬מתקיים‪:‬‬
‫]) ( ̂ [ ‪ ,‬כלומר הוא חסר הטייה‪ .‬למעשה‪ ,‬הוא נבנה כדי‬
‫להפוך את ̂ לחסר הטייה‪.‬‬
‫‪o‬‬
‫לגבי שונות‪ ,‬עבור ̂ ‪( ) :‬‬
‫)‬
‫(‬
‫‪o‬‬
‫עבור ̂ ‪ ,‬השונות‪:‬‬
‫‪o‬‬
‫עבור ̂ ‪ ,‬השונות‪) :‬‬
‫‪o‬‬
‫מכל אלה אפשר להשוות את ה‪ .MSE-‬מקבלים‪:‬‬
‫הראשון‪) ,‬‬
‫‪‬‬
‫)‬
‫( )‬
‫)‬
‫(‬
‫(‬
‫(‬
‫(‬
‫)‬
‫)‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)) ( ̂ (‬
‫)) ( ̂ (‬
‫מהשלושה‪.‬‬
‫ורוצים אומד לתוחלת ] [‬
‫יהיו ) (‬
‫ממשיים‪.‬‬
‫‪ o‬נראה ש‪ -‬הוא לא מוטה אםם‬
‫∑‬
‫)‬
‫)‬
‫)‬
‫(‬
‫(‬
‫∑‬
‫)) ( ̂ (‬
‫(‬
‫)‬
‫)) ( ̂ (‬
‫ולבסוף עבור האומד‬
‫∑‬
‫) ( כאשר‬
‫קבועים‬
‫∑‪ .‬ובכן‪:‬‬
‫∑‬
‫] [‬
‫∑[‬
‫]‬
‫]‬
‫) ( [‬
‫) (‬
‫) ( מביא למינימום את השונות בין כל האומדים חסרי ההטייה (ובכך גם את ה‪:)MLE-‬‬
‫‪o‬‬
‫‪o‬‬
‫כלומר‪ ,‬אנחנו צריכים להביא למינימום את‬
‫∑‬
‫∑‬
‫) (‬
‫)‬
‫ורוצים אומד ניראות מירבית ל‪. -‬‬
‫נגדיר את פונקציית הניראות‪:‬‬
‫∑‬
‫נוציא לוג לנוחות‪:‬‬
‫∏‬
‫)‬
‫)) ( (‬
‫∑(‬
‫∑ תחת האילוץ שסכומם הוא ‪ .1‬מא"ש קושי‪-‬שוורץ או פתרון ישיר ע"י‬
‫גזירה לפי כל פרמטר בנפרד מקבלים מינימום כאשר‬
‫‪‬‬
‫)‬
‫)) ( ̂ (‬
‫(‬
‫)) ( ̂ (‬
‫∑ (‬
‫‪ .‬נגביל את עצמנו לסטטיסטים מהצורה‬
‫נראה ש‪-‬‬
‫יהיו ) (‬
‫‪o‬‬
‫‪o‬‬
‫∫‬
‫‪ .‬המסקנה הסופית היא שה‪ MSE-‬של האומד השלישי הוא הטוב ביותר‬
‫∑‬
‫∑‬
‫)‬
‫) (‬
‫(‬
‫)) ( ̂ (‬
‫)‬
‫‪.‬‬
‫∏‬
‫(‬
‫(‬
‫‪.‬‬
‫)‬
‫( ‪.‬‬
‫‪o‬‬
‫נגזור ונשווה ל‪ 0-‬כדי למצוא את המקסימום‪:‬‬
‫∑‬
‫‪o‬‬
‫‪‬‬
‫יהיו )‬
‫‪o‬‬
‫‪o‬‬
‫‪o‬‬
‫כלומר‪ ,‬אומד הניראות המירבית כאן הוא פשוט ‪.‬‬
‫(‬
‫ורוצים אומד ניראות מירבית ל‪. -‬‬
‫(‬
‫)‬
‫נגדיר את פונקציית הניראות‪:‬‬
‫]‬
‫[ וכמובן כל ה‪- -‬ים לקוחים מתוך הקטע הזה)‪.‬‬
‫וכיוון שפונקציית הניראות קבועה בקטע ]‬
‫[‪ ,‬בעצם‬
‫נשים לב ש‪-‬‬
‫כל ערך בקטע זה מספק את המקסימום‪.‬‬
‫) (̂ הוא בעצמו בתוך הקטע ולכן מהווה אומד ניראות מירבית‪ ,‬אבל הוא לא חסר הטיה (לפחות‪ ,‬הוא‬
‫למשל‪,‬‬
‫∏‬
‫]‬
‫קונסיסטנטי)‪:‬‬
‫‪o‬‬
‫‪‬‬
‫)‬
‫∑‬
‫( (פונקציית הצפיפות כאן היא פשוט ‪ 1‬על הקטע‬
‫)‬
‫[ ‪.‬‬
‫) (̂ שהוא גם כן אומד ניראות מירבית‪.‬‬
‫אפשר גם למצוא אומד חסר הטיה‪:‬‬
‫(‬
‫יהיו )‬
‫ורוצים לאמוד את‬
‫‪ .‬נחשב את ה‪ MSE-‬שלו‪:‬‬
‫‪ o‬תחילה נחשב את התוחלת‪:‬‬
‫) (̂ ‪ ,‬שנשמע הגיוני כיוון ש‪ -‬הוא אומד ניראות מירבית לתוחלת‬
‫‪ .‬מציעים אומד‬
‫) (‬
‫(‬
‫]‬
‫]) (̂ [‬
‫[‬
‫‪o‬‬
‫כאשר השתמשנו בכך ש‪)-‬‬
‫‪o‬‬
‫דועך אקספוננציאלית (אפשר גם להציע אומד חסר הטייה ע"י נירמול בהופכי של גורם זה)‪.‬‬
‫אבל הגורם‬
‫כעת נחשב את השונות‪:‬‬
‫ולכן אנו יודעים את הפונקציה יוצרת מומנטים שלו‪ .‬קיבלנו שהאומד אינו חסר הטייה‪,‬‬
‫)) (‬
‫‪o‬‬
‫‪‬‬
‫(‬
‫וקיבלנו )‬
‫יהיו )‬
‫(‬
‫)̂ (‬
‫(‬
‫) (‬
‫]‬
‫] )‬
‫[‬
‫‪ .‬גם ערך זה שואף ל‪ 0-‬כאשר‬
‫([‬
‫)‬
‫)) ( ̂ (‬
‫(‬
‫גדל‪ ,‬שזה "טוב"‪.‬‬
‫‪o‬‬
‫(‬
‫ורוצים אומדי ניראות מירבית (הוכחות בפתרון תרגיל ‪:)11‬‬
‫) (‬
‫̂ ‪.‬‬
‫ידוע‪,‬‬
‫כאשר‬
‫) (‬
‫( ∑‬
‫כאשר ידוע‪) ,‬‬
‫̂‪.‬‬
‫‪o‬‬
‫כאשר שני הפרמטרים לא ידועים‪ ,‬האומד לתוחלת הוא כמו קודם והאומד לשונות הוא )‬
‫‪o‬‬
‫(‬
‫∑‬
‫) (̂‪.‬‬
‫משפט‪( :‬ללא נוכחה) אומד ניראות מירבית הוא קונסיסטנטי‪.‬‬
‫הגדרה‪ :‬אומד ) (̂ נקרא אסימפטוטי נורמלי אם )‬
‫(‬
‫)‬
‫) (̂ ( √‪.‬‬
‫לשונות של ה"טבע"‪ ,‬כלומר של ה‪ -‬של המדגם‪ .‬זה דבר טוב כיוון שהתפלגות נורמלית היא‬
‫הכוונה כאן ב‪-‬‬
‫בעלת דעיכה אקספוננציאלית משני הצדדים של התוחלת‪ ,‬כלומר ההסתברות להיות רחוקים מהממוצע הולכת‬
‫יהיה מאוד גדול‪ ,‬וזה קצב "טוב"‪.‬‬
‫ל‪-‬‬
‫וקטנה‪ .‬למשל‪ ,‬ההבדל בין‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫) (̂ ‪ ,‬ונניח‬
‫יהי‬
‫)‬
‫(‬
‫)‬
‫] [ ו‪-‬‬
‫) (̂ ( √‬
‫)‬
‫) (‬
‫(‬
‫– כלומר אומדים את התוחלת של ה"טבע"‪ .‬כעת לפי משפט הגבול המרכזי‪,‬‬
‫) (̂‬
‫√‬
‫‪ ,‬ולכן זהו אומד אסימפטוטי נורמלי (לתוחלת)‪.‬‬
‫משפט‪( :‬ללא הוכחה) אומד ניראות מירבית הוא אסימפטוטי נורמלי‪.‬‬
‫רווח סמך‬
‫הגדרה‪ :‬יהי מדגם מקרי‬
‫‪ )Interval‬הוא זוג פונקציות‬
‫הנדגמים באופן ב"ת ש"ה מתוך הטבע‪) ,‬‬
‫) ( ‪.‬‬
‫המספקות א"ש ) (‬
‫( ‪ .‬רווח סמך ( ‪Confidence‬‬
‫כלומר‪ ,‬האומדן שלנו במקרה זה הוא לא ערך ספציפי של ‪ ,‬אלא טווח ערכים שבו נמצאת‪ .‬כמובן‪ ,‬אי‪-‬השוויון‬
‫)) (‬
‫) ( ( ו‪-‬‬
‫יהיה נכון רק בהסתברות מסוימת‪ ,‬ונרצה שהיא תהיה קטנה‪ ,‬כלומר‬
‫(הטעות) הוא קטן‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫‪‬‬
‫מ"ל קולה בכל פחית‪ .‬נניח שניתן לכייל את‬
‫קוקה‪-‬קולה בונה מכונה למילוי פחיות‪ ,‬היינו רוצים‬
‫לכל פחית היא )‬
‫( ‪ .‬מטרתנו‪ :‬ב‪ 05%-‬מהפחיות להשיג בין ‪ 327‬ל‪ 332-‬מ"ל קולה‪.‬‬
‫(‬
‫יהיו )‬
‫[‬
‫ונגדיר רווח סמך ]‬
‫בתוך רווח הסמך‪ ,‬כאשר נזכור ש‪)-‬‬
‫)‬
‫(‬
‫√‬
‫)‬
‫√‬
‫(‬
‫√‬
‫) √ (‬
‫‪ .‬כמה הדבר הזה טוב? נחשב את ההסתברות שאכן התוחלת נופלת‬
‫‪:‬‬
‫)‬
‫) √ (‬
‫‪o‬‬
‫‪o‬‬
‫(‬
‫והכמות הנשפכת‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫) √(‬
‫√)‬
‫) √‬
‫√ (‬
‫(‬
‫הוא כיוון ש‪)-‬‬
‫כאן המעבר האחרון הוא מסימטריה של ההתפלגות הנורמלית‪ ,‬והמעבר ל‪-‬‬
‫‪.‬‬
‫מקבלים שההסתברות להיות בטווח הנתון היא‬
‫למשל‪ ,‬עבור‬
‫√)‬
‫(‬
‫(‪.‬‬
‫כיצד נחשב רווח סמך? פועלים לפי שלושה שלבים‪:‬‬
‫( כך שההתפלגות של‬
‫(‪ )1‬מוצאים פונקציה )‬
‫‪pivot function‬‬
‫)‬
‫)‬
‫כך ש‪-‬‬
‫(‪ )2‬נחפש‬
‫אם היא באה מהתפלגות מוכרת‬
‫(‪ )3‬מחלצים רווח סמך על‬
‫(‬
‫אינה תלויה ב‪ ; -‬פונקציה זו נקראת ‪ pivotal quality‬או‬
‫( – זה אמור להיות קל כי‬
‫לא תלויה ב‪ -‬ובמיוחד קל‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫עבור )‬
‫(‬
‫– כאשר אומדים את‬
‫)‬
‫(‬
‫( שהוא מ"מ נורמלי סטנדרטי ואינו תלוי בפרמטר‪.‬‬
‫‪o‬‬
‫נגדיר √‬
‫‪o‬‬
‫נסתכל על‬
‫‪o‬‬
‫כשמחלצים את ‪ ,‬מתקבל רווח הסמך ]‬
‫)‬
‫יהיו )‬
‫‪o‬‬
‫(‬
‫√‬
‫)‬
‫‪‬‬
‫ידוע)‪:‬‬
‫(‬
‫– ההסתברות שווה ל‪-‬‬
‫(‬
‫))‬
‫√‬
‫(‬
‫)‬
‫[‬
‫√‬
‫כיוון ש‪-‬‬
‫(‬
‫(הגיוני שהוא סימטרי כי מדובר בהתפלגות‬
‫נורמלית‪ ,‬שהיא סימטרית)‪.‬‬
‫(‬
‫ורוצים לאמוד את ‪.‬‬
‫)‬
‫אפשר לקחת‬
‫)‬
‫( ואז‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫) ()‬
‫(‬
‫זו התפלגות שאינה‬
‫תלויה ב‪. -‬‬
‫‪o‬‬
‫אפשר גם להשתמש במה שקיבלנו עבור אומד ניראות מירבית (‬
‫)‬
‫) ולקחת‬
‫( ‪ .‬גם ההתפלגות שלה‬
‫אינה תלויה ב‪ , -‬נראה זאת‪:‬‬
‫)‬
‫‪o‬‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)‬
‫כעת ננסה למצוא חסמים עבור‬
‫(‬
‫)‬
‫)‬
‫( ‪ .‬כיוון ש‪)-‬‬
‫) (‬
‫(‬
‫( מהר מאוד מתקרבת ל‪ ,1-‬סביר לבחור‬
‫ו"לשחק" רק עם ערכו של ‪:‬‬
‫) (‬
‫‪o‬‬
‫אם אנו רוצים‬
‫) (‬
‫‪ ,‬מכאן שאנחנו צריכים לבחור √‬
‫)‬
‫‪.‬‬
‫(‬
‫אנחנו צריכים לבודד אותו מהא"ש‪:‬‬
‫‪o‬‬
‫כדי לקבל רווח סמך על‬
‫‪o‬‬
‫וקיבלנו רווח סמך מהצורה ]‬
‫)‬
‫√‬
‫[‬
‫√‬
‫במילא לא ייתכן‬
‫‪‬‬
‫(‬
‫לפי משפט הגבול המרכזי‪ ,‬עבור‬
‫‪o‬‬
‫]‬
‫)‬
‫המספק רמת שגיאה‬
‫(הגבול השמאלי של הרווח ברור מאליו‪ ,‬כי‬
‫– כי הוא לא יכול לייצר דגימות כאלה)‪.‬‬
‫‪ o‬נניח שרוצים רמת ביטחון של ‪ 05%‬ו‪-‬‬
‫יהיו ) (‬
‫ורוצים רווח סמך ל‪. -‬‬
‫)‬
‫√(‬
‫( √‬
‫[‬
‫√‬
‫‪ .‬מהו ה‪ -‬הדרוש? פותרים ומקבלים‬
‫גדול‪) ,‬‬
‫)‬
‫(‬
‫(‬
‫(בקירוב)‪ .‬לכן‪ ,‬לפי מה שראינו קודם‪ ,‬רווח הסמך (לנורמלי) הוא‬
‫‪.‬‬
‫הבעיה כאן היא שהרווח סמך תלוי ב‪ . -‬פתרון אפשרי אחד הוא לחסום‪) :‬‬
‫‪o‬‬
‫‪.‬‬
‫(‬
‫ולכן אפשר להחליף את הגורם הזה‬
‫ב‪ -‬בתוך רווח הסמך‪.‬‬
‫פתרון אפשרי אחר הוא להעריך את‬
‫‪o‬‬
‫( במקום על )‬
‫באמצעות ‪ ,‬כלומר להסתכל על )‬
‫( ‪.‬‬
‫בדיקת השערות‬
‫במקום לספק רווח סמך או לאמוד ממש את הפרמטר‪ ,‬כעת אנו רק מתעניינים בשתי השערות על מנת להכריע‬
‫איזו מהן נכונה לגבי הטבע על סמך המדגם שקיבלנו‪.‬‬
‫ב"ת ש"ה)‬
‫) ( כאשר מדגם מקרי (‬
‫הגדרה‪ :‬בבדיקת השערות עלינו לבנות מבחן מהצורה‬
‫השערת האלטרנטיבה‪ ,‬כאשר המבחן דוחה את השערת האפס‪.‬‬
‫השערת האפס‪,‬‬
‫עבור שתי השערות ‪-‬‬
‫הגדרה‪ :‬נסמן ב‪ -‬את קבוצת המדגמים שעבורם המבחן דוחה את‬
‫)‬
‫)‬
‫‪ .‬אז רמת המובהקות (‪ )significance‬תסומן‬
‫)‬
‫ועוצמת המבחן (‪ )power‬תסומן )‬
‫((‬
‫((‬
‫והיא‬
‫‪.‬‬
‫היא הנכונה‪ .‬כלומר‪ ,‬רמת המובהקות‬
‫‪ ,‬הכוונה להסתברות של המאורע כאשר ההשערה‬
‫כאשר כותבים‬
‫כאשר היא נכונה (על סמך מדגם שעבר את הסף שלנו)‪ ,‬ועוצמת המבחן‬
‫מגדירה את ההסתברות לדחות את‬
‫כאשר היא אינה נכונה‪.‬‬
‫מגדירה את ההסתברות לקבל את‬
‫בהינתן מבחן מסוים ו‪( -‬גודל המדגם)‪ ,‬כאשר קובעים את ‪ ,‬זה קובע גם את ערכו של ‪ .‬אם רוצים להקטין את‬
‫שני סוגי הטעות‪ ,‬אין ברירה אלא להגדיל את ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהיו ) (‬
‫– המטבע לא מוטה‪,‬‬
‫ואנו רוצים לבדוק את ההשערות‬
‫∑‬
‫נניח שמטילים את המטבע ‪ 1000‬פעמים‪ ,‬ונסמן‬
‫|‬
‫|‪ ,‬כאשר כאן‬
‫‪ ,500‬ולכן נגדיר מבחן מהצורה‪:‬‬
‫|(‬
‫|‬
‫)‬
‫(כלומר הטעות) תהיה קטנה‪.‬‬
‫‪‬‬
‫יהיו )‬
‫‪o‬‬
‫(‬
‫והשערות‬
‫נבדוק מהם‬
‫‪,‬‬
‫כאן (כאשר )‬
‫‪ ,‬וההשערה המשלימה‬
‫סכום ההטלות‪ .‬כאשר המטבע לא מוטה‪ ,‬התוחלת של הסכום היא‬
‫הוא סף המבחן‪ ,‬ורוצים שכאשר המטבע לא מוטה‪ ,‬ההסתברות‬
‫‪ .‬נשתמש במבחן הבא‪ :‬אם‬
‫(‬
‫√‬
‫) (‬
‫) √‬
‫‪o‬‬
‫נניח כעת שרוצים‬
‫√‬
‫(‬
‫)‬
‫√)‬
‫(‬
‫) √)‬
‫(‬
‫‪ ,‬ונחשב את‬
‫) √)‬
‫(‬
‫‪ ,‬דוחים את‬
‫(‬
‫√‬
‫(‬
‫‪.‬‬
‫כמו תמיד)‪:‬‬
‫)‬
‫) √‬
‫– המטבע מוטה‪,‬‬
‫(‬
‫) √)‬
‫)‬
‫√‬
‫(‬
‫(עבור המבחן‬
‫(‬
‫((‬
‫√)‬
‫(‬
‫)‬
‫) שיספק אותו‪:‬‬
‫(‬
‫√)‬
‫((‬
‫)‬
‫(‬
‫‪.‬‬
‫‪o‬‬
‫שמצאנו‪ ,‬מה קורה עם ?‬
‫עבור אותם‬
‫) √‬
‫‪‬‬
‫עבור )‬
‫(‬
‫(‬
‫√)‬
‫) √‬
‫וההשערות‬
‫)‬
‫((‬
‫((‬
‫√)‬
‫) נתסכל על מבחן מהצורה ) (‬
‫(כאשר‬
‫(בצד שמאל יש‬
‫√‬
‫נורמלי סטנדרטי‪ ,‬שזה נוח) ונרצה למצוא כמה גדול צריך להיות המדגם על מנת לקיים תנאים גם על‬
‫) ( כדי שהטעות מהסוג הראשון לא תעלה על ‪.‬‬
‫‪ o‬ראשית נדרוש‬
‫(‬
‫)‬
‫) ( ‪ ,‬שהרי )‬
‫‪o‬‬
‫שנית נדרוש‬
‫‪o‬‬
‫משני התנאים יחד אנו מקבלים‪:‬‬
‫(‬
‫)‬
‫√‬
‫√‬
‫(‬
‫)‬
‫√‬
‫)‬
‫) (‬
‫√‬
‫מקבלים‬
‫)‬
‫) (‬
‫(‬
‫(‬
‫)‬
‫(‬
‫וגם על ‪.‬‬
‫‪.‬‬
‫√‬
‫(‬
‫‪ ,‬ואם מתעלמים מהחלק האמצעי של הא"ש‪,‬‬
‫√‬
‫ומכאן אפשר להפיק תנאי על‬
‫(שהוא המשתנה האמיתי כאן)‪ .‬ובכן‪:‬‬
‫√‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫ובכל מקרה כדי שאפשר יהיה לקיים את התנאי הזה צריך‬
‫√‬
‫‪o‬‬
‫‪‬‬
‫יהי‬
‫מ"מ רציף עם הצפיפות‬
‫על תצפית אחת‪ , ,‬והדוחה את‬
‫) (‬
‫בקטע ]‬
‫אם‬
‫( √‬
‫‪.‬‬
‫[ ו‪ 0-‬בשאר הישר‪ .‬ההשערות‪:‬‬
‫‪ .‬נגדיר מבחן המתבסס‬
‫‪ .‬מהי רמת המובהקות והעוצמה?‬
‫]‬
‫∫‬
‫[‬
‫)‬
‫∫‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫עד כה בבדיקת השערות ידענו רק להפריד בין שתי השערות‪ ,‬אך לא ידענו לומר "עד כמה" אנחנו מאמינים‬
‫שהשערה מסוימת היא נכונה‪ .‬ובכן‪ ,‬נגדיר מדד כזה‪:‬‬
‫( את ערך הסטטיסטי עבור המדגם (המבחן‪ ,‬בבדיקת‬
‫(‬
‫) ( ( ‪( .‬כאן הוא מ"מ של כל המדגם‪,‬‬
‫מדגם ספציפי ונסמן ב‪)-‬‬
‫הגדרה‪ :‬יהי‬
‫השערות)‪ .‬ה‪ p-value-‬של המדגם הוא ההסתברות ))‬
‫‪).‬‬
‫כלומר‬
‫ככל שה‪ p-value-‬גדול יותר‪ ,‬כך המדגם יותר סביר בהינתן ‪ .‬כלומר‪ ,‬אם רוצים לאשש את השערת האפס‪,‬‬
‫הוא הערך של אילו היינו בוחרים‬
‫רוצים ‪ p-value‬גבוה ככל האפשר‪ .‬בעצם‪ ,‬ה‪ p-value-‬של המדגם‬
‫(‬
‫לקבוע את הסף של המבחן ב‪)-‬‬
‫‪.‬‬
‫טענה‪ :‬ה‪ p-value-‬מתפלג אחיד בין ‪ 0‬ל‪.1-‬‬
‫הוכחה‪ :‬למעשה‪ ,‬הטענה נכונה לכל ‪ CDF‬שהיא מונוטונית עולה ממש‪ .‬תהי ) (‬
‫מ"מ חדש‪ .‬כעת מתקיים‪:‬‬
‫ונגדיר ) (‬
‫)) (‬
‫)) (‬
‫(‬
‫(‬
‫)) (‬
‫) (‬
‫)‬
‫(‬
‫(‬
‫)‬
‫)) (‬
‫‪ CDF‬מונוטונית עולה ממש‪,‬‬
‫(‬
‫) (‬
‫(‬
‫וקיבלנו שפונקציית ההתפלגות המצטברת היא כמו של ) ( ‪ ,‬כאשר בדרך השתמשנו במונוטוניות ממש כדי‬
‫שתהיה לרשותנו הפונקציה ההופכית‪ .‬במקרה של ‪ ,p-value‬מדובר ב‪ CDF-‬מונוטונית ממש (למעט מקרים של‬
‫מבחנים מנוונים ולא מעניינים) ולכן הטענה הנ"ל נכונה עבורה כמקרה פרטי‪∎ .‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫(‬
‫יהי )‬
‫וההשערות‬
‫) ( – בחרנו מבחן זה כיוון שכעת צד שמאל‬
‫‪ ,‬וכלל הדחיה הבא‪:‬‬
‫√‬
‫מתפלג נורמלי סטנדרטי‪.‬‬
‫‪ o‬נניח שקיבלנו‬
‫‪o‬‬
‫( ‪ .‬מה ה‪?p-value-‬‬
‫) ( (‬
‫)‬
‫) (‬
‫)‬
‫כלומר‪ ,‬תחת ההנחה‬
‫) ( (‬
‫)‬
‫‪ 85% ,‬מהמדגמים יקבלו ציון גבוה מ‪ 0.8-‬מהמבחן שלנו‪.‬‬
‫מבחן יחס הניראות‬
‫הגדרה‪ :‬מבחן יחס הניראות לבדיקת השערות הוא מבחן מהצורה‬
‫)‬
‫(‬
‫)‬
‫(‬
‫) ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫) (‬
‫מטילים קוביה‪ ,‬וההשערות‪:‬‬
‫) (‬
‫{‬
‫ו‪-‬‬
‫‪o‬‬
‫נפעיל את מבחן יחס הניראות על הטלה אחת‪:‬‬
‫‪o‬‬
‫יש לנו כעת כמה אפשרויות לקבוע סף‪ :‬אם נבחר מבחן‬
‫‪.‬‬
‫) (‬
‫{‬
‫) ( ‪ ,‬אז אנו דוחים עם טעות‬
‫מבחן‬
‫‪‬‬
‫) ( ‪ ,‬אז אנו תמיד מקבלים את השערת האפס‪ .‬אם נבחר‬
‫‪ .‬לבסוף‪ ,‬אם נבחר מבחן‬
‫האפס‪.‬‬
‫אם אין פורץ‪ ,‬או‬
‫מצלמת מעקב מחזירה סיגנל‬
‫(‬
‫פורץ ‪ , -‬ונתון )‬
‫‪.‬‬
‫(‬
‫‪ o‬נשים לב שתחת ההנחה שיש פורץ‪) ,‬‬
‫‪ o‬נבנה מבחן יחס ניראות‪:‬‬
‫אם יש פורץ‪ .‬נסמן את ההשערה שאין פורץ ב‪-‬‬
‫וותחת ההנחה שאין פורץ )‬
‫)‬
‫‪o‬‬
‫‪o‬‬
‫‪.‬‬
‫כעת‪ ,‬נניח שרוצים‬
‫∑‬
‫) (‬
‫) (‬
‫‪ .‬מהו ה‪ -‬הדרוש לשם כך?‬
‫יהיו ) (‬
‫וההשערות‪:‬‬
‫‪ o‬נבנה כלל דחיה על פי מבחן יחס הניראות‪:‬‬
‫) (‬
‫‪.‬‬
‫√‬
‫‪ ,‬וכיוון שצד ימין הוא קבוע‪ ,‬בעצם המבחן מצטמצם לצורה מאוד פשוטה‪ :‬האם‬
‫) (‬
‫‪‬‬
‫(‬
‫וההשערה שיש‬
‫(‬
‫√‬
‫אפשר לפרק את זה ולקבל‬
‫) ( אז אנו תמיד דוחים את השערת‬
‫)‬
‫(‬
‫)‬
‫()‬
‫)‬
‫עבור‬
‫(‬
‫)‬
‫(‬
‫(‬
‫‪.‬‬
‫∏‬
‫∏‬
‫∏‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫(‬
‫∑ (כי‬
‫‪ o‬כל מה שקיבלנו זו פונקציה מונוטונית עולה של‬
‫∑‪ ,‬שהוא קל יותר לחישוב‪.‬‬
‫שהמבחן הזה שקול למבחן‬
‫‪ o‬מתרגיל שהיה קודם‪ ,‬אנו יודעים ש‪( )-‬‬
‫∑‪ ,‬מה שאומר שגם קל לנו לחשב הסתברויות על תנאי הדחייה‪,‬‬
‫ולחשב ‪.p-value‬‬
‫‪.‬‬
‫עם ההשערות‬
‫יהיו ) (‬
‫‪ o‬נבנה את מבחן יחס הניראות‪:‬‬
‫ולכן הבסיס של החזקה גדול מ‪ ,)1-‬וכך אפשר לומר‬
‫‪‬‬
‫∑‬
‫)‬
‫‪‬‬
‫(‬
‫(‬
‫(‬
‫)‬
‫)‬
‫)‬
‫∑‬
‫)‬
‫(‬
‫∑‬
‫) (‬
‫(‬
‫)‬
‫(‬
‫∏‬
‫)‬
‫(‬
‫∏‬
‫(‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫∑‪.‬‬
‫∑‪ ,‬ולכן המבחן שוב שקול ל‪-‬‬
‫‪ o‬הביטוי שקיבלנו הוא שוב פונקציה מונוטונית עולה של‬
‫‪ .‬אם רוצים מסוים ספציפי מאוד‪ ,‬יכול‬
‫‪ o‬נשים לב שכיוון שהמ"מ כאן בדיד‪ ,‬יש טעם לדבר רק על‬
‫להיות שלא ניתן להשיג אותו באמצעות כלשהו‪ .‬במקרה כזה‪ ,‬נצטרך גרסה מתוחכמת של המבחן‪ :‬יהיה לנו סף דחייה‬
‫בהסתברות מסוימת (לא ‪ 0‬ולא ‪.)1‬‬
‫וודאית וסף קבלה וודאית‪ ,‬ובאיזור החיץ‪ ,‬המבחן ידחה את‬
‫יהיו ) (‬
‫‪.‬‬
‫והשערות‬
‫∑‬
‫(הוכחה בפתרון תרגיל ‪.)13‬‬
‫‪ o‬מבחן יחס הניראות המתקבל הוא מהצורה‬
‫) ( מבחן יחס הניראות עבור שתי השערות‪,‬‬
‫משפט (ניימן‪-‬פירסון)‪ :‬יהי‬
‫כרגיל‪ .‬אזי‬
‫מבחן כלשהו‪ – ,‬תחום דחיית ‪,‬‬
‫יהי‬
‫– תחום דחיית‬
‫‪.‬‬
‫‪,‬‬
‫כרגיל‪.‬‬
‫הוכחה‪ :‬מההגדרות‪,‬‬
‫(‬
‫)‬
‫כעת נסתכל על‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪ :‬ממבחן יחס הניראות‪,‬‬
‫(‬
‫)‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪ ,‬שכן כל המדגמים הם ב‪ -‬ולכל אחד המנה‬
‫‪ .‬לכן‬
‫מקבלים‪:‬‬
‫)‬
‫ובאותו אופן‪,‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫(‬
‫(‬
‫)‬
‫(‬
‫)‬
‫‪ ,‬כי כל המדגמים אינם ב‪ -‬ולכן עבורם המבחן החזיר‬
‫(‬
‫)‬
‫(‬
‫)‬
‫)‬
‫‪ .‬מכאן שוב מקבלים‪:‬‬
‫(‬
‫כעת נסתכל על ה‪- -‬ות‪:‬‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫)‬
‫(‬
‫כמו שראינו קודם‪,‬‬
‫)‬
‫(‬
‫ומכאן המסקנה‪) :‬‬
‫(‬
‫)‬
‫)‬
‫(‬
‫(‬
‫)‬
‫‪ ,‬ולכן‬
‫(‬
‫)‬
‫(‬
‫כנדרש‪∎ .‬‬
‫במובן מסוים המשפט אומר שמבחן יחס הניראות הוא הכי טוב שאפשר להשיג – אי אפשר לשפר את המובהקות‬
‫)‪.‬‬
‫( ) מבלי לפגוע בעוצמת המבחן (‬
‫מבחן יחס הניראות המוכלל‬
‫כאן נרצה לעסוק במקרה שההשערות אינן שתי נקודות (למשל‪ ,‬שני ניחושים של הפרמטר) אלא משהו מורכב‬
‫יותר‪ .‬נתחיל בדוגמא ואז נבנה מבחן שפועל על כל שתי השערות‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫יהיו )‬
‫(‬
‫‪ .‬נתחיל בניחוש‪ :‬כיוון שאנו רוצים לבדוק‬
‫‪ ,‬לרשותנו מדגם של דגימה אחת‪ ,‬וההשערות‪:‬‬
‫השערה לגבי התוחלת‪ ,‬יהיה הגיוני להסתכל על המדגם עם נרמול‪ ,‬כלומר על מבחן מהצורה‬
‫‪o‬‬
‫נתבונן בטעויות‪ :‬כיוון ש‪ -‬תלוי ב‪-‬‬
‫)‬
‫‪o‬‬
‫‪ ,‬זה חישוב שכבר עשינו‪ .‬לעומת זאת‪,‬‬
‫(‬
‫ככל ש‪ -‬גדל‪( )) ,‬‬
‫(‬
‫)‬
‫)‬
‫כאן היא כבר פונקציה של ‪:‬‬
‫)‬
‫) (‬
‫(‬
‫( מתקרב ל‪ 0-‬בהדרגה‪ .‬בנוסף‪ ,‬כאשר‬
‫(‬
‫‪.‬‬
‫) ( ‪ ,‬כי אז‪:‬‬
‫‪ ,‬מקבלים‬
‫(‬
‫)‬
‫הגדרה‪ :‬מבחן יחס ניראות מוכלל (‪ )Generalized Likelihood Ratio Test‬הוא מבחן בדיקת השערות כאשר‬
‫שסף הדחייה שלו הוא‬
‫ההשערות מהצורה‬
‫)‬
‫(‬
‫)‬
‫(‬
‫) ( ‪.‬‬
‫דוגמאות‪:‬‬
‫‪‬‬
‫מטילים הטלות קוביה בעלת הסתברויות )‬
‫מבחן יחס ניראות מוכלל לבדיקת השערות אלה‪:‬‬
‫‪o‬‬
‫‪ ,‬וההשערות‬
‫‪ ,‬זה נכון לכל מדגם‪ .‬לעומת זאת‪ ,‬במונה אנו רוצים "תחרות" – המודל הכי‬
‫מכל האפשרויות על כל הפרמטרים של הבעיה‪ .‬נסמן‬
‫מספר הפעמים ש‪ -‬יצא במדגם‪ ,‬ונקבל‪:‬‬
‫(∑‬
‫)‬
‫)‬
‫‪o‬‬
‫) (‬
‫ברור מה צריך להיות במכנה ‪( ) -‬‬
‫סביר תחת‬
‫(‬
‫– הקוביה הוגנת‪,‬‬
‫– הקוביה לא הוגנת‪ .‬נבנה‬
‫∑‬
‫)‬
‫(‬
‫( ∏‬
‫(‬
‫)‬
‫זה ביטוי שאפשר להוציא מתוכו לוג ואז לגזור לפי ‪ 5‬הפרמטרים כדי למצוא את המקסימום‪:‬‬
‫)‬
‫∑‬
‫∑‬
‫(‬
‫)‬
‫∑‬
‫)‬
‫∑‬
‫∑‬
‫(‬
‫()‬
‫∑‬
‫∑‬
‫)‬
‫)‬
‫(‬
‫(‬
‫(‬
‫‪o‬‬
‫כעת ממניפולציה מסוימת‪ ,‬מקבלים שכדי שכל הנגזרות יחד יהיו ‪ ,0‬צריך ש‪-‬‬
‫‪o‬‬
‫נשים לב גם שזה המקסימום ולא המינימום (כי המינימום – שהוא ‪ – 0‬מושג כאשר איזשהו‬
‫‪.)0‬‬
‫מכאן מבחן יחס הניראות המוכלל הוא (נשים לב שכאן המקריות היא כבר ב‪ – -‬אין בביטוי)‪:‬‬
‫‪o‬‬
‫)‬
‫) (‬
‫לכל ‪.‬‬
‫וה‪-‬‬
‫המתאים לו אינו‬
‫) (‬
‫(∏‬
‫) (‬
‫‪‬‬
‫יהיו )‬
‫)‬
‫(‬
‫(‬
‫()‬
‫‪ .‬מקבלים מדגמים מצומדים )‬
‫(‪ .‬נגדיר‬
‫ושתי השערות‬
‫‪o‬‬
‫‪.‬‬
‫נשים לב לכך ש‪)-‬‬
‫‪o‬‬
‫√‬
‫כיוון ש‪ -‬הוא אומד הניראות המירבית לתוחלת של מ"מ נורמלי‪ ,‬כל הביטוי ניתן לצמצום – הגורם המונה הוא זה שבו‬
‫(‬
‫‪ .‬נכתוב את מבחן יחס הניראות‪ ,‬כאשר‬
‫)‬
‫(‬
‫√‬
‫∏‬
‫) (‬
‫∏‬
‫‪.‬‬
‫‪:‬‬
‫סוף‬