ניסוי: סטטיסטיקה שימושית

‫הטכניון – מכון טכנולוגי לישראל‬
‫הפקולטה להנדסה ביו‪-‬רפואית‬
‫מעבדה בהנדסה ביו‪-‬רפואית ‪(335001 ) I‬‬
‫ניסוי‪ :‬סטטיסטיקה שימושית‬
‫חלק א'‬
‫‪ .1‬רקע‬
‫‪ .2‬מושגי יסוד בסטטיסטיקה‬
‫‪ .3‬מטרות הניסוי‬
‫‪ .4‬תקציר הניסוי‬
‫חלק ב'‬
‫‪ .5‬דו"ח מכין‬
‫חלק ג'‬
‫‪ .6‬תאור מערכת הניסוי‬
‫‪ .7‬מהלך הניסוי‬
‫חלק ד'‬
‫‪ .8‬ניתוח תוצאות‬
‫‪ .9‬הנחיות לכתיבת הדו"ח המסכם‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 1‬מתוך ‪36‬‬
‫נספחים‪:‬‬
‫א‪ .‬טבלת הסתברות מצטברת (הפוכה) עבור התפלגות ‪.t‬‬
‫ב‪ .‬צמיגות תמיסות סוכרוז‬
‫ג‪ .‬צפיפות תמיסת סוכרוז טהור כתלות באחוז משקלי‬
‫ד‪ .‬פקודות מטלב שימושיות‬
‫ה‪ .‬מקורות‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 2‬מתוך ‪36‬‬
‫חלק א'‬
‫‪ .1‬רקע לניסוי‬
‫א‪ .‬מבוא‬
‫איכותן של תוצאות ניסוי נמדדות לפי תכנון ניסוי נכון‪ .‬לדוגמה‪ ,‬בניסוי שבו יש הרבה‬
‫רעש יש צורך לבצע מספר ניסויים רב יותר כדי לקבל תוצאות משמעותיות‪ .‬אקראיות‬
‫ורעש מהווים לעיתים קרובות חלק משמעותי בתוצאות של ניסוי‪ .‬כתוצאה מכך‪ ,‬כמעט‬
‫כל ניסוי יניב תוצאות שאינן זהות לניסוי אחר‪ .‬אז איך יידע חוקר לזהות תוצאות בעלות‬
‫משמעות‪ ,‬שאינן נובעות מרעשים?‬
‫לשם כך פותחו כלים ומבחנים סטטיסטיים רבים‪ .‬מבחנים אלו מבוססים על ידע של‬
‫התנהגותם הסטטיסטית של משתנים‪ ,‬והם יכולים לתת תשובות לשאלות מחקריות‬
‫(למשל אם קיים הבדל משמעותי בין שתי אוכלוסיות)‪ .‬טיב השאלה המחקרית ומבנה‬
‫הניסוי משפיעים באופן ישיר על היכולת שלנו להגיע למסקנות נכונות ושימושיות‪.‬‬
‫ב‪ .‬תמיסות סוכר‬
‫במעבדה זו נשתמש בתמיסות סוכר במים‪ .‬תמיסות אלו יוצרות נוזל ניוטוני בצמיגויות‬
‫שונות כתלות בכמות הסוכר המומס‪ .‬את כמות הסוכרוז המומס ניתן לכמת כאחוז‬
‫משקלי (‪ ,)%w/w‬או כמשקל הסוכרוז המומס ליחדת משקל של ‪ 100‬גרם תמיסה‪.‬‬
‫בתעשיות רבות בהן ויסות ריכוז הסוכר חשוב כשלעצמו (מיצים‪ ,‬יינות‪ ,‬סירופים וכו')‬
‫האחוז המשקלי של הסוכרוז בתמיסה יכול גם להינתן על ידי "מעלות בריקס"‬
‫(‪ ,)Degrees Brix‬מסומנות ‪ .ºBx‬עבור תמיסות סוכרוז בריכוזים של עד כ‪º68 Bx-‬‬
‫(קרוב לגבול המסיסות בטמפרטורת חדר במים מזוקקים)‪ ,‬ניתן לחשב את צמיגות‬
‫התמיסה ‪ µ‬על ידי משוואת אהרוניס הגלובלית‪:‬‬
‫(‪)1‬‬
‫‪1‬‬
‫‪1‬‬
‫]) ‪𝑒𝑥𝑝 [𝑎3 𝑒𝑥𝑝⁡(𝑎4 𝑐)(T − T‬‬
‫‪s‬‬
‫‪1‬‬
‫‪𝑎2‬‬
‫‪𝑎1 +‬‬
‫]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[‬
‫=𝜇‬
‫כאשר ]‪ [Sucrose‬הינו הריכוז ב‪ 𝑇𝑠 ,º Bx-‬הינה טמפ' ייחוס כלשהי (אבסולוטית)‪ ,‬ו‪-‬‬
‫‪ 𝑎4 , 𝑎3 𝑎2 , 𝑎1‬הינם קבועים הניתנים למציאה באופן אמפירי‪ .‬אם נניח כי אנחנו שומרים‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 3‬מתוך ‪36‬‬
‫על טמפרטורה קבועה‪ ,‬הרי שהסוגריים המרובעים מתאפסים‪ ,‬כל האקספוננט החיצוני‬
‫הופך ל‪ ,1-‬ונקבל את היחס המופשט‪:‬‬
‫‪1‬‬
‫)‪⁡⁡⁡⁡(2‬‬
‫‪𝑎2‬‬
‫]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[‬
‫‪𝑎1 +‬‬
‫=𝜇‬
‫אם נעלה בחזקת (‪ )-1‬את שני האגפים נקבל‪:‬‬
‫‪1‬‬
‫‪1‬‬
‫‪= 𝑎1 + 𝑎2‬‬
‫)‪⁡⁡⁡(3‬‬
‫]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[‬
‫𝜇‬
‫הגענו למשוואה הניתנת למידול ליניארי‪ .‬באיור ‪ 1‬מוצגת התלות של צמיגות תמיסת‬
‫סוכרוז‪-‬מים בריכוז הסוכרוז המומס (מוצג עבור ‪:)20ºC‬‬
‫איור ‪ :1‬תלות של צמיגות תמיסת סוכרוז טהור באחוז משקלי של סוכרוז‪ ,‬בטמפרטורת‬
‫‪.)Hoynak and Bollenback 1966( 20oC‬‬
‫במעבדה אנו נשערך את הקשר באמצעות מדידת הצמיגויות של חמש תמיסות סוכרים‬
‫בריכוזים ידועים‪ .‬מדידות הצמיגות ייעשו באמצעות ויסקומטר כדור מתגלגל‪ ,‬כפי‬
‫שיתואר בהמשך‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 4‬מתוך ‪36‬‬
‫ג‪ .‬ויסקומטר כדור מתגלגל‬
‫שיטה פשוטה למדידת צמיגותו של נוזל ניוטוני הוא ויסקומטר כדור מתגלגל‪ .‬ויסקומטר‬
‫זה מאפשר לחשב את צמיגות הנוזל על ידי מדידת הזמן שלוקח לכדור (בעל צפיפות‬
‫וגודל ידועים) להתגלגל דרך מרחק ידוע של הנוזל בתוך צינור בקוטר נתון‪ .‬בהנחה‬
‫שזרימת הנוזל סביב הכדור הינה למינארית (לפי מספר ריינולדס ידוע)‪ ,‬ניתן לקבל את‬
‫המהירות המקסימאלית 𝑥𝑎𝑚𝑈 שהכדור יכול להגיע אליה מתוך הקשר‪:‬‬
‫𝑓𝜌 ‪𝜌𝑏 −‬‬
‫𝑥∆‬
‫𝐶=‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(4‬‬
‫𝑡∆‬
‫𝜇‬
‫= 𝑥𝑎𝑚𝑈‬
‫כאשר 𝑓𝜌 ‪ 𝜌𝑏 ,‬הם צפיפויות הנוזל והכדור בהתאמה‪ 𝜇 ,‬היא הצמיגות הדינמית של הנוזל‬
‫עם יחידות של ‪ ,𝜇 = 𝑃𝑜𝑖𝑠𝑒 = 𝑃 = 𝑔𝑐𝑚−1 𝑠 −1‬ו‪ C-‬הינו פרמטר אמפירי המקשר בין‬
‫משתנים אלו לבין המהירות המקסימאלית‪ .‬הפרמטר ‪ C‬תלוי במבנה ובחומרים מהם‬
‫הוא מורכב המתקן בו משתמשים‪ .‬בניסוי נמדוד את הזמן 𝑡∆ הדרוש לכדור להתגלגל‬
‫מרחק מדוד וקבוע 𝑥∆‪ .‬נניח כי הכדור מגיע למהירותו המקסימאלית לפני כניסתו‬
‫לתחום המדידה בצינורית‪ ,‬והנוזל אחיד בכל נפח הכלי‪ .‬בנוסף נניח שהכדור מתגלגל‬
‫בנתיב ישר ולא מחליק (נכון עבור זוויות גלגול קטנות ביחס לאופקי)‪ .‬מנוסחה (‪)4‬‬
‫אפשר לקבל את הצמיגות הדינמית‪:‬‬
‫𝑓𝜌 ‪𝜌𝑏 −‬‬
‫)‪⁡⁡⁡⁡⁡⁡(5‬‬
‫𝑥𝑎𝑚𝑈‬
‫𝐶=𝜇‬
‫אם נניח כי מרחק הגלגול והצפיפות נשארים קבועים אז נקבל‪:‬‬
‫)‪𝜇 = 𝐵∆𝑡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(6‬‬
‫כאשר‪:‬‬
‫𝑓𝜌 ‪𝜌𝑏 −‬‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡(7‬‬
‫𝑥∆‬
‫‪B=C‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 5‬מתוך ‪36‬‬
‫ד‪ .‬תחום העבודה של ויסקומטר כדור מתגלגל‬
‫ויסקומטר כדור מתגלגל מסוגל לתת מדידה טובה ופשוטה של צמיגות נוזל בהנחה‬
‫שזרימת הנוזל מסביב לכדור המתגלגל הינה למינארית‪ .‬זרימה למינארית מוגדרת‬
‫כזרימה שכבתית ללא ערבוב בין השכבות והיא תתקיים כאשר מספר ריינולדס עבור‬
‫הכדור המתגלגל דרך נוזל ניוטוני יהיה קטן מערך קריטי מסוים‪ ,‬אותו נסמן ב‪.𝑅𝑒𝑐 -‬‬
‫את מספר ריינולדס עבור הכדור המתגלגל דרך נוזל ניוטוני נחשב באמצעות‪:‬‬
‫𝑓𝜌 𝑥𝑎𝑚𝑈 𝑓𝑓𝑒𝑑‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡(8‬‬
‫𝜇‬
‫= 𝑒‪R‬‬
‫כאשר 𝑓𝑓𝑒𝑑 הינו האורך המייצג את הנוזל הזורם מסביב לכדור (כפי שמוצב באיור ‪2‬‬
‫א') והוא שווה‪:‬‬
‫)‪𝑑𝑒𝑓𝑓 = 𝐷 − 𝑑⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(9‬‬
‫כאן‪ D ,‬ו‪ d-‬הינם קוטרו הפנימי והחיצוני של הכדור‪ ,‬בהתאמה‪ .‬ידוע כי קיים קשר בין‬
‫𝑑‬
‫𝑐𝑒𝑅 לבין יחס הקטרים 𝐷‪ ,‬כפי שמוצג באיור ‪2‬ב'‪ .‬ככל שהיחס גדל‪ ,‬כך גדל גם תחום‬
‫ה‪ Re-‬שבו ניתן למדוד את הצמיגות‪ .‬בניסויים שלנו‪ ,‬נוודא שמספר ריינולדס הינו‬
‫מתחת לערך הקריטי המתאים לקטרים שבהם נשתמש‪ ,‬בכדי להבטיח זרימה‬
‫למינארית בין הכדור לדופן הצינור‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 6‬מתוך ‪36‬‬
‫א‬
‫ב‬
‫איור ‪ :2‬א‪ .‬סכימת חתך דרך כדור קשיח ומלא המתגלגל בתוך צינור המלא בנוזל שאת‬
‫צמיגותו נרצה למדוד‪ - D .‬קוטרו הפנימי של הצינור‪ - d ,‬קוטרו של הכדור המתגלגל‪- deff ,‬‬
‫אורך מייצג של הנוזל הזורם סביב הכדור המתגלגל‪ .‬ב‪ .‬תלות של מספר ריינולדס קריטי‬
‫‪Rec‬‬
‫ביחס הקטרים של פנים הצינור (‪ )D‬והכדור (‪ ,)d‬עבור ויסקומטר כדור מתגלגל ( ‪Hubbard‬‬
‫‪.)and Brown 1943‬‬
‫‪ .2‬מושגי יסוד בסטטיסטיקה‬
‫משתנה אקראי‪:‬‬
‫אוסף ערכים שנמדדים על ידי ניסוי‪.‬‬
‫פונקציית הסתברות‪:‬‬
‫ההסתברות שהערך של המשתנה האקראי יהיה קטן מערך כלשהו שנקבע מראש‬
‫(משתנה פונקציית ההסתברות)‪ .‬אם מדובר במשתנה אקראי בדיד‪ ,‬אזי פונקציית‬
‫ההסתברות היא‪:‬‬
‫𝑘‬
‫)‪𝐹𝑥 (𝑥𝑘 ) = 𝑃(𝑋 ≤ 𝑥𝑘 ) = ∑ 𝑃(𝑋 = 𝑥𝑖 )⁡⁡⁡⁡(10‬‬
‫‪𝑖=1‬‬
‫𝑛 ≤ 𝑘 ≤ ‪𝑥𝑖 = 𝑥1 , … . , 𝑥𝑛 ⁡⁡&⁡⁡1‬‬
‫אם מדובר במשתנה אקראי רציף‪ ,‬אזי פונקציית ההסתברות היא‪:‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 7‬מתוך ‪36‬‬
‫𝑥‬
‫)‪𝐹𝑥 (𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥)𝑑𝑥⁡⁡⁡⁡⁡⁡⁡⁡(11‬‬
‫∞‪−‬‬
‫סכום ההסתברויות (במשתנה רציף‪ ,‬אינטגרל על פילוג ההסתברות) על כל תחומו של‬
‫המשתנה האקראי (מנורמל) שווה ל‪.1-‬‬
‫הערה‪ :‬פונקציית הסתברות נורמלית תקנית איננה בעלת ביטוי אנליטי‪ ,‬ולכן משתמשים‬
‫בערכים מטבלה‪ .‬ניתן לראות את ערכים אלו בטבלה בנספח עבור ∞ → 𝑓𝑑‪.‬‬
‫פונקציה של משתנה אקראי‪:‬‬
‫אם ‪ X‬הוא משתנה אקראי ו‪ Y-‬הוא פונקציה של ‪x‬‬
‫)‪Y = 𝑔(𝑋)⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(12‬‬
‫אזי גם ‪ Y‬הוא משתנה אקראי בעל פונקציית הסתברות המתוארת על ידי‪:‬‬
‫)‪𝐹𝑌 (𝑌) = 𝑃(𝑌 ≤ 𝑦) = 𝑃[𝑔(𝑋) ≤ 𝑦]⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(13‬‬
‫אך במקרה פרטי שבו ‪ g‬הינה פונקציה מונוטונית עולה‪ ,‬מתקיים‪:‬‬
‫)‪F𝑌 (𝑦) = 𝑃⌊𝑋 ≤ 𝑔−1 (𝑦)⌋ = 𝐹𝑋 ⌊𝑔−1 (𝑦)⌋ = 𝐹𝑥 (𝑥)⁡⁡⁡⁡⁡⁡(14‬‬
‫פילוג צפיפות הסתברות‪:‬‬
‫צפיפות ההסתברות מראה בצורה גרפית את הערכים של המשתנה האקראי המנורמל‪.‬‬
‫סך כל השטח מתחת לגרף פילוג צפיפות ההסתברות הוא ‪( 1‬מנורמל)‪ .‬אם המשתנה‬
‫האקראי בדיד‪ ,‬מדובר בערכים בדידים בלבד‪ ,‬אך אם המשתנה רציף או שנאספו "אינסוף"‬
‫ערכים בדידים‪ ,‬הפילוג יהיה עקומה רציפה‪ .‬צורת הגרף עצמה מוגדרת על ידי האקראי‬
‫יהיה בעל ערך מסוים‪ ,‬כשמסתכלים על השטח מתחת לגרף בטווח הערכים הרצויים‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 8‬מתוך ‪36‬‬
‫חישוב הסתברות מתוך צפיפות ההתפלגות‪:‬‬
‫נניח ש‪ X-‬משתנה אקראי רציף המתפלג בצורה נורמלית תקנית ואנחנו רוצים לחשב את‬
‫ההסתברות ש‪ X-‬יקבל ערך בין (‪ )-1‬ו‪ .2-‬באמצעות פונקציית הסתברות נורמלית תקנית‬
‫ואנחנו נרצה לחשב את ההסתברות ש‪ X-‬מקבל ערך קטן‪/‬שווה ל‪ 2-‬או ל‪ .)-1( -‬החסרה‬
‫של שתי ההסתברויות הללו תיתן לנו את ההסתברות הרצויה‪ .‬באופן כללי‪ ,‬ההסתברות ש‪-‬‬
‫‪ Y‬משתנה אקראי כללי (רציף) יקבל ערך בטווח שבין ‪ a‬ל‪ b-‬ניתן על ידי‪:‬‬
‫)‪P(𝑎 ≤ 𝑌 ≤ 𝑏) = 𝑃(𝑌 ≤ 𝑏) − 𝑃(𝑌 ≤ 𝑎) = 𝐹𝑌 (𝑏) − 𝐹𝑌 (𝑎)⁡⁡⁡⁡⁡(15‬‬
‫איור ‪ :3‬חישוב הסתברות ש‪ X -‬משתנה אקראי נורמאלי תקני יקבל ערך בין (‪ )-1‬ל‪.2 -‬‬
‫ממוצע מדגמי‪:‬‬
‫זהו הערך המשוערך שמשתנה אקראי אמור לקבל במצב אידיאלי‪ ,‬ללא רעשים או השפעות‬
‫מהסביבה‪ .‬משום שדגימות מניסוי הן בדידות‪ ,‬נתבונן על מקרה של משתנה אקראי בדיד‪.‬‬
‫אלגברית‪ ,‬הממוצע ניתן לשערוך על ידי‪:‬‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡(16‬‬
‫𝑖𝑥 ‪∑𝑛𝑖=1‬‬
‫𝑛‬
‫= ̅𝑋‬
‫שונות מדגמית‪:‬‬
‫מידת הפיזור של משתנה אקראי‪ .‬השונות מבטאת את הסטייה הממוצעת של דגימות‬
‫משתנה כלשהו מהממוצע של אותו המשתנה‪ .‬השונות היא ממצע ריבועי של השגיאות‪.‬‬
‫במקרה של משתנה אקראי בדיד‪ ,‬ניתן לשערך את השונות על ידי הביטוי‪:‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה קירשנר‬
‫עמוד ‪ 9‬מתוך ‪36‬‬
‫‪∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2‬‬
‫= 𝑆‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(17‬‬
‫‪𝑛−1‬‬
‫‪2‬‬
‫סטיית התקן המדגמית היא השורש של השונות המדגמית‪ .‬החזקה השנייה בתוך הסכום‬
‫קיימת כדי שההפרשים החיוביים לא יבטלו את ההפרשים השליליים‪ .‬החלוקה היא במספר‬
‫דרגות החופש (‪ .)n-1‬למעשה השונות היא משתנה אקראי‪ .‬כאשר מספר הדגימות גדול‬
‫מאוד המכנה הופך ל‪.)n(-‬‬
‫התפלגות נורמלית‪:‬‬
‫מתארת התפלגות טבעית ובסיסית‪ ,‬ועל כן היא נקראת נורמלית‪ .‬תופעות טבע ושלל‬
‫תופעות אחרות מראות את סוג התפלגות זו‪ ,‬שתוארה לראשונה על ידי גאוס‪ .‬התפלגות זו‬
‫היא בצורת פעמון והיא מתוארת על ידי פונקציית גאוס‪:‬‬
‫‪1‬‬
‫‪1 𝑥−𝜇 2‬‬
‫( ‪𝑒𝑥𝑝 [−‬‬
‫)‪) ]⁡⁡⁡⁡(18‬‬
‫𝜎 ‪2‬‬
‫𝜋‪𝜎√2‬‬
‫= )𝑥( 𝑥𝑓‬
‫גרף של פונקציית התפלגות‪ ,‬לדוגמה עבור ממוצע אפס וסטיית תקן יחידה (התפלגות‬
‫נורמלית תקנית) ‪ 𝜇 = 0, 𝜎 = 1‬ניתן לראות באיור ‪4‬א'‪ .‬כפי שרואים‪ ,‬ההתפלגות הזו היא‬
‫בעלת מבנה סימטרי סביב ה‪ ,0-‬שהוא הממוצע‪.‬‬
‫א‬
‫ב‬
‫איור ‪ :4‬א‪ .‬התפלגות נורמלית תקנית של משתנה אקראי עם ממוצע אפס וסטיית תקן‬
‫יחידה‪ .‬ב‪ .‬פונקצית הסתברות נורמלית תקנית מצטברת‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 10‬מתוך ‪36‬‬
‫קירשנר‬
‫פונקציית ההסתברות הנורמלית המצטברת‪:‬‬
‫ההסתברות שמשתנה אקראי ‪ X‬ניתנת על ידי אינטגרציה של הביטוי במשוואה ‪ 18‬מ‪-‬‬
‫(∞‪ )−‬עד ‪ .x‬איור ‪3‬ב' מציב את ההסתברות הזו כתלות ב‪ .x-‬אם נתייחס למשמעות של‬
‫פונקציית ההסתברות‪ ,‬נבחין כ יערכה הוא אפסי בערכים נמוכים של ‪ ,x‬ושואפת ל‪1-‬‬
‫בערכים גבוהים‪ .‬המשמעות היא שההסתברות הולכת וקטנה ש‪ x-‬יקבל ערך שקטן‬
‫מהממוצע‪ .‬ההסתברות ש‪ x-‬יקבל ערך קטן מ‪ ∞-‬הוא ‪ ,1‬כלומר מלאה‪.‬‬
‫התפלגות ‪:t‬‬
‫זו התפלגות המתארת את הערכים הצפויים למדגם מתוך אוכלוסייה המקיימת התפלגות‬
‫נורמלית כאשר גודלו של המדגם קטן וסטיית התקן של האוכלוסייה אינה ידועה ‪.‬הצורה‬
‫הכללית של התפלגות ‪ t‬דומה לזו של ההתפלגות הנורמלית וכאשר מספר הפרטים במדגם‬
‫גדול היא אף זהה לה‪ .‬בהרבה מקרים ניסיוניים איננו יודעים את הפרמטרים האמיתיים‬
‫‪ 𝜇, σ‬של התפלגות נורמלית‪ .‬לכן משתמשים בהתפלגות ‪ ,t‬שלוקחת בחשבון את האי‪-‬ודאות‬
‫הקיימת בלקיחת דגימות אינסופיות‪ ,‬ומשערכת את התפלגותה האמיתית‪ .‬קיימות אינסוף‬
‫התפלגויות ‪ ,t‬לעומת התפלגות נורמלית‪ .‬ההתפלגות מקבלת ערכים שונים כתלות במספר‬
‫הדגימות שלוקחים מהאוכלוסייה שאותה בוחנים‪ .‬עקרון זה נקרא דרגות חופש ( ‪df,‬‬
‫‪ ,)degrees of freedom‬המסומן על ידי ‪ .ν‬במקרה הספציפי של התפלגות ‪ ,t‬מספר דרגות‬
‫החופש שווה למספר הדגימות פחות אחד‪ .‬באופן מתמטי ככל שמספר דרגות החופש גדל‪,‬‬
‫כך התפלגות ‪ t‬מתקרבת יותר להתפלגות נורמלית (ראו גרף להלן)‪.‬‬
‫איור ‪ :5‬התפלגויות ‪ t‬כתלות במספר דרגות החופש ‪ .v‬ככל שישנן יותר דרגות חופש‪,‬‬
‫כך ההתפלגות הולכת ונעשית צרה יותר‪ ,‬גובה המקסימום גדל‪ ,‬וצורתה הכללית‬
‫מתקרבת לזו של התפלגות נורמלית תקנית‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 11‬מתוך ‪36‬‬
‫קירשנר‬
‫השערות (‪:)Hypotheses‬‬
‫השערה מחקרית הינה התוצאה הצפויה בעקבות ניסוי‪ .‬התפקיד של השערה סטטיסטית‬
‫יהיה לוודא שהתוצאה שהתקבלה אכן משמעותית‪ .‬חוקר יכול לרצות להוכיח את השערתו‬
‫שתרופה חדשה תרפא מחלה מסוימת ולשם כך הוא יבצע ניסוי ויפיק נתונים‪ .‬אם הוא יבצע‬
‫את הניסוי על מספר אנשים‪ ,‬וכולם הגיבו לתרופה באותה צורה‪ ,‬מבחינה סטטיסטית‬
‫השערתו לא הוכחה או הופרכה‪ ,‬אלא דווקא נתמכה ברמת סיכון מסוימת הנגרמת מאי‬
‫וודאות סטטיסטית‪.‬‬
‫השערות סטטיסטיות‪:‬‬
‫הן הבסיס של מבחן סטטיסטי‪ .‬במבחן סטטיסטי‪ ,‬ישנן בדרך כלל שתי השערות‪ ,‬הנקראות‬
‫השערת האפס ( ‪ )𝐻0‬וההשערה החלופית ( ‪ .)𝐻1‬המטרה היא לדחות את השערת האפס‪.‬‬
‫ההשערה החלופית היא בדרך כלל ההשערה המחקרית‪ ,‬היא זו שהחוקר היה רוצה‬
‫להוכיח‪ .‬המבחן הסטטיסטי בוחן את ההסתברות שהשערת האפס אכן ניתנת לדחייה‬
‫ושההשערה החלופית מתקבלת‪ .‬המגבלה העיקרית של המבחן היא שאינו יכול להוכיח את‬
‫‪ 𝐻1‬חד משמעית אלא רק יכול לדחות את ‪ 𝐻0‬ביחס ל‪ 𝐻1 -‬ברמת סיכון מסוימת הנקראת‬
‫מובהקות‪.‬‬
‫רמת מובהקות (𝛂)‪:‬‬
‫היא הסף לקביעה אם ניתן לדחות את השערת האפס‪ .‬היא נותנת גם ידע לחוקר על חוזק‬
‫התוצאות של המבחן‪ .‬ככל שרמת המובהקות הנדרשת לניסוי היא קטנה יותר‪ ,‬כך המבחן‬
‫מחמיר יותר‪ .‬להחמרה ולהקלה יש השפעה על התוצאות של המבחן‪.‬‬
‫מבחנים סטטיסטיים‪:‬‬
‫כל מבחן סטטיסטי בנוי משלושה רכיבים עיקריים‪:‬‬
‫א‪ .‬הגדרת ההשערות הסטטיסטיות ‪.𝐻0 , 𝐻1‬‬
‫ב‪ .‬ציון ההנחות שאותן יש להניח‪ .‬חשוב לדעת מה אנחנו מניחים ולכן נדע גם מהן‬
‫המגבלות של השיטה‪ .‬במעבדה זו נעסוק רק במשתנים אקראיים המתפלגים נורמלית‪,‬‬
‫ובעלי סטיית תקן שווה אך לא ידועה מראש‪ .‬חשוב לזכור כי כל מבחן דורש הנחות‬
‫מסוימות ויתכן מאוד שתיתקלו במהלך הקריירה שלכם במבחנים סטטיסטיים בהם‬
‫תדרשו להניח התפלגות אחרת מהנורמלית‪ .‬חשוב לשים לב לכך! די בהנחה שגויה‪,‬‬
‫ומסקנה יכולה להיות מוטעית לחלוטין‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 12‬מתוך ‪36‬‬
‫קירשנר‬
‫ג‪ .‬הגדרת רמת המובהקות הנדרשת‪ ,‬מסומנת על ידי 𝛼‪.‬‬
‫מבחן ‪ t‬השוואתי (‪:)Student's t-test for differences‬‬
‫במבחן זה נבדקים הבדלים בממוצעים של שתי התפלגויות נורמליות‪ ,‬כאשר ההנחה היא‬
‫שסטיות התקן שלהן שוות אך לא ידועות‪ .‬נקרא להתפלגות אחת ⁡ ‪ 𝑋1‬ולשנייה ‪ .𝑋2‬נניח‬
‫שההתפלגויות של האוכלוסיות הן בעלות צפיפות כמוצג באיור ‪ .6‬מכל אוכלוסייה ניקח ‪𝑛1‬‬
‫𝑋 ו‪̅̅̅2 ⁡-‬‬
‫ו‪ 𝑛2 -‬דגימות בהתאם (⁡ ‪̅̅̅1‬‬
‫𝑋 הם הממוצעים של הדגימות)‪ .‬אם נרצה לבחון האם ‪𝑋1‬‬
‫שונה משמעותית מ‪ ,𝑋2‬אנו נבצע מבחן דו‪-‬צדדי‪ ,‬וההשערות למבחן זה הינן‪:‬‬
‫⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡ ‪𝐻𝑜 :⁡𝜇1 = 𝜇2‬‬
‫)‪𝐻1 :⁡𝜇1 ≠ 𝜇2 ⁡⁡⁡⁡⁡(19‬‬
‫ראשית כדי להבין את עקרונות המבחן‪ ,‬נתבונן במקרה פשוט יותר‪ ,‬שהוא מבחן חד צדדי‪:‬‬
‫⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡ ‪𝐻𝑜 :⁡𝜇1 = 𝜇2‬‬
‫)‪𝐻1 :⁡𝜇1 < 𝜇2 ⁡⁡⁡⁡⁡(20‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 13‬מתוך ‪36‬‬
‫קירשנר‬
‫איור ‪ :6‬שתי התפלגויות נורמליות‪ ,‬בעלות הפרש ממוצע ‪. d‬‬
‫ההפרש בין ממוצעי ההתפלגויות יסומן ̅𝑑‪ .‬למרות שנראה שההתפלגויות בעלות ממוצעים‬
‫שונים‪ ,‬האם ̅𝑑 גדול מספיק באמות מידה סטטיסטיות? כדי לענות על שאלה זו ולנסות ולדחות‬
‫את השערת האפס‪ ,‬צריכים לחשב משתנה אקראי שייצג את ̅𝑑 מתוך ההתפלגויות ⁡ ‪ 𝑋1‬ו‪𝑋2 ⁡-‬‬
‫וההשערות הסטטיסטיות ‪ 𝐻0‬ו‪ .𝐻1 -‬משתנה אקראי חדש זה‪ ,‬אשר מתפלג לפי התפלגות ‪,t‬‬
‫נקרא גם סטטיסטי המבחן והוא מחושב על ידי נוסחה ‪.22‬‬
‫מספר דרגות החופש של המבחן מחושבות לפי‪:‬‬
‫)‪𝜈 = 𝜈1 + 𝜈2 = (𝑛1 − 1) + (𝑛2 − 1) = 𝑛1 + 𝑛2 − 2⁡⁡⁡⁡(21‬‬
‫𝛿 ‪(𝑋̅2 − 𝑋̅1 ) − (𝜇2 − 𝜇1 ) 𝑑̅ −‬‬
‫=‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(22‬‬
‫𝑑𝑆‬
‫𝑑𝑆‬
‫=𝑡‬
‫בנוסחה ‪ 21‬מתקיים כי ‪ ,𝛿 = 𝜇2 − 𝜇1‬ו‪ 𝑆𝑑 -‬מייצג את השונות המשוערכת של ההפרש בין‬
‫המשתנים האקראיים והוא מחושב על ידי השונות המדגמית של ‪ X1‬ו‪ X2 ⁡-‬בנוסחה ‪:22‬‬
‫‪𝑠1 2 𝑠2 2‬‬
‫√ = 𝑑𝑆‬
‫‪+‬‬
‫)‪⁡⁡⁡⁡⁡⁡(23‬‬
‫‪𝑛1‬‬
‫‪𝑛2‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 14‬מתוך ‪36‬‬
‫קירשנר‬
‫במבחן אנו מעוניינים לדחות את ההשערה שבה ‪ .𝛿(𝐻0 ) = 𝛿0 = 0‬עבור השערת האפס‪,‬‬
‫)‪ 𝑡𝐻0 = 𝑡(𝛿0 ) = 𝑡(0‬עבור ההשערה המשנית‪.𝑡𝐻1 = 𝑡(𝛿1 ) ,‬‬
‫כדי להמשיך בניתוח הסטטיסטי‪ ,‬נשאלת השאלה מהי ההסתברות ש‪ t-‬למעשה מתפלג סביב‬
‫אפס (כלומר השערת האפס נכונה)? אם ההסתברות הזו תהיה קטנה מספיק‪ ,‬נוכל להסיק‬
‫שהוא לא מתפלג סביב אפס ולכן גם ̅𝑑 שונה מאפס‪ ,‬וניתן יהיה לדחות את ⁡ ‪ .𝐻0‬הסתברות זו‬
‫נקראת ה‪ p-value -‬של המבחן‪ .‬ערך זה מבטא את מובהקות התוצאה‪ .‬זו ההסתברות לקבלת‬
‫תוצאה קיצונית (בכיוון ‪ ) 𝐻1‬לפחות כמו התוצאה שהתקבלה בניסוי‪ ,‬בהנחה שהשערת האפס‬
‫נכונה‪ .‬הערך הגדול ביותר ש‪ p-value-‬יכול לקבל בשביל לדחות את ⁡ ‪ 𝐻0‬הוא רמת המובהקות‬
‫𝛼‪.‬‬
‫) ‪𝑃𝑣𝑎𝑙𝑢𝑒 = 𝑃𝐻0 (𝑚𝑖𝑛𝑖𝑚𝑢𝑛⁡𝑓𝑜𝑟⁡𝑟𝑒𝑗𝑒𝑐𝑡𝑖𝑛𝑔⁡𝐻0‬‬
‫אם 𝑒𝑢𝑙𝑎𝑣_‪ 𝛼 > P‬נדחה את השערת האפס ברמת מובהקות 𝛼‪.‬‬
‫אם 𝑒𝑢𝑙𝑎𝑣_‪ 𝛼 < P‬לא נדחה את השערת האפס ברמת מובהקות 𝛼‪.‬‬
‫שגיאה מסוג ‪:I‬‬
‫מבוטאת על ידי רמת המובהקות‪ ,‬זו ההסתברות ל‪ .false positive-‬אם ה‪ p-value-‬קטן מ‪,𝛼-‬‬
‫נוכל לדחות את השערת האפס‪ .‬את הערך של 𝛼 צריך לקבוע מראש לפני תחילת הניסוי‪ .‬ברוב‬
‫המקרים נהוג לקבוע‬
‫‪ 𝛼 = 0.05‬או ‪ , 𝛼 = 0.01‬אך לעתים נדרש אף להחמיר‪ .‬כדי לבצע את המבחן הסטטיסטי‪ ,‬יש‬
‫צורך לתרגם את 𝛼 לערך הקריטי ∗ 𝑡 לבדיקה שתאפשר דחיית ‪ .𝐻0‬במקרה של מבחן חד צדדי‪,‬‬
‫מוצאים את ∗ 𝑡 מתוך טבלה (נספח א')‪ ,‬כך שמתקיים‪:‬‬
‫)‪𝛼 = P(𝑡𝐻0 > 𝑡 ∗ , 𝜈) = 𝑃 (𝑡𝐻0 > 𝑡1−𝛼 (𝜈))⁡⁡⁡⁡(24‬‬
‫⁡⁡⁡‪𝜈 = 𝑛1 + 𝑛2 − 2‬‬
‫שגיאה מסוג ‪:II‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 15‬מתוך ‪36‬‬
‫קירשנר‬
‫מבוטאת על ידי 𝛽‪ .‬מייצגת את ההסתברות ש‪ t-‬לא מתפלג לפי ‪ 𝐻0‬למרות שלא דחינו אותה‬
‫(‪ .)false negative‬אם קיבלנו הפרש ̅𝑑 ונניח כי ‪ 𝛿(𝐻1 ) = 𝛿1‬שמתאים להשערה ‪ 𝐻1‬שלנו‬
‫אזי‪:‬‬
‫‪𝑑̅ − 𝛿1‬‬
‫( 𝑃 = )𝜈 ‪𝛽 = P(𝑡 ∗ > 𝑡𝐻1 ,‬‬
‫)‪> 𝑡, 𝜈)⁡⁡⁡⁡⁡⁡⁡(25‬‬
‫𝑑𝑆‬
‫‪𝜈 = 𝑛1 + 𝑛2 − 2‬‬
‫בחירת ‪ 𝛿1‬הינה שרירותית עבור חישוב 𝛽‪ .‬בהמשך נראה כיצד נשתמש בבחירת ‪ 𝛿1‬בשביל‬
‫לתכנן ניסוי 𝛽 רצוי‪.‬‬
‫באיור ‪ 7‬מוצגות שתי התפלגויות‪ :‬השמאלית מתארת את ההתפלגות של ̅𝑑 תחת ‪ 𝐻0‬והימנית‬
‫את ההתפלגות תחת ‪ .𝐻1‬רמת המובהקות שלנו תכתיב את ה‪( 𝑡 ∗ -‬סף הדחייה) ואת המשתנה‬
‫הסטטיסטי ‪ )t-statistic( t‬גדול מ‪ .𝑡 ∗ -‬ניתן לראות באיור כי ניתן לדחות את ‪ .𝐻0‬השגיאה מסוג‬
‫‪ II‬מחושבת על הזנב של ההתפלגות של ‪( 𝐻1‬לכן לוקחים 𝛿 = ) ‪ 𝛿(𝐻1‬שנכנס לתוך התחום של‬
‫התפלגות ‪.𝐻0‬‬
‫איור ‪ :7‬סכימת דחיית השערת האפס‪ ,‬והשגיאות‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 16‬מתוך ‪36‬‬
‫קירשנר‬
‫הסבר לאיור‪:‬‬
‫פעמון שמאלי‪ -‬התפלגות ‪ d‬בהנחת ‪.H0‬‬
‫פעמון ימני‪ -‬התפלגות ‪ d‬בהנחת ‪.H1‬‬
‫שטח מסומן בירוק‪ -‬שגיאה מסוג ‪ )β( II‬של המבחן הסטטיסטי‪.‬‬
‫שטח מסומן מימין בפסים כחולים ‪ -‬שגיאה מסוג ‪ )α( I‬של המבחן הסטטיסטי‪.‬‬
‫שטח מסומן מימין לקו השחור נקרא "‪ "t-statistic‬ובאדום‪ p-Value -‬של תוצאות הניסוי‪.‬‬
‫ההסתברויות המשלימות של שתי השגיאות הן‪ :‬הדיוק (‪ )specificity‬והעוצמה (‪.)power‬‬
‫הדיוק ( ‪ (1 − α‬מתייחס להסתברות שאי דחיית ‪ 𝐻0‬נכונה‪.‬‬
‫העוצמה (‪ )1 − β‬מתייחסת להסתברות ש‪ 𝐻1 -‬הוא נכון בהינתן שדחינו את ‪.𝐻0‬‬
‫כאשר נחשב את העוצמה נידרש להניח ̅𝑑 מסוים (נניח ש‪) 𝜇1 < 𝜇2 -‬ונחשב את 𝛽‪.‬‬
‫קיימת אפשרות לנצל את ההנחה של ̅𝑑 בכדי לתכנן ניסוי כך שתתקבל עוצמה ‪ 1 − β‬רצויה‪.‬‬
‫טבלה ‪ 1‬מסכמת את ‪ 2‬סוגי השגיאות ואת ההסתברויות המשלימות שלהן‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 17‬מתוך ‪36‬‬
‫קירשנר‬
‫טבלה ‪ :1‬שני סוגי השגיאות וההסתברויות המשלימות שלהם‪.‬‬
‫דחיית ‪𝐻0‬‬
‫תוצאה אי דחיית ‪𝐻0‬‬
‫אמת‬
‫‪ 𝐻0‬נכונה‬
‫שגיאה מסוג ‪I‬‬
‫תוצאה=אמת‬
‫𝛂‪𝟏−‬‬
‫‪ 𝐻0‬לא נכונה‬
‫𝛂 ‪False Positive‬‬
‫‪Specificity‬‬
‫קבלה שגויה של ההנחה 𝟏𝑯‬
‫שגיאה מסוג ‪II‬‬
‫תוצאה=אמת‬
‫𝛃‪𝟏−‬‬
‫𝜷 ‪False negative‬‬
‫קבלה שגויה של ההנחה 𝟎𝑯‬
‫עוצמה‬
‫מבחן דו צדדי‪:‬‬
‫במבחן דו צדדי נרצה לבדוק אם ממוצע של אוכלוסייה אחת שונה מזה של אוכלוסייה שנייה‪.‬‬
‫ה ‪ P-value‬יחושב תחת התפלגות ‪ t‬משני צדי ההתפלגות‪ .‬לכן‪ ,‬ה‪ 𝛼-‬שקבענו מתחלק באופן‬
‫שווה בין שני צדי התפלגות ‪.t‬‬
‫כדי לדחות את השערת האפס נדרוש‪:‬‬
‫𝜶‬
‫∗𝒕 > 𝒕 ‪. 𝟐 = 𝑷(𝒕 < −𝒕∗ , 𝝂) = 𝑷(𝒕 > 𝒕∗ , 𝝂) ,‬‬
‫עדיין מתקיים כי ‪ 𝜈 = 𝑛1 + 𝑛2 − 2‬כמו במבחן החד‪-‬צדדי‪ .‬בהתאם לכך‪ ,‬ערך הסף יחושב על‬
‫ידי )𝜈( 𝛼‪.𝑡 ∗ = 𝑡1−‬‬
‫‪2‬‬
‫בגלל שההתפלגות סימטרית‪ ,‬בודקים רק אחת מההסתברויות הנ"ל‪.‬‬
‫תכנון גודל מדגם‪-‬אנליזת עוצמה עבור מבחן ‪ t‬השוואתי‪:‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 18‬מתוך ‪36‬‬
‫קירשנר‬
‫ככל שמספר הדגימות גדל‪ ,‬כך גם מספר דרגות החופש של התפלגות ‪ t‬גדל והוא מקרב ברמה‬
‫טובה יותר את הפילוג הנורמלי‪ .‬לפי כך‪ ,‬נרצה מדגם גדול ככל האפשר כדי לשפר את‬
‫הסטטיסטיקה‪ .‬במקרים כמו מחקרים קליניים אנושיים וניסויים בחיות רצוי להקטין ככל האפשר‬
‫את מספר הדגימות הנדרש כדי להקטין עלויות וסיכונים‪ .‬האופטימיזציה אותה נבצע היא תכנון‬
‫גודל מדגם שיבוצע על ידי בחינת עוצמת המבחן הסטטיסטי‪.‬‬
‫כדי לבצע תכנון גודל מדגם בשיטת אנליזת עוצמה‪ ,‬יש לקבוע את רמת המובהקות 𝛼‪ ,‬את‬
‫העוצמה הרצויה למבחן 𝛽 ‪ 1 −‬ואת ההבדל ̅𝑑 המינימלי המשמעותי 𝑛𝑖𝑚̅𝑑 שאותו נרצה לזהות‬
‫באמצעות המבחן‪ .‬במקרים רבים מקובל כי ‪ ,1 − 𝛽 = 0.8, 𝛼 = 0.05‬אך ניתן לבצע את התכנון‬
‫לפי ערכים אחרים‪ .‬ככל שמקטינים את רמת המובהקות ומגדילים את העוצמה‪ ,‬כך תוצאות‬
‫המבחן יותר אמינות (יותר מחמירות)‪ .‬חשוב לציין שאם בוחרים 𝛽 ‪ 𝛼,‬קטנים מדי‪ ,‬המסקנות‬
‫יכולות להוביל ל‪ ,false negative‬למשל אם נחליט שאין הבדל בין ‪ 2‬אוכלוסיות כאשר למעשה‬
‫כן יש הבדל‪.‬‬
‫למציאת מספר הדגימות ‪ n‬המינימלי הדרוש מכל קבוצה‪ ,‬נניח כי השונות ידועה (מנחשים‬
‫אותה אם אין ידע קודם) וקבועה עבור ‪ 2‬אוכלוסיות ‪.𝑋1⁡ , 𝑋2‬‬
‫נניח כי נרצה למצוא 𝑛𝑖𝑚̅𝑑 בין הממוצעים (תוחלות) של האוכלוסיות ‪ 𝜇1‬ו‪ ,𝜇2 -‬במבחן חד צדדי‪,‬‬
‫כפי שמתואר במשוואה ‪ ,20‬שבו יתקבלו 𝛽 ‪ 𝛼,‬מסוימים‪.‬‬
‫מכייון שאנו דנים במציאת גודל המדגם המינימלי‪ ,‬אנו לא יודעים את מספר דרגות החופש ‪ν‬‬
‫שיתקבלו במבחן‪ .‬לכן אנו נניח כי ישנן אינסוף דרגות חופש‪ .‬במקרה כזה‪ ,‬אנו עוסקים‬
‫בהתפלגות נורמלית תקנית והיא מסומנת על ידי האות ‪:Z‬‬
‫𝑝𝑍 = )∞ → 𝜈( 𝑝𝑡‪.‬‬
‫𝑝𝑍 = )∞ → 𝜈( 𝑝𝑡‬
‫)‪𝑝 = 𝑃(𝑡 < 𝑡𝑝 , 𝜈 → ∞)⁡⁡⁡⁡⁡(26‬‬
‫מצד אחד‪ ,‬נדרוש שההסתברות 𝛼 תקיים עבור ערך קריטי מסוים ‪: 𝑚1‬‬
‫‪𝑚1 − 𝜇1‬‬
‫)‪)⁡⁡⁡⁡⁡(27‬‬
‫‪𝜎𝑥1‬‬
‫> 𝑍( 𝑃 = ) 𝛼‪𝛼 = 𝑃(𝑍 > 𝑍1−‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 19‬מתוך ‪36‬‬
‫קירשנר‬
‫ומצד שני‪ ,‬נדרוש שההסתברות 𝛽 תקיים עבור ערך קריטי מסוים ‪:𝑚2‬‬
‫‪𝜇2 − 𝑚2‬‬
‫)‪)⁡⁡⁡⁡⁡⁡(28‬‬
‫‪𝜎𝑥2‬‬
‫< 𝑍( 𝑃 = ) 𝛽‪1 − 𝛽 = 𝑃(𝑍 < 𝑍1−‬‬
‫בביטוי ‪ ,28‬הסדר הוחלף בין ‪ 𝜇2‬ו‪ 𝑚2 -‬כדי שהשבר יהיה חיובי‪ .‬השונויות ‪ 𝜎𝑥1‬ו‪ 𝜎𝑥2 -‬מייצגות‬
‫את שונויות הדגימה של המשתנים האקראיים ‪ 𝑋1‬ו‪.𝑋2-‬‬
‫כאשר דוגמים ‪ n‬פעמים באוכלוסייה בעלת שונות ידועה 𝜎‪ ,‬השונות של המדגם תהיה‬
‫שהנחנו כי השונויות של ‪ 𝑋2 , 𝑋1‬זהות‪ ,‬מתקבל כי‪:‬‬
‫)‪⁡⁡⁡⁡⁡⁡⁡(29‬‬
‫𝜎‬
‫𝑛√‬
‫= ‪𝜎𝑥1 = 𝜎𝑥2‬‬
‫נציב את נוסחה (‪ )29‬בתוך הביטוי עבור 𝛼𝑍 ונקבל‪:‬‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(30‬‬
‫‪𝑚1 − 𝜇1‬‬
‫𝑛√‪𝜎⁄‬‬
‫= 𝛼𝑍‬
‫ומכאן נובע שהערך הקריטי של רמת המובהקות הוא ‪:‬‬
‫)‪𝑍𝛼 ⁡⁡⁡⁡⁡⁡(31‬‬
‫𝜎‬
‫𝑛√‬
‫‪𝑚1 = 𝜇1 +‬‬
‫במבחן הסטטיסטי חישוב ההסתברויות 𝛽 ‪ 𝛼,‬נעשה עבור אותו ערך קריטי ולכן‪:‬‬
‫)‪𝑚1 = 𝑚2 ⁡⁡⁡⁡⁡⁡⁡(32‬‬
‫בהצבת נוסחאות (‪ )29‬ו‪ )31(-‬לתוך הביטוי 𝛽‪ 𝑍1−‬מתקבל‪:‬‬
‫𝜎‬
‫) 𝛼𝑍‬
‫𝑛√‬
‫)‪⁡⁡⁡⁡⁡⁡(33‬‬
‫𝑛√‪𝜎 ⁄‬‬
‫‪𝜇2 − (𝜇1 −‬‬
‫= 𝛽‪𝑍1−‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 20‬מתוך ‪36‬‬
‫קירשנר‬
‫𝜎‬
‫𝑛√‬
‫‪ .‬מכיוון‬
‫ולאחר העברת אגפים נקבל‪:‬‬
‫)‪(𝑍1−𝛽 + 𝑍𝛼 ) = 𝜇2 − 𝜇1 = 𝑑̅𝑚𝑖𝑛 ⁡⁡⁡⁡⁡⁡⁡(34‬‬
‫𝜎‬
‫𝑛√‬
‫לבסוף‪ ,‬נמצא את ה‪ n-‬המינימלי לתכנון הניסוי‪:‬‬
‫‪2‬‬
‫𝜎‬
‫[ = 𝑛𝑖𝑚𝑛‬
‫)‪(𝑍1−𝛽 + 𝑍𝛼 )] ⁡⁡⁡⁡⁡(35‬‬
‫𝑛𝑖𝑚̅𝑑‬
‫מבחן לטיב התאמה ליניארי‪:‬‬
‫במעבדת "שערוך וקידום שגיאות"‪ ,‬התאמתם קו בשיטת הריבועים הפחותים עם משוואה מסוג‬
‫‪ .𝑦 = 𝐿1 𝑥 + 𝐿0‬כמו כן‪ ,‬ראינו כיצד לחשב את מקדם טיב המתאם ‪ .r‬מקדם הטיב אינו מייצג‬
‫בלעדי או טוב במיוחד לאמינות הסטטיסטית של המתאם‪ ,‬אותה יש לבדוק בנפרד‪ .‬כיצד נבדוק‬
‫אם הקו שהותאם בשיטה זו הוא אמין סטטיסטית?‬
‫לשם כך ישנו מבחן ‪ t‬על השיפוע ‪ 𝐿1‬שנמצא‪ .‬אם ‪ 𝛬1‬מייצג את ערכו האמיתי של ‪ ,𝐿1‬אזי‬
‫ההשערה הסטטיסטית הינה‪:‬‬
‫)‪𝐻0 :⁡𝛬1 = 0⁡⁡⁡⁡⁡⁡⁡⁡(36‬‬
‫⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡‪𝐻1:⁡ 𝛬1 ≠ 0‬‬
‫למעשה‪ ,‬במבחן זה בודקים אם הקו שהתאמנו אינו יותר טוב מאשר קו אופקי (שיפוע שווה ‪.)0‬‬
‫כלומר בודקים אם הערכים שמדדנו הם אקראיים סביב קבוע כלשהו וניתנים לחיזוי על ידי‬
‫הממוצע שלהם בלבד (מדובר בקבוע ‪ 𝐿0‬בהתאמת הקו)‪ .‬שימו לב שמבחן זה הינו דו צדדי‪.‬‬
‫מספר דרגות החופש במבחן ‪ t‬זה הינו מספר הדגימות (סה"כ) פחות ‪( 2‬כי ישנם ‪ 2‬פרמטרים‬
‫במשוואה שהותאמה)‪:‬‬
‫)‪𝑡 ∗ = 𝑡1−𝛼 (𝑛 − 2)⁡⁡⁡⁡⁡⁡⁡(37‬‬
‫‪2‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 21‬מתוך ‪36‬‬
‫קירשנר‬
‫המשתנה הסטטיסטי ‪ t‬המחושב הינו‪:‬‬
‫)‪(𝐿1 − 0‬‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(38‬‬
‫‪𝑆𝐿1‬‬
‫=𝑡‬
‫כאשר השונות של השיפוע ‪ 𝐿1‬משוערך על ידי‪:‬‬
‫‪𝑆2‬‬
‫𝑛 √=‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡(39‬‬
‫‪∑𝑖=1(𝑥𝑖 − 𝑋̅)2‬‬
‫‪𝑆𝐿1‬‬
‫הממוצע הוא של כל הנתונים‪ .‬שימו לב שהערך ‪ 𝑆 2‬הוא השונות המדגמית לפי נוסחה ‪ 17‬והיא‬
‫ביחס להתאמה הליניארית‪.‬‬
‫הערה חשובה‪ :‬אם להתאמה שלכם 𝜋 פרמטרים‪ ,‬מספר דרגות החופש יהיה‬
‫𝜋 ‪.𝜈 = 𝑛 −‬‬
‫‪ .3‬מטרות הניסוי‬
‫א‪ .‬לימוד תכנון ניסוי תוך התחשבות בסטטיסטיקה‪.‬‬
‫ב‪ .‬ביצוע בדיקות סטטיסטיות על תוצאות ניסיוניות להוכחת השערה‪.‬‬
‫ג‪ .‬למדתם סטטיסטיקה? בוא נראה מה אפשר לעשות איתה‪.‬‬
‫‪ .4‬תקציר הניסוי‬
‫מדענים בכלל‪ ,‬ומהנדסים בפרט‪ ,‬משתמשים בכלים סטטיסטיים כדי להדגים את‬
‫המשמעותיות של התוצאות ולהסיק מסקנות ברות משמעות‪ .‬בניסוי של השערוך והשגיאות‬
‫למדתם על סוגי השגיאות השונות וכיצד לחשבן‪ .‬בניסוי זה נלמד על התיאוריה והשימוש‬
‫במבחנים סטטיסטיים כדי להעריך אם קיים הבדל משמעותי בין התוצאות של שני הניסויים‪.‬‬
‫במהלך הניסוי נשתמש בצינורית פלסטיק המלאה בתמיסות של סוכרוז בריכוזים שונים‪.‬‬
‫נמדוד את הצמיגות של תמיסות אלו בעזרת כדור מתגלגל ונבנה עקומת סטנדרט לריכוזים‬
‫ידועים של הסוכר‪ .‬לאחר מכן‪ ,‬נמדוד את צמיגויתיהן של שתי תמיסות סוכר בעלות ריכוזים‬
‫לא ידועים ונשווה ביניהן בעזרת מבחן סטטיסטי‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 22‬מתוך ‪36‬‬
‫קירשנר‬
‫חלק ב'‬
‫‪ .5‬דו"ח מכין‬
‫נא להגיש את הדו"ח המכין יחד עם קוד המטלב לפני ביצוע הניסוי במעבדה‪ .‬לפירוט על‬
‫פקודות המטלב‪ ,‬נא להסתכל בסוף הפרוטוקול בנספח א'‪.‬‬
‫‪ .1‬חשבו את משקל הסוכרוז שיש לערבב עם ‪ 30‬גרם מים מזוקקים כדי לקבל תמיסות‬
‫סוכרוז בעלות ריכוזים של ‪50ºBx , 40ºBx ,30ºBx, 20ºBx‬‬
‫ו‪( .60ºBx-‬מעלה בריקס היא אחוז משקלי של הסוכר בתמיסה‪ .‬הראו דוגמת חישוב‬
‫עבור אחד הריכוזים)‪.‬‬
‫‪ .2‬ויסקומטר כדור נופל מערב מדידת זמן נפילתו של כדור בתוך נוזל צמיג ניוטוני‪.‬‬
‫בויסקומטר זה‪ ,‬המרחק בין הכדור לדפנות צריך להיות גדול לפחות פי ‪ 3‬מקוטר הכדור‬
‫מבלי להזניח את הדפנות‪ .‬עבור ויסקומטר מסוג זה‪ ,‬בהנחה שמספר ריינולדס = 𝑒𝑅‬
‫𝑑 𝑥𝑎𝑚𝑈𝜌‬
‫𝜇‬
‫נמוך מתקיים הקשר‪:‬‬
‫𝑔 ‪(𝜌𝑠 − 𝜌𝑓 )𝑑 2‬‬
‫=‬
‫)‪⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡(40‬‬
‫𝜇‪18‬‬
‫𝑥𝑎𝑚𝑈‬
‫מתי לדעתכם עדיף השימוש בויסקומטר כדור נופל על פני ויסקומטר כדור מתגלגל‬
‫ולהפך? מהם יתרונותיו וחסרונותיו של ויסקומטר כדור נופל?‬
‫‪ .3‬בבדיקה שנעשתה על פרסומים בכתב העת היוקרתי‬
‫"‪ "New England Journal of Medicine‬נמצא שרק ב‪ 36%-‬מהמחקרים הקליניים‬
‫שהציגו תוצאות שליליות היו בעלי עוצמה סטטיסטית גדולה מספיק כך שיוכלו לזהות‬
‫שינוי משמעותי (המתואר על ידי הגודל 𝑛𝑖𝑚̅𝑑) של ‪ ,50%‬ורק ב‪ 16%-‬מהמחקרים יכלו‬
‫לזהות שינוי משמעותי של ‪ .)Moher et al. 1994( 25%‬תארו בקצרה את ההשלכות‬
‫של שימוש במבחן ‪ t‬השוואתי עם מעט מדי דגימות וכיצד יכול להיווצר מצב שבו‬
‫מתקבלת תוצאה שלילית שגויה (אי דחיית ‪ .)𝐻0‬הסבירו בקצרה מדוע לדעתכם תופעה‬
‫זו קיימת‪ ,‬וציינו לפחות ‪ 2‬דרכים כיצד ניתן להתגבר עליה‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 23‬מתוך ‪36‬‬
‫קירשנר‬
‫‪ .4‬נסחו מבחן דו‪-‬צדדי השוואתי הבודק אם יש הבדל בין ‪ 2‬משתנים אקראיים המתפלגים‬
‫נורמלית ‪ 𝑌1‬ו‪ .𝑌2 -‬למשתנים יש סטיית תקן זהה‪ ,‬ומהאוכלוסיות של כל אחד נלקח ‪n‬‬
‫דגימות‪ .‬נסחו את החישוב הכללי עבור עוצמת המבחן עבור הבדל 𝑛𝑖𝑚̅𝑑‪.‬‬
‫עליכם ליצור מבחן כללי כלשהו (אין צורך בחישובים)‪-‬רק הצגה פרמטרית‬
‫‪ .5‬במטלב‪ ,‬צרו ‪ 3‬וקטורים ‪ C,B,A‬בעלי ‪ 15‬איברים כל אחד המתפלגים נורמלית עם‬
‫ממוצעים וסטיות תקן לפי טבלה ‪ .2‬הציגו היסטוגרמות עבור כל וקטור באמצעות‬
‫פקודת ‪ .hist‬עדיף להשתמש בפקודה ‪( subplot‬עם ‪ 3‬שורות ועמדה אחת)‪ ,‬עבור כל‬
‫משתנה בשביל תצוגה נוחה‪ .‬על גבי כל היסטוגרמה הוסיפו עקומת נורמלית (בצבע‬
‫שונה) בעלת מקצוע וסטיית תקן כנתון בטבלה ‪( 2‬השתמשו בנוסחה ‪ 18‬ובפקודת‬
‫‪ .)hold on/off‬הכפילו את העקומות בקבוע שרירותי כך שצורתן הגאוסיאנית תהיה‬
‫ברורה‪ .‬וודאו שלכל הגרפים טווחים זהים בצירי ‪ .Y,X‬בנוסף הציגו על גרף אחד‬
‫‪ ,boxplots‬עם ממוצעים עבור הוקטורים שיצרתם‪.‬‬
‫טבלה ‪ :2‬פרמטרים סטטיסטיים עבור סעיף ‪5‬‬
‫‪C‬‬
‫‪B‬‬
‫‪A‬‬
‫‪14‬‬
‫‪11‬‬
‫‪10‬‬
‫𝜇‬
‫‪3‬‬
‫‪3‬‬
‫‪3‬‬
‫𝜎‬
‫‪ .6‬נסחו מבחן ‪ t‬השוואתי חד‪-‬צדדי ובצעו אותו בין הוקטורים ‪ B‬ל‪ A-‬ובין הוקטורים ‪ C‬ל‪-‬‬
‫‪ ,A‬מהנתונים שייצרתם בסעיף ‪ .5‬במבחנים‪ ,‬בידקו את ההשערות שהממוצעים של ‪B‬‬
‫ו‪ C-‬גדולים מ‪ .A-‬בצעו את המבחנים ברמת מובהקות של ‪ 𝛼 = 0.05‬ושוב ברמת‬
‫מובהקות של ‪ .𝛼 = 0.01‬הציגו תוצאות ותנו הסבר קצר למשמעותן‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 24‬מתוך ‪36‬‬
‫קירשנר‬
‫חלק ג'‬
‫‪ .4‬תיאור הניסוי‬
‫ראשית נמצא את הקשר בין צמיגות תמיסת הסוכרוז לבין ריכוז הסוכרוז‪ ,‬על ידי זמן הגלגול‬
‫של כדור למרחק קבוע‪ .‬הפרמטרים המייצגים את הקשר הזה ייתנו עקום סטנדרט למדידת‬
‫צמיגות‪ .‬בשלב הבא‪ ,‬נמדוד את צמיגותן של שתי תמיסות סוכרוז בריכוזים לא ידועים‪ .‬בעיבוד‬
‫הנתונים‪ ,‬נבצע מבחן סטטיסטי לבדיקה אם שתי תמיסות אלו שונות אחת מהשנייה‪.‬‬
‫ציוד‪:‬‬
‫‪)1‬‬
‫‪)2‬‬
‫‪)3‬‬
‫‪)4‬‬
‫‪)5‬‬
‫‪)6‬‬
‫‪)7‬‬
‫‪)8‬‬
‫מתקן ויסקומטר מפלסטיק‪ ,‬בעל ‪ 3‬זוויות שונות‪.‬‬
‫שבעה צינורות פרספקס (אורך – ‪ ~25‬ס"מ‪ ,‬קוטר פנימי ‪ 6.5‬מ"מ)‪.‬‬
‫שבעה כדורי נירוסטה (קוטר ‪ 6 -‬מ"מ‪ ,‬צפיפות – ‪.)7.8 g/cm3‬‬
‫חמש תמיסות סוכרוז בריכוזים שונים ידועים‪.‬‬
‫שתי תמיסות סוכרוז בריכוזים לא ידועים‪.‬‬
‫טיימר למדידת זמן גלגול הכדורים‪.‬‬
‫קליבר‪.‬‬
‫מד טמפרטורה‪.‬‬
‫מערכת הניסוי מוצגת באיור ‪ .‬במערכת אפשרות לביצוע מדידת זמן גלגול בשלושה זוויות‬
‫שונות‪ .‬בצדו האחד נמצא חלקו העליון של הצינור‪ .‬בצידו השני נמצא חלקו התחתון של הצינור‪.‬‬
‫כאשר מוכנים להתחיל בגלגול‪ ,‬מטים את הצינור מטה כך שהכדור יתחיל בגלגול והחלק‬
‫התחתון של הצינור יושב היטב בגומחה המתאימה לו‪.‬‬
‫א‬
‫ב‬
‫איור ‪ :8‬מערכת הניסוי‪ .‬א‪ .‬מבט על המערכת עם צינור מלא בתמיסת סוכרוז ‪ .200Bx‬ב‪.‬‬
‫מבט על החלק העליון של הצינור‪ ,‬בו ניתן להבחין בכדור נירוסטה המוחזק על ידי מגנט‪.‬‬
‫הסרגל של סנטימטרים‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 25‬מתוך ‪36‬‬
‫קירשנר‬
‫‪ .6‬מהלך הניסויים‬
‫א‪ .‬תחילה‪ ,‬מדדו ורשמו את הטמפרטורה בחדר‪.‬‬
‫ב‪ .‬ניסוי ‪ :1‬עקום סטנדרט לצמיגות תמיסת סוכרוז‬
‫עבור כל תמיסת סוכרוז בריכוז ידוע‪ ,‬מדדו את הזמן הלוקח לכדור להתגלגל‬
‫למרחק של ‪ 4‬ס"מ‪ 10 ,‬פעמים לכל תמיסה‪.‬‬
‫‪ )1‬וודאו שהצינורות למדידות צמיגות מלאים עד הסוף בתמיסה‪ ,‬שאינם‬
‫מטפטפים ושהכדור בפנים‪ .‬רשמו את המיקום החריץ במתקן הויסקומטר שבו‬
‫תבצעו את הניסוי‪ ,‬לפי הוראותיו של המדריך‪.‬‬
‫‪ )2‬סמנו על הצינוריות שקיבלתם שני סימונים באמצעות טוש‪ ,‬כאשר המרחק בין‬
‫הסימונים הוא לפחות ‪ 4‬ס"מ‪ .‬מרחק זה יהיה מרחק הבקרה בו תמדדו את זמן‬
‫(ומהירות) הגלגול‪.‬‬
‫‪ )3‬שחררו את הכדור כך שיתחיל להתגלגל מעל לקו שחור חיצוני המסומן על‬
‫הצינורית (ראה‬
‫‪ )4‬המרחק בין זוג קווים שחורים חיצוני ופנימי הוא המרחק המינימלי הדרוש‬
‫להשלמת התאוצה של הכדור ולהגעה למהירות קבועה‪.‬‬
‫‪ )5‬כאשר הכדור חולף על פני סימון העליון שסימנתם‪ ,‬התחילו במדידת זמן‬
‫הגלגול באמצעות הטיימר‪ .‬כאשר הכדור חולף על פני הסימון התחתון של‬
‫שסימנתם‪ ,‬עצרו את הטיימר‪.‬‬
‫‪ )6‬רשמו את זמן הגלגול אותו מדדתם‪ ,‬וחיזרו שוב על שלבים ‪ ,4-7‬סך הכל ‪10‬‬
‫חזרות עבור כל תמיסה‪.‬‬
‫הערה‪ :‬ניתן לתת לכדור להתגלגל עד סוף הצינור‪ ,‬ולהפוך אותו בין מדידות‬
‫עוקבות‪.‬‬
‫ג‪ .‬ניסוי ‪ :2‬תמיסות לא ידועות‬
‫עבור שתי תמיסות בריכוזים לא ידועים‪ ,‬בצעו מדידת זמני הגלגול של כדורים‬
‫באותו אופן כמו בניסוי ‪ 1‬לעיל‪ .‬רישמו לפניכם את השמות של התמיסות‪ ,‬וציינו‬
‫אותם בדו"ח המסכם‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 26‬מתוך ‪36‬‬
‫קירשנר‬
‫איור ‪ :9‬צינורית אחת‪ ,‬בה רואים את הקווים השחורים‪ .‬כל זוג קווים מסמן את המרחק‬
‫המינימלי שנדרש בשביל שהכדורים יגיעו למהירות הגלגול המקסימלית שלהם‪.‬‬
‫חלק ד'‬
‫‪ .7‬ניתוח תוצאות‬
‫כל העבודה‪ ,‬כולל יצירת גרפים‪ ,‬יכולה להיעשות דרך אקסל או דרך מטלב‪ .‬לפירוט על‬
‫פקודות מטלב‪ ,‬ראו נספח ה'‪.‬‬
‫א‪ .‬ציינו לפחות ‪ 3‬מקורות לשגיאה ואת סוג השגיאה בניסויים שביצעתם‪ .‬אין צורך‬
‫בחישובים‪.‬‬
‫ב‪ .‬חשבו את מספר ריינולדס הממוצע עבור כל תמיסת סוכרוז בריכוז ידוע‪ ,‬ובדקו כי‬
‫למינאריות מתקיימת (איור ‪2‬ב)‪.‬‬
‫שימו לב שאם למינאריות לא מתקיימת עבור נתונים מסוימים‪ ,‬לא ניתן להשתמש‬
‫בהם ויש להשמיטם‪.‬‬
‫ג‪ .‬בעזרת הנתונים בנספח ב '‪ ,‬התאימו קו ישר בשיטת הריבועים הפחותים עבור‬
‫תמיסות סוכרוז בתחום ‪ 200Bx – 500Bx‬בטמפרטורה שבה ביצעתם את הניסוי‬
‫(השתמשו בפונקציה ‪.)fit‬‬
‫המשתנה הבלתי תלוי הוא‬
‫‪1‬‬
‫]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[‬
‫‪ ,‬והמשתנה התלוי הוא‬
‫‪1‬‬
‫𝜇‬
‫(𝜇 היא צמיגות‬
‫התמיסה)‪.‬‬
‫מצאו את ‪ r2‬של ההתאמה‪.‬‬‫הציגו יחד על אותו הגרף את כל הנתונים‪ ,‬הקו שהתאמתם‪ ,‬את משוואת הקו ואת‬‫ה‪ r2 -‬של ההתאמה‪.‬‬
‫מה היה קורה אם הייתם מתבקשים להתאים קו ישר עבור ‪?00Bx – 300Bx‬‬‫הייתם מקבלים התאמה ליניארית יותר‪/‬פחות טובה מאשר ‪?200Bx – 500Bx‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 27‬מתוך ‪36‬‬
‫קירשנר‬
‫מהי לדעתכם הסיבה לשינוי? הציגו גרף גם עבור מצב זה ו מצאו את ‪ r2‬של‬
‫ההתאמה‪.‬‬
‫ד‪ .‬לכל הנתונים שאספתם מתמיסות הסוכרוז בריכוזים ידועים (ניסוי ‪ )1‬התאימו קו‬
‫ישר בשיטת הריבועים הפחותים (השתמשו בפונקציה ‪.)fit‬‬
‫המשתנה הבלתי תלוי הוא 𝜇 (צמיגות התמיסה) והמשתנה התלוי הוא ‪( t‬זמן‬
‫הגלגול)‪.‬‬
‫מצאו את ‪ r2‬של ההתאמה‪.‬‬‫הציגו על אותו הגרף את כל הנתונים‪ ,‬הקו שהתאמתם‪ ,‬את משוואת הקו ואת ה‪-‬‬‫‪ r2‬של ההתאמה‪.‬‬
‫ה‪- .‬חשבו את ריכוזי הסוכרוז (ממוצעים) של התמיסות הידועות באמצעות הקשרים‬
‫שמצאתם בסעיפים ג' ו‪ -‬ד'‪.‬‬
‫הציגו היסטוגרמות עבור ריכוז הסוכרוז המחושב לכל תמיסה ידועה‪ .‬בשביל‬‫תצוגה נוחה (מומלץ להשתמש בפקודת ‪ subplot‬עם ‪ 5‬שורות ועמודה אחת)‪.‬‬
‫על גבי כל היסטוגרמה הוסיפו עקומת התפלגות נורמלית (בצבע שונה) בעלת‬‫ממוצע וסטיית תקן מדגמית (השתמשו בנוסחה ‪Error! Reference source‬‬
‫‪ not found.‬ובפקודות ‪ .)hold on/off‬הכפילו את העקומות בקבוע שרירותי כך‬
‫שצורתן הגאוסיאנית תהיה ברורה‪ .‬וודאו שלכל הגרפים טווח זהה בצירים ‪ X‬ו‪.Y -‬‬
‫ו‪ .‬הציגו על גרף אחד ‪( boxplots‬עם ממוצעים) של ריכוזי הסוכרוז המחושבים (כל‬
‫הנתונים) עבור התמיסות בריכוזים ידועים‪ .‬ציר ‪ X‬הוא ריכוזי הסוכרוז הידועים‪,‬‬
‫וציר ‪ Y‬ריכוזי הסוכרוז המחושבים‪ .‬וודאו שלכל הגרפים טווח זהה בציר ‪ Y‬בשביל‬
‫שיהיה ניתן להשוות ביניהם‪.‬‬
‫ז‪ .‬בצעו מבחן ‪ t‬דו‪-‬צדדי לשיפוע הקו שהתאמתם בסעיף ד'‪ .‬הציגו את חישוביכם ודונו‬
‫במשמעויות התוצאות‪ .‬השתמשו בפונקציית ‪ tinv‬למציאת הערך הקריטי *‪ ,t‬תוך‬
‫וידוי כי קיבלתם את הערך הנכון על ידי נספח ב'‪.‬‬
‫ח‪ .‬מצאו את ריכוזי הסוכרוז (ממוצעים) בשתי התמיסות הלא ידועות שבדקתם‬
‫באמצעות ההתאמות הליניאריות מסעיפים ג' ו‪ -‬ד'‪ .‬הציגו על גרף אחד את הקו‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 28‬מתוך ‪36‬‬
‫קירשנר‬
‫שהתאמתם בסעיף ג' ואת הריכוזים המחושבים של שתי התמיסות הלא ידועות‪.‬‬
‫בנוסף‪ ,‬הציגו היסטוגרמות עבור כל תמיסה לא ידועה‪ ,‬ו‪( boxplots -‬עם ממוצעים)‪.‬‬
‫ט‪ .‬בצעו מבחן ‪ t‬השוואתי דו‪-‬צדדי לריכוזי הסוכרוז של התמיסות הלא ידועות‬
‫שבדקתם‪ .‬הציגו את חישוביכם‪ .‬השתמשו בפונקציית ‪ tinv‬למציאת הערך הקריטי‬
‫*‪ ,t‬תוך וידוי כי קיבלתם את הערך הנכון על ידי נספח ב'‪.‬‬
‫י‪ .‬הסבירו‪ ,‬באמצעות ‪ 2‬דוגמאות קלינית‪-‬מחקריות‪ ,‬את החשיבות ואופן יישומו של‬
‫‪ ,power analysis‬וכיצד הוא מסייע לבניית מחקרים ברי משמעות והשקעה‬
‫מיטביים‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 29‬מתוך ‪36‬‬
‫קירשנר‬
‫‪ .8‬דוח סופי להגשה‬
‫א‪ .‬דף שער עם שמות‪ ,‬מספרי זהות‪ ,‬מספר הקבוצה‪ ,‬שם הניסוי ותאריך ביצוע הניסוי‪.‬‬
‫ב‪ .‬תקציר המסכם את הדו"ח‪ :‬רקע‪ ,‬מטרות‪ ,‬מהלך הניסוי‪ ,‬תוצאות‪ ,‬מסקנות‪ .‬אורך‬
‫כחצי עמוד‪.‬‬
‫ג‪ .‬מבוא באורך של עד שני עמודים‪ .‬המבוא יכלול בתוכו‪:‬‬
‫‪ )1‬תמצית הרקע התיאורטי‬
‫‪ )2‬מטרות הניסוי‬
‫‪ )3‬תיאור הניסוי בקצרה‬
‫ד‪ .‬גוף הדו"ח‪ :‬כל התוצאות הגולמיות‪ ,‬וניתוחן‪ .‬יש להציג את תוצאות הניסוי (כולל‬
‫הצגה גרפית) וניתוחן‪ .‬יש לענות על כל השאלות בסעיף ניתוח התוצאות‪.‬‬
‫ה‪ .‬סיכום ומסקנות‪ :‬חצי עמוד עד עמוד‪ .‬יש להתייחס למשמעויות של חלקי ניתוח‬
‫התוצאות בניסוי זה‪ ,‬יחד עם חשיבותן למחקר בכלל‪ .‬קשרו בין מסקנותיכם בניסוי‬
‫שיערוך וקידום שגיאות לבין ניסוי זה‪.‬‬
‫‪‬‬
‫על כל הגרפים להיות ברורים ככל הניתן – נקודות יורדו על כל גרף שאינו ברור‪.‬‬
‫‪‬‬
‫חשוב להסביר משמעות של כל גרף‬
‫‪‬‬
‫הדו"ח יוגש באותן הזוגות כפי שעבדתם במעבדה‪ .‬ההגשה תהיה עד שבועיים מיום‬
‫ביצוע המעבדה‪.‬‬
‫‪‬‬
‫את‬
‫הדו"ח‬
‫יש‬
‫להגיש‬
‫בעותק‬
‫קשיח‬
‫ובדוא"ל‬
‫‪[email protected]‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 30‬מתוך ‪36‬‬
‫קירשנר‬
‫המדריך‪:‬‬
‫נספח א'‪ :‬טבלת הסתברות מצטברת (הפוכה) עבור התפלגות ‪.t‬‬
‫הערכים ‪ t‬של משתנה אקראי המתפלג לפי התפלגות ‪ ,t‬כתלות בהסתברות‬
‫)*‪ P(t>t‬ומספר דרגות החופש (‪.)df‬‬
‫‪t-Distribution‬‬
‫)‪p = P(t>t*) = P(t>t1-p‬‬
‫‪Probability‬‬
‫‪t = t*= t1-p‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 31‬מתוך ‪36‬‬
‫קירשנר‬
‫נספח ב'‪ :‬צמיגות תמיסות סוכרוז‬
‫נתון כתלות בטמפרטורה וריכוז סוכרוז טהור במים‪ ,‬ביחידות של ‪: cP = 1x10-2 Poise‬‬
‫‪ρ‬‬
‫‪1.018‬‬
‫‪cP‬‬
‫‪1.144‬‬
‫‪g/L‬‬
‫‪50.9‬‬
‫‪Sucr.‬‬
‫‪5‬‬
‫‪1.038‬‬
‫‪1.333‬‬
‫‪103.8‬‬
‫‪10‬‬
‫‪1.059‬‬
‫‪1.589‬‬
‫‪158.90‬‬
‫‪15‬‬
‫‪1.081‬‬
‫‪1.941‬‬
‫‪216.20‬‬
‫‪20‬‬
‫‪1.104‬‬
‫‪2.442‬‬
‫‪275.90‬‬
‫‪25‬‬
‫‪1.127‬‬
‫‪3.181‬‬
‫‪338.10‬‬
‫‪30‬‬
‫‪1.151‬‬
‫‪4.314‬‬
‫‪402.90‬‬
‫‪35‬‬
‫‪1.176‬‬
‫‪6.150‬‬
‫‪470.60‬‬
‫‪40‬‬
‫‪1.203‬‬
‫‪9.360‬‬
‫‪541.10‬‬
‫‪45‬‬
‫‪1.230‬‬
‫‪15.400‬‬
‫‪614.80‬‬
‫‪50‬‬
‫‪oBx‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 32‬מתוך ‪36‬‬
‫קירשנר‬
‫נספח ג'‪ :‬צפיפות תמיסת סוכרוז טהור כתלות באחוז משקלי (‪( )DS‬מתוך‬
‫‪.)Asadi 2005‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 33‬מתוך ‪36‬‬
‫קירשנר‬
‫נספח ד'‪ :‬פקודות מטלב שימושיות ( * = הפונקציה מותקנת וקיימת‬
‫במחשבים בחוות הפקולטה)‪.‬‬
‫)‪normrnd(mu,sigma,m,n‬‬
‫יצירת מטריצה בעלת ‪ m‬שורות ו‪ n-‬עמודות‪ ,‬אשר איבריה‬
‫נלקחו מהתפלגות נורמלית בעלת ממוצע ‪ mu‬וסטיית תקן‬
‫‪.sigma‬‬
‫)‪boxplot(X‬‬
‫יצירת דיאגרמות ‪ boxplot‬של מספר ניסויים כמספר‬
‫העמודות של מטריצת ‪ X‬ומספר שורות כמספר החזרות‬
‫בכל ניסוי‪ .‬הדיאגרמה הבאה מציגה דוגמה לפלט הפונקציה‬
‫(עמודה אחת ממטריצת ‪.)X‬‬
‫*‬
‫*‬
‫אחוזון ‪(“whisker”) 99.65%‬‬
‫אחוזון ‪(“3rd Quartile”) 75.00%‬‬
‫אחוזון ‪(“2nd Quartile”) 50.00%‬‬
‫אחוזון ‪(“1st Quartile”) 25.00%‬‬
‫אחוזון ‪(“whisker”) 0.3500%‬‬
‫חריג‬
‫אחוזון ‪ 50.00%‬מייצג את הערך ש‪ 50.00% -‬מהנתונים‬
‫קטנים‪/‬שווים אליו (‪ .)median‬ה‪ “box” -‬תחום על ידי‬
‫ה‪“whiskers” -‬‬
‫האחוזונים ‪ 75.00%‬ו‪.25.00% -‬‬
‫מייצגים את האחוזונים ‪ 0.3500%‬ו‪ .99.65% -‬חריגים הינם‬
‫נתונים שנמצאים מתחת לאחוזון ‪ 0.3500%‬או מעל אחוזון‬
‫‪.99.65%‬‬
‫הערה‪ :‬יש להוסיף סמן למיקום הממוצעים האלגבריים‬
‫לאחר הפקודה ‪( hold on‬נותן את האפשרות לצייר על אותו‬
‫הגרף עוד פעמים)‪ ,‬ואז באמצעות ‪ scatter‬של ערכי‬
‫הממוצעים (מצייר את הממוצעים כנקודות)‪.‬‬
‫)‪hist(A,nbins‬‬
‫יצירת היסטוגרמה מוקטור הנתונים ‪ ,A‬אשר מראה את‬
‫מספר הנתונים הנמצאים בתוך ‪ nbins‬תחומים בגודל שווה‪.‬‬
‫למשל‪ ,‬אם ‪ nbins‬שווה ‪ ,5‬הפונקציה מחלקת את הטווח של‬
‫הנתונים ב‪ A -‬ל‪ 5 -‬תחומים שווים‪ ,‬ומוצא כמה מהם נופלים‬
‫בכל תחום‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 34‬מתוך ‪36‬‬
‫קירשנר‬
‫)‪ffun=fittype(expr‬‬
‫יצירת אובייקט התאמה ‪ ffun‬מתוך ‪ ,expr‬שמשתמשים בו‬
‫בפונציית ‪ .fit‬במקרה של התאמת פונקציה )‪ f(x‬בעלת‬
‫משתנה יחיד‪ expr ,‬יכול להיות מחרוזת תווים שמבטאת את‬
‫)‪ f(x‬כפונציה של ‪ x‬עם פרמטרים שאותם יש למצוא‪ .‬למשל‪,‬‬
‫עבור התאמה ריבועית‪ expr ,‬יכול להיות '‪,'a+b*x+c*x^2‬‬
‫כאשר ‪ b ,a‬ו‪ c -‬הינם הפרמטרים‪ .‬ישנם עוד שימושים‬
‫מגוונים וחזקים של פונקציה זו‪.‬‬
‫)‪t=tinv(p,free‬‬
‫מוצא את הערך ‪ t‬שעבורו ההסתברות המצטברת של‬
‫התפלגות ‪ t‬שווה ‪ .p‬המשתנה ‪ free‬הוא מספר דרגות‬
‫החופש‪.‬‬
‫)>‪[myfit,gof]=fit(x,y,ffun,<fitoptions‬‬
‫ביצוע התאמה לפי אובייקט ההתאמה ‪ ffun‬לנתונים ‪x‬‬
‫(משתנה בלתי‪-‬תלוי) ו‪( y -‬משתנה תלוי)‪ .‬התוצאה ‪myfit‬‬
‫הינו משתנה מסוג ‪ ,cfit‬וניתן לקבל את הערכים שהותאמו‬
‫לפרמטרים על ידי‪,‬‬
‫*‬
‫*‬
‫*‬
‫‪myfit.ParamName‬‬
‫ניתן להגדיר ב‪ <fitoptions> -‬אופציות נוספות (ללא‬
‫הסוגריים)‪ ,‬כגון ‪ StartPoint‬שמגדיר את הניחוש ההתחלתי‬
‫שפונקצית ‪ fit‬תשתמש במציאת הפרמטרים שהוגדרו ב‪-‬‬
‫‪ ,ffun‬על ידי נתינת וקטור הערכים לניחוש כל פרמטר‪ .‬אופן‬
‫הגדרה היא (עבור התאמה עם שני פרמטרים)‪:‬‬
‫)]‪fit(x,y,ffun,'StartPoint',[1 2‬‬
‫הפלט השני ‪ gof‬הינו ‪ structure‬הנותן מידע השימושי‬
‫להערכת טיב ההתאמה‪ .‬ספציפית‪ r2 ,‬נתון על ידי‪,‬‬
‫‪gof.rsquare‬‬
‫ישנן עוד הרבה הגדרות שימושיות שאותן ניתן לשרשר בתוך‬
‫‪ ,fit‬ואותן ניתן למצוא תחת הערך "‪ "fitoptions‬ב‪ help -‬של‬
‫מטלב‪.‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 35‬מתוך ‪36‬‬
‫קירשנר‬
‫‪hold on‬‬
‫‪ – hold on‬לאחר יצירת גרף ושרטוט עקומה‪ ,‬קוראים‬
‫לפקודה זו כדי לאפשר הוספת עקומות נוספות ללא איתחול‬
‫הגרף‪.‬‬
‫‪ – hold off‬כל שינוי שיעשה בגרף עכשיו יאתחל אותו (ריק)‪.‬‬
‫)‪subplot(rows,cols,ind‬‬
‫יצירת "מטריצה" של גרפים בתוך ‪ figure‬אחד‪ ,‬כאשר‬
‫למטריצה מספר שורות ‪ rows‬ומספר עמודות ‪ .cols‬את‬
‫הפקודה הזו יש לקרוא לפני כל פקודה ליצירת גרף חדש‪,‬‬
‫כאשר ‪ rows‬ו‪ cols -‬אינם משתנים‪ .‬כדי לבחור את המיקום‬
‫של הגרף החדש בתוך "מטריצת" הגרפים‪ ,‬בוחרים ערך ל‪-‬‬
‫‪ ind‬מתאים‪ ,‬כאשר ‪ ind‬הוא מספר הגרף ב"מטריצה"‪.‬‬
‫מספור הגרפים הוא משמאל לימין‪ ,‬ומלמעלה למטה‪.‬‬
‫לדוגמה‪:‬‬
‫‪hold off‬‬
‫‪1 2 3‬‬
‫‪4 5 6‬‬
‫נספח ה'‪ :‬מקורות‬
‫‪1. Asadi, M. Beet-Sugar Handbook (p. 779 – 780). John Wiley & Sons (2005).‬‬
‫‪2. Hoynak PX and Bollenback GN, This is Liquid Sugar (p. 224 – 225). Key Book‬‬
‫‪Service, Inc. (1966) 2nd Ed.‬‬
‫‪3. Hubbard RM and Brown GG. The rolling ball viscometer. Indust Eng Chem‬‬
‫‪15(3): 212-218 (1943).‬‬
‫‪4. Moher D, Dulberg CS, Wells GA. Statistical Power, Sample Size, and Their‬‬
‫‪Reporting in Randomized Controlled Trials. JAMA 272: 122-124 (1994).‬‬
‫‪5. Quintas M et al. Rheology of supersaturated sucrose solutions. J Food Eng‬‬
‫‪77: 844-852 (2006).‬‬
‫ניסוי ‪ :‬סטטיסטיקה שימושית‬
‫עדכון אחרון‪ 06/05/2015 :‬ע"י נועה‬
‫עמוד ‪ 36‬מתוך ‪36‬‬
‫קירשנר‬