הטכניון – מכון טכנולוגי לישראל הפקולטה להנדסה ביו-רפואית מעבדה בהנדסה ביו-רפואית (335001 ) I ניסוי :סטטיסטיקה שימושית חלק א' .1רקע .2מושגי יסוד בסטטיסטיקה .3מטרות הניסוי .4תקציר הניסוי חלק ב' .5דו"ח מכין חלק ג' .6תאור מערכת הניסוי .7מהלך הניסוי חלק ד' .8ניתוח תוצאות .9הנחיות לכתיבת הדו"ח המסכם ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 1מתוך 36 נספחים: א .טבלת הסתברות מצטברת (הפוכה) עבור התפלגות .t ב .צמיגות תמיסות סוכרוז ג .צפיפות תמיסת סוכרוז טהור כתלות באחוז משקלי ד .פקודות מטלב שימושיות ה .מקורות ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 2מתוך 36 חלק א' .1רקע לניסוי א .מבוא איכותן של תוצאות ניסוי נמדדות לפי תכנון ניסוי נכון .לדוגמה ,בניסוי שבו יש הרבה רעש יש צורך לבצע מספר ניסויים רב יותר כדי לקבל תוצאות משמעותיות .אקראיות ורעש מהווים לעיתים קרובות חלק משמעותי בתוצאות של ניסוי .כתוצאה מכך ,כמעט כל ניסוי יניב תוצאות שאינן זהות לניסוי אחר .אז איך יידע חוקר לזהות תוצאות בעלות משמעות ,שאינן נובעות מרעשים? לשם כך פותחו כלים ומבחנים סטטיסטיים רבים .מבחנים אלו מבוססים על ידע של התנהגותם הסטטיסטית של משתנים ,והם יכולים לתת תשובות לשאלות מחקריות (למשל אם קיים הבדל משמעותי בין שתי אוכלוסיות) .טיב השאלה המחקרית ומבנה הניסוי משפיעים באופן ישיר על היכולת שלנו להגיע למסקנות נכונות ושימושיות. ב .תמיסות סוכר במעבדה זו נשתמש בתמיסות סוכר במים .תמיסות אלו יוצרות נוזל ניוטוני בצמיגויות שונות כתלות בכמות הסוכר המומס .את כמות הסוכרוז המומס ניתן לכמת כאחוז משקלי ( ,)%w/wאו כמשקל הסוכרוז המומס ליחדת משקל של 100גרם תמיסה. בתעשיות רבות בהן ויסות ריכוז הסוכר חשוב כשלעצמו (מיצים ,יינות ,סירופים וכו') האחוז המשקלי של הסוכרוז בתמיסה יכול גם להינתן על ידי "מעלות בריקס" ( ,)Degrees Brixמסומנות .ºBxעבור תמיסות סוכרוז בריכוזים של עד כº68 Bx- (קרוב לגבול המסיסות בטמפרטורת חדר במים מזוקקים) ,ניתן לחשב את צמיגות התמיסה µעל ידי משוואת אהרוניס הגלובלית: ()1 1 1 ]) 𝑒𝑥𝑝 [𝑎3 𝑒𝑥𝑝(𝑎4 𝑐)(T − T s 1 𝑎2 𝑎1 + ]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[ =𝜇 כאשר ] [Sucroseהינו הריכוז ב 𝑇𝑠 ,º Bx-הינה טמפ' ייחוס כלשהי (אבסולוטית) ,ו- 𝑎4 , 𝑎3 𝑎2 , 𝑎1הינם קבועים הניתנים למציאה באופן אמפירי .אם נניח כי אנחנו שומרים ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 3מתוך 36 על טמפרטורה קבועה ,הרי שהסוגריים המרובעים מתאפסים ,כל האקספוננט החיצוני הופך ל ,1-ונקבל את היחס המופשט: 1 )(2 𝑎2 ]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[ 𝑎1 + =𝜇 אם נעלה בחזקת ( )-1את שני האגפים נקבל: 1 1 = 𝑎1 + 𝑎2 )(3 ]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[ 𝜇 הגענו למשוואה הניתנת למידול ליניארי .באיור 1מוצגת התלות של צמיגות תמיסת סוכרוז-מים בריכוז הסוכרוז המומס (מוצג עבור :)20ºC איור :1תלות של צמיגות תמיסת סוכרוז טהור באחוז משקלי של סוכרוז ,בטמפרטורת .)Hoynak and Bollenback 1966( 20oC במעבדה אנו נשערך את הקשר באמצעות מדידת הצמיגויות של חמש תמיסות סוכרים בריכוזים ידועים .מדידות הצמיגות ייעשו באמצעות ויסקומטר כדור מתגלגל ,כפי שיתואר בהמשך. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 4מתוך 36 ג .ויסקומטר כדור מתגלגל שיטה פשוטה למדידת צמיגותו של נוזל ניוטוני הוא ויסקומטר כדור מתגלגל .ויסקומטר זה מאפשר לחשב את צמיגות הנוזל על ידי מדידת הזמן שלוקח לכדור (בעל צפיפות וגודל ידועים) להתגלגל דרך מרחק ידוע של הנוזל בתוך צינור בקוטר נתון .בהנחה שזרימת הנוזל סביב הכדור הינה למינארית (לפי מספר ריינולדס ידוע) ,ניתן לקבל את המהירות המקסימאלית 𝑥𝑎𝑚𝑈 שהכדור יכול להגיע אליה מתוך הקשר: 𝑓𝜌 𝜌𝑏 − 𝑥∆ 𝐶= )(4 𝑡∆ 𝜇 = 𝑥𝑎𝑚𝑈 כאשר 𝑓𝜌 𝜌𝑏 ,הם צפיפויות הנוזל והכדור בהתאמה 𝜇 ,היא הצמיגות הדינמית של הנוזל עם יחידות של ,𝜇 = 𝑃𝑜𝑖𝑠𝑒 = 𝑃 = 𝑔𝑐𝑚−1 𝑠 −1ו C-הינו פרמטר אמפירי המקשר בין משתנים אלו לבין המהירות המקסימאלית .הפרמטר Cתלוי במבנה ובחומרים מהם הוא מורכב המתקן בו משתמשים .בניסוי נמדוד את הזמן 𝑡∆ הדרוש לכדור להתגלגל מרחק מדוד וקבוע 𝑥∆ .נניח כי הכדור מגיע למהירותו המקסימאלית לפני כניסתו לתחום המדידה בצינורית ,והנוזל אחיד בכל נפח הכלי .בנוסף נניח שהכדור מתגלגל בנתיב ישר ולא מחליק (נכון עבור זוויות גלגול קטנות ביחס לאופקי) .מנוסחה ()4 אפשר לקבל את הצמיגות הדינמית: 𝑓𝜌 𝜌𝑏 − )(5 𝑥𝑎𝑚𝑈 𝐶=𝜇 אם נניח כי מרחק הגלגול והצפיפות נשארים קבועים אז נקבל: )𝜇 = 𝐵∆𝑡(6 כאשר: 𝑓𝜌 𝜌𝑏 − )(7 𝑥∆ B=C ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 5מתוך 36 ד .תחום העבודה של ויסקומטר כדור מתגלגל ויסקומטר כדור מתגלגל מסוגל לתת מדידה טובה ופשוטה של צמיגות נוזל בהנחה שזרימת הנוזל מסביב לכדור המתגלגל הינה למינארית .זרימה למינארית מוגדרת כזרימה שכבתית ללא ערבוב בין השכבות והיא תתקיים כאשר מספר ריינולדס עבור הכדור המתגלגל דרך נוזל ניוטוני יהיה קטן מערך קריטי מסוים ,אותו נסמן ב.𝑅𝑒𝑐 - את מספר ריינולדס עבור הכדור המתגלגל דרך נוזל ניוטוני נחשב באמצעות: 𝑓𝜌 𝑥𝑎𝑚𝑈 𝑓𝑓𝑒𝑑 )(8 𝜇 = 𝑒R כאשר 𝑓𝑓𝑒𝑑 הינו האורך המייצג את הנוזל הזורם מסביב לכדור (כפי שמוצב באיור 2 א') והוא שווה: )𝑑𝑒𝑓𝑓 = 𝐷 − 𝑑(9 כאן D ,ו d-הינם קוטרו הפנימי והחיצוני של הכדור ,בהתאמה .ידוע כי קיים קשר בין 𝑑 𝑐𝑒𝑅 לבין יחס הקטרים 𝐷 ,כפי שמוצג באיור 2ב' .ככל שהיחס גדל ,כך גדל גם תחום ה Re-שבו ניתן למדוד את הצמיגות .בניסויים שלנו ,נוודא שמספר ריינולדס הינו מתחת לערך הקריטי המתאים לקטרים שבהם נשתמש ,בכדי להבטיח זרימה למינארית בין הכדור לדופן הצינור. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 6מתוך 36 א ב איור :2א .סכימת חתך דרך כדור קשיח ומלא המתגלגל בתוך צינור המלא בנוזל שאת צמיגותו נרצה למדוד - D .קוטרו הפנימי של הצינור - d ,קוטרו של הכדור המתגלגל- deff , אורך מייצג של הנוזל הזורם סביב הכדור המתגלגל .ב .תלות של מספר ריינולדס קריטי Rec ביחס הקטרים של פנים הצינור ( )Dוהכדור ( ,)dעבור ויסקומטר כדור מתגלגל ( Hubbard .)and Brown 1943 .2מושגי יסוד בסטטיסטיקה משתנה אקראי: אוסף ערכים שנמדדים על ידי ניסוי. פונקציית הסתברות: ההסתברות שהערך של המשתנה האקראי יהיה קטן מערך כלשהו שנקבע מראש (משתנה פונקציית ההסתברות) .אם מדובר במשתנה אקראי בדיד ,אזי פונקציית ההסתברות היא: 𝑘 )𝐹𝑥 (𝑥𝑘 ) = 𝑃(𝑋 ≤ 𝑥𝑘 ) = ∑ 𝑃(𝑋 = 𝑥𝑖 )(10 𝑖=1 𝑛 ≤ 𝑘 ≤ 𝑥𝑖 = 𝑥1 , … . , 𝑥𝑛 &1 אם מדובר במשתנה אקראי רציף ,אזי פונקציית ההסתברות היא: ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 7מתוך 36 𝑥 )𝐹𝑥 (𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥)𝑑𝑥(11 ∞− סכום ההסתברויות (במשתנה רציף ,אינטגרל על פילוג ההסתברות) על כל תחומו של המשתנה האקראי (מנורמל) שווה ל.1- הערה :פונקציית הסתברות נורמלית תקנית איננה בעלת ביטוי אנליטי ,ולכן משתמשים בערכים מטבלה .ניתן לראות את ערכים אלו בטבלה בנספח עבור ∞ → 𝑓𝑑. פונקציה של משתנה אקראי: אם Xהוא משתנה אקראי ו Y-הוא פונקציה של x )Y = 𝑔(𝑋)(12 אזי גם Yהוא משתנה אקראי בעל פונקציית הסתברות המתוארת על ידי: )𝐹𝑌 (𝑌) = 𝑃(𝑌 ≤ 𝑦) = 𝑃[𝑔(𝑋) ≤ 𝑦](13 אך במקרה פרטי שבו gהינה פונקציה מונוטונית עולה ,מתקיים: )F𝑌 (𝑦) = 𝑃⌊𝑋 ≤ 𝑔−1 (𝑦)⌋ = 𝐹𝑋 ⌊𝑔−1 (𝑦)⌋ = 𝐹𝑥 (𝑥)(14 פילוג צפיפות הסתברות: צפיפות ההסתברות מראה בצורה גרפית את הערכים של המשתנה האקראי המנורמל. סך כל השטח מתחת לגרף פילוג צפיפות ההסתברות הוא ( 1מנורמל) .אם המשתנה האקראי בדיד ,מדובר בערכים בדידים בלבד ,אך אם המשתנה רציף או שנאספו "אינסוף" ערכים בדידים ,הפילוג יהיה עקומה רציפה .צורת הגרף עצמה מוגדרת על ידי האקראי יהיה בעל ערך מסוים ,כשמסתכלים על השטח מתחת לגרף בטווח הערכים הרצויים. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 8מתוך 36 חישוב הסתברות מתוך צפיפות ההתפלגות: נניח ש X-משתנה אקראי רציף המתפלג בצורה נורמלית תקנית ואנחנו רוצים לחשב את ההסתברות ש X-יקבל ערך בין ( )-1ו .2-באמצעות פונקציית הסתברות נורמלית תקנית ואנחנו נרצה לחשב את ההסתברות ש X-מקבל ערך קטן/שווה ל 2-או ל .)-1( -החסרה של שתי ההסתברויות הללו תיתן לנו את ההסתברות הרצויה .באופן כללי ,ההסתברות ש- Yמשתנה אקראי כללי (רציף) יקבל ערך בטווח שבין aל b-ניתן על ידי: )P(𝑎 ≤ 𝑌 ≤ 𝑏) = 𝑃(𝑌 ≤ 𝑏) − 𝑃(𝑌 ≤ 𝑎) = 𝐹𝑌 (𝑏) − 𝐹𝑌 (𝑎)(15 איור :3חישוב הסתברות ש X -משתנה אקראי נורמאלי תקני יקבל ערך בין ( )-1ל.2 - ממוצע מדגמי: זהו הערך המשוערך שמשתנה אקראי אמור לקבל במצב אידיאלי ,ללא רעשים או השפעות מהסביבה .משום שדגימות מניסוי הן בדידות ,נתבונן על מקרה של משתנה אקראי בדיד. אלגברית ,הממוצע ניתן לשערוך על ידי: )(16 𝑖𝑥 ∑𝑛𝑖=1 𝑛 = ̅𝑋 שונות מדגמית: מידת הפיזור של משתנה אקראי .השונות מבטאת את הסטייה הממוצעת של דגימות משתנה כלשהו מהממוצע של אותו המשתנה .השונות היא ממצע ריבועי של השגיאות. במקרה של משתנה אקראי בדיד ,ניתן לשערך את השונות על ידי הביטוי: ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה קירשנר עמוד 9מתוך 36 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 = 𝑆 )(17 𝑛−1 2 סטיית התקן המדגמית היא השורש של השונות המדגמית .החזקה השנייה בתוך הסכום קיימת כדי שההפרשים החיוביים לא יבטלו את ההפרשים השליליים .החלוקה היא במספר דרגות החופש ( .)n-1למעשה השונות היא משתנה אקראי .כאשר מספר הדגימות גדול מאוד המכנה הופך ל.)n(- התפלגות נורמלית: מתארת התפלגות טבעית ובסיסית ,ועל כן היא נקראת נורמלית .תופעות טבע ושלל תופעות אחרות מראות את סוג התפלגות זו ,שתוארה לראשונה על ידי גאוס .התפלגות זו היא בצורת פעמון והיא מתוארת על ידי פונקציית גאוס: 1 1 𝑥−𝜇 2 ( 𝑒𝑥𝑝 [− )) ](18 𝜎 2 𝜋𝜎√2 = )𝑥( 𝑥𝑓 גרף של פונקציית התפלגות ,לדוגמה עבור ממוצע אפס וסטיית תקן יחידה (התפלגות נורמלית תקנית) 𝜇 = 0, 𝜎 = 1ניתן לראות באיור 4א' .כפי שרואים ,ההתפלגות הזו היא בעלת מבנה סימטרי סביב ה ,0-שהוא הממוצע. א ב איור :4א .התפלגות נורמלית תקנית של משתנה אקראי עם ממוצע אפס וסטיית תקן יחידה .ב .פונקצית הסתברות נורמלית תקנית מצטברת. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 10מתוך 36 קירשנר פונקציית ההסתברות הנורמלית המצטברת: ההסתברות שמשתנה אקראי Xניתנת על ידי אינטגרציה של הביטוי במשוואה 18מ- (∞ )−עד .xאיור 3ב' מציב את ההסתברות הזו כתלות ב .x-אם נתייחס למשמעות של פונקציית ההסתברות ,נבחין כ יערכה הוא אפסי בערכים נמוכים של ,xושואפת ל1- בערכים גבוהים .המשמעות היא שההסתברות הולכת וקטנה ש x-יקבל ערך שקטן מהממוצע .ההסתברות ש x-יקבל ערך קטן מ ∞-הוא ,1כלומר מלאה. התפלגות :t זו התפלגות המתארת את הערכים הצפויים למדגם מתוך אוכלוסייה המקיימת התפלגות נורמלית כאשר גודלו של המדגם קטן וסטיית התקן של האוכלוסייה אינה ידועה .הצורה הכללית של התפלגות tדומה לזו של ההתפלגות הנורמלית וכאשר מספר הפרטים במדגם גדול היא אף זהה לה .בהרבה מקרים ניסיוניים איננו יודעים את הפרמטרים האמיתיים 𝜇, σשל התפלגות נורמלית .לכן משתמשים בהתפלגות ,tשלוקחת בחשבון את האי-ודאות הקיימת בלקיחת דגימות אינסופיות ,ומשערכת את התפלגותה האמיתית .קיימות אינסוף התפלגויות ,tלעומת התפלגות נורמלית .ההתפלגות מקבלת ערכים שונים כתלות במספר הדגימות שלוקחים מהאוכלוסייה שאותה בוחנים .עקרון זה נקרא דרגות חופש ( df, ,)degrees of freedomהמסומן על ידי .νבמקרה הספציפי של התפלגות ,tמספר דרגות החופש שווה למספר הדגימות פחות אחד .באופן מתמטי ככל שמספר דרגות החופש גדל, כך התפלגות tמתקרבת יותר להתפלגות נורמלית (ראו גרף להלן). איור :5התפלגויות tכתלות במספר דרגות החופש .vככל שישנן יותר דרגות חופש, כך ההתפלגות הולכת ונעשית צרה יותר ,גובה המקסימום גדל ,וצורתה הכללית מתקרבת לזו של התפלגות נורמלית תקנית. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 11מתוך 36 קירשנר השערות (:)Hypotheses השערה מחקרית הינה התוצאה הצפויה בעקבות ניסוי .התפקיד של השערה סטטיסטית יהיה לוודא שהתוצאה שהתקבלה אכן משמעותית .חוקר יכול לרצות להוכיח את השערתו שתרופה חדשה תרפא מחלה מסוימת ולשם כך הוא יבצע ניסוי ויפיק נתונים .אם הוא יבצע את הניסוי על מספר אנשים ,וכולם הגיבו לתרופה באותה צורה ,מבחינה סטטיסטית השערתו לא הוכחה או הופרכה ,אלא דווקא נתמכה ברמת סיכון מסוימת הנגרמת מאי וודאות סטטיסטית. השערות סטטיסטיות: הן הבסיס של מבחן סטטיסטי .במבחן סטטיסטי ,ישנן בדרך כלל שתי השערות ,הנקראות השערת האפס ( )𝐻0וההשערה החלופית ( .)𝐻1המטרה היא לדחות את השערת האפס. ההשערה החלופית היא בדרך כלל ההשערה המחקרית ,היא זו שהחוקר היה רוצה להוכיח .המבחן הסטטיסטי בוחן את ההסתברות שהשערת האפס אכן ניתנת לדחייה ושההשערה החלופית מתקבלת .המגבלה העיקרית של המבחן היא שאינו יכול להוכיח את 𝐻1חד משמעית אלא רק יכול לדחות את 𝐻0ביחס ל 𝐻1 -ברמת סיכון מסוימת הנקראת מובהקות. רמת מובהקות (𝛂): היא הסף לקביעה אם ניתן לדחות את השערת האפס .היא נותנת גם ידע לחוקר על חוזק התוצאות של המבחן .ככל שרמת המובהקות הנדרשת לניסוי היא קטנה יותר ,כך המבחן מחמיר יותר .להחמרה ולהקלה יש השפעה על התוצאות של המבחן. מבחנים סטטיסטיים: כל מבחן סטטיסטי בנוי משלושה רכיבים עיקריים: א .הגדרת ההשערות הסטטיסטיות .𝐻0 , 𝐻1 ב .ציון ההנחות שאותן יש להניח .חשוב לדעת מה אנחנו מניחים ולכן נדע גם מהן המגבלות של השיטה .במעבדה זו נעסוק רק במשתנים אקראיים המתפלגים נורמלית, ובעלי סטיית תקן שווה אך לא ידועה מראש .חשוב לזכור כי כל מבחן דורש הנחות מסוימות ויתכן מאוד שתיתקלו במהלך הקריירה שלכם במבחנים סטטיסטיים בהם תדרשו להניח התפלגות אחרת מהנורמלית .חשוב לשים לב לכך! די בהנחה שגויה, ומסקנה יכולה להיות מוטעית לחלוטין. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 12מתוך 36 קירשנר ג .הגדרת רמת המובהקות הנדרשת ,מסומנת על ידי 𝛼. מבחן tהשוואתי (:)Student's t-test for differences במבחן זה נבדקים הבדלים בממוצעים של שתי התפלגויות נורמליות ,כאשר ההנחה היא שסטיות התקן שלהן שוות אך לא ידועות .נקרא להתפלגות אחת 𝑋1ולשנייה .𝑋2נניח שההתפלגויות של האוכלוסיות הן בעלות צפיפות כמוצג באיור .6מכל אוכלוסייה ניקח 𝑛1 𝑋 ו̅̅̅2 - ו 𝑛2 -דגימות בהתאם ( ̅̅̅1 𝑋 הם הממוצעים של הדגימות) .אם נרצה לבחון האם 𝑋1 שונה משמעותית מ ,𝑋2אנו נבצע מבחן דו-צדדי ,וההשערות למבחן זה הינן: 𝐻𝑜 :𝜇1 = 𝜇2 )𝐻1 :𝜇1 ≠ 𝜇2 (19 ראשית כדי להבין את עקרונות המבחן ,נתבונן במקרה פשוט יותר ,שהוא מבחן חד צדדי: 𝐻𝑜 :𝜇1 = 𝜇2 )𝐻1 :𝜇1 < 𝜇2 (20 ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 13מתוך 36 קירשנר איור :6שתי התפלגויות נורמליות ,בעלות הפרש ממוצע . d ההפרש בין ממוצעי ההתפלגויות יסומן ̅𝑑 .למרות שנראה שההתפלגויות בעלות ממוצעים שונים ,האם ̅𝑑 גדול מספיק באמות מידה סטטיסטיות? כדי לענות על שאלה זו ולנסות ולדחות את השערת האפס ,צריכים לחשב משתנה אקראי שייצג את ̅𝑑 מתוך ההתפלגויות 𝑋1ו𝑋2 - וההשערות הסטטיסטיות 𝐻0ו .𝐻1 -משתנה אקראי חדש זה ,אשר מתפלג לפי התפלגות ,t נקרא גם סטטיסטי המבחן והוא מחושב על ידי נוסחה .22 מספר דרגות החופש של המבחן מחושבות לפי: )𝜈 = 𝜈1 + 𝜈2 = (𝑛1 − 1) + (𝑛2 − 1) = 𝑛1 + 𝑛2 − 2(21 𝛿 (𝑋̅2 − 𝑋̅1 ) − (𝜇2 − 𝜇1 ) 𝑑̅ − = )(22 𝑑𝑆 𝑑𝑆 =𝑡 בנוסחה 21מתקיים כי ,𝛿 = 𝜇2 − 𝜇1ו 𝑆𝑑 -מייצג את השונות המשוערכת של ההפרש בין המשתנים האקראיים והוא מחושב על ידי השונות המדגמית של X1ו X2 -בנוסחה :22 𝑠1 2 𝑠2 2 √ = 𝑑𝑆 + )(23 𝑛1 𝑛2 ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 14מתוך 36 קירשנר במבחן אנו מעוניינים לדחות את ההשערה שבה .𝛿(𝐻0 ) = 𝛿0 = 0עבור השערת האפס, ) 𝑡𝐻0 = 𝑡(𝛿0 ) = 𝑡(0עבור ההשערה המשנית.𝑡𝐻1 = 𝑡(𝛿1 ) , כדי להמשיך בניתוח הסטטיסטי ,נשאלת השאלה מהי ההסתברות ש t-למעשה מתפלג סביב אפס (כלומר השערת האפס נכונה)? אם ההסתברות הזו תהיה קטנה מספיק ,נוכל להסיק שהוא לא מתפלג סביב אפס ולכן גם ̅𝑑 שונה מאפס ,וניתן יהיה לדחות את .𝐻0הסתברות זו נקראת ה p-value -של המבחן .ערך זה מבטא את מובהקות התוצאה .זו ההסתברות לקבלת תוצאה קיצונית (בכיוון ) 𝐻1לפחות כמו התוצאה שהתקבלה בניסוי ,בהנחה שהשערת האפס נכונה .הערך הגדול ביותר ש p-value-יכול לקבל בשביל לדחות את 𝐻0הוא רמת המובהקות 𝛼. ) 𝑃𝑣𝑎𝑙𝑢𝑒 = 𝑃𝐻0 (𝑚𝑖𝑛𝑖𝑚𝑢𝑛𝑓𝑜𝑟𝑟𝑒𝑗𝑒𝑐𝑡𝑖𝑛𝑔𝐻0 אם 𝑒𝑢𝑙𝑎𝑣_ 𝛼 > Pנדחה את השערת האפס ברמת מובהקות 𝛼. אם 𝑒𝑢𝑙𝑎𝑣_ 𝛼 < Pלא נדחה את השערת האפס ברמת מובהקות 𝛼. שגיאה מסוג :I מבוטאת על ידי רמת המובהקות ,זו ההסתברות ל .false positive-אם ה p-value-קטן מ,𝛼- נוכל לדחות את השערת האפס .את הערך של 𝛼 צריך לקבוע מראש לפני תחילת הניסוי .ברוב המקרים נהוג לקבוע 𝛼 = 0.05או , 𝛼 = 0.01אך לעתים נדרש אף להחמיר .כדי לבצע את המבחן הסטטיסטי ,יש צורך לתרגם את 𝛼 לערך הקריטי ∗ 𝑡 לבדיקה שתאפשר דחיית .𝐻0במקרה של מבחן חד צדדי, מוצאים את ∗ 𝑡 מתוך טבלה (נספח א') ,כך שמתקיים: )𝛼 = P(𝑡𝐻0 > 𝑡 ∗ , 𝜈) = 𝑃 (𝑡𝐻0 > 𝑡1−𝛼 (𝜈))(24 𝜈 = 𝑛1 + 𝑛2 − 2 שגיאה מסוג :II ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 15מתוך 36 קירשנר מבוטאת על ידי 𝛽 .מייצגת את ההסתברות ש t-לא מתפלג לפי 𝐻0למרות שלא דחינו אותה ( .)false negativeאם קיבלנו הפרש ̅𝑑 ונניח כי 𝛿(𝐻1 ) = 𝛿1שמתאים להשערה 𝐻1שלנו אזי: 𝑑̅ − 𝛿1 ( 𝑃 = )𝜈 𝛽 = P(𝑡 ∗ > 𝑡𝐻1 , )> 𝑡, 𝜈)(25 𝑑𝑆 𝜈 = 𝑛1 + 𝑛2 − 2 בחירת 𝛿1הינה שרירותית עבור חישוב 𝛽 .בהמשך נראה כיצד נשתמש בבחירת 𝛿1בשביל לתכנן ניסוי 𝛽 רצוי. באיור 7מוצגות שתי התפלגויות :השמאלית מתארת את ההתפלגות של ̅𝑑 תחת 𝐻0והימנית את ההתפלגות תחת .𝐻1רמת המובהקות שלנו תכתיב את ה( 𝑡 ∗ -סף הדחייה) ואת המשתנה הסטטיסטי )t-statistic( tגדול מ .𝑡 ∗ -ניתן לראות באיור כי ניתן לדחות את .𝐻0השגיאה מסוג IIמחושבת על הזנב של ההתפלגות של ( 𝐻1לכן לוקחים 𝛿 = ) 𝛿(𝐻1שנכנס לתוך התחום של התפלגות .𝐻0 איור :7סכימת דחיית השערת האפס ,והשגיאות. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 16מתוך 36 קירשנר הסבר לאיור: פעמון שמאלי -התפלגות dבהנחת .H0 פעמון ימני -התפלגות dבהנחת .H1 שטח מסומן בירוק -שגיאה מסוג )β( IIשל המבחן הסטטיסטי. שטח מסומן מימין בפסים כחולים -שגיאה מסוג )α( Iשל המבחן הסטטיסטי. שטח מסומן מימין לקו השחור נקרא " "t-statisticובאדום p-Value -של תוצאות הניסוי. ההסתברויות המשלימות של שתי השגיאות הן :הדיוק ( )specificityוהעוצמה (.)power הדיוק ( (1 − αמתייחס להסתברות שאי דחיית 𝐻0נכונה. העוצמה ( )1 − βמתייחסת להסתברות ש 𝐻1 -הוא נכון בהינתן שדחינו את .𝐻0 כאשר נחשב את העוצמה נידרש להניח ̅𝑑 מסוים (נניח ש) 𝜇1 < 𝜇2 -ונחשב את 𝛽. קיימת אפשרות לנצל את ההנחה של ̅𝑑 בכדי לתכנן ניסוי כך שתתקבל עוצמה 1 − βרצויה. טבלה 1מסכמת את 2סוגי השגיאות ואת ההסתברויות המשלימות שלהן. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 17מתוך 36 קירשנר טבלה :1שני סוגי השגיאות וההסתברויות המשלימות שלהם. דחיית 𝐻0 תוצאה אי דחיית 𝐻0 אמת 𝐻0נכונה שגיאה מסוג I תוצאה=אמת 𝛂𝟏− 𝐻0לא נכונה 𝛂 False Positive Specificity קבלה שגויה של ההנחה 𝟏𝑯 שגיאה מסוג II תוצאה=אמת 𝛃𝟏− 𝜷 False negative קבלה שגויה של ההנחה 𝟎𝑯 עוצמה מבחן דו צדדי: במבחן דו צדדי נרצה לבדוק אם ממוצע של אוכלוסייה אחת שונה מזה של אוכלוסייה שנייה. ה P-valueיחושב תחת התפלגות tמשני צדי ההתפלגות .לכן ,ה 𝛼-שקבענו מתחלק באופן שווה בין שני צדי התפלגות .t כדי לדחות את השערת האפס נדרוש: 𝜶 ∗𝒕 > 𝒕 . 𝟐 = 𝑷(𝒕 < −𝒕∗ , 𝝂) = 𝑷(𝒕 > 𝒕∗ , 𝝂) , עדיין מתקיים כי 𝜈 = 𝑛1 + 𝑛2 − 2כמו במבחן החד-צדדי .בהתאם לכך ,ערך הסף יחושב על ידי )𝜈( 𝛼.𝑡 ∗ = 𝑡1− 2 בגלל שההתפלגות סימטרית ,בודקים רק אחת מההסתברויות הנ"ל. תכנון גודל מדגם-אנליזת עוצמה עבור מבחן tהשוואתי: ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 18מתוך 36 קירשנר ככל שמספר הדגימות גדל ,כך גם מספר דרגות החופש של התפלגות tגדל והוא מקרב ברמה טובה יותר את הפילוג הנורמלי .לפי כך ,נרצה מדגם גדול ככל האפשר כדי לשפר את הסטטיסטיקה .במקרים כמו מחקרים קליניים אנושיים וניסויים בחיות רצוי להקטין ככל האפשר את מספר הדגימות הנדרש כדי להקטין עלויות וסיכונים .האופטימיזציה אותה נבצע היא תכנון גודל מדגם שיבוצע על ידי בחינת עוצמת המבחן הסטטיסטי. כדי לבצע תכנון גודל מדגם בשיטת אנליזת עוצמה ,יש לקבוע את רמת המובהקות 𝛼 ,את העוצמה הרצויה למבחן 𝛽 1 −ואת ההבדל ̅𝑑 המינימלי המשמעותי 𝑛𝑖𝑚̅𝑑 שאותו נרצה לזהות באמצעות המבחן .במקרים רבים מקובל כי ,1 − 𝛽 = 0.8, 𝛼 = 0.05אך ניתן לבצע את התכנון לפי ערכים אחרים .ככל שמקטינים את רמת המובהקות ומגדילים את העוצמה ,כך תוצאות המבחן יותר אמינות (יותר מחמירות) .חשוב לציין שאם בוחרים 𝛽 𝛼,קטנים מדי ,המסקנות יכולות להוביל ל ,false negativeלמשל אם נחליט שאין הבדל בין 2אוכלוסיות כאשר למעשה כן יש הבדל. למציאת מספר הדגימות nהמינימלי הדרוש מכל קבוצה ,נניח כי השונות ידועה (מנחשים אותה אם אין ידע קודם) וקבועה עבור 2אוכלוסיות .𝑋1 , 𝑋2 נניח כי נרצה למצוא 𝑛𝑖𝑚̅𝑑 בין הממוצעים (תוחלות) של האוכלוסיות 𝜇1ו ,𝜇2 -במבחן חד צדדי, כפי שמתואר במשוואה ,20שבו יתקבלו 𝛽 𝛼,מסוימים. מכייון שאנו דנים במציאת גודל המדגם המינימלי ,אנו לא יודעים את מספר דרגות החופש ν שיתקבלו במבחן .לכן אנו נניח כי ישנן אינסוף דרגות חופש .במקרה כזה ,אנו עוסקים בהתפלגות נורמלית תקנית והיא מסומנת על ידי האות :Z 𝑝𝑍 = )∞ → 𝜈( 𝑝𝑡. 𝑝𝑍 = )∞ → 𝜈( 𝑝𝑡 )𝑝 = 𝑃(𝑡 < 𝑡𝑝 , 𝜈 → ∞)(26 מצד אחד ,נדרוש שההסתברות 𝛼 תקיים עבור ערך קריטי מסוים : 𝑚1 𝑚1 − 𝜇1 ))(27 𝜎𝑥1 > 𝑍( 𝑃 = ) 𝛼𝛼 = 𝑃(𝑍 > 𝑍1− ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 19מתוך 36 קירשנר ומצד שני ,נדרוש שההסתברות 𝛽 תקיים עבור ערך קריטי מסוים :𝑚2 𝜇2 − 𝑚2 ))(28 𝜎𝑥2 < 𝑍( 𝑃 = ) 𝛽1 − 𝛽 = 𝑃(𝑍 < 𝑍1− בביטוי ,28הסדר הוחלף בין 𝜇2ו 𝑚2 -כדי שהשבר יהיה חיובי .השונויות 𝜎𝑥1ו 𝜎𝑥2 -מייצגות את שונויות הדגימה של המשתנים האקראיים 𝑋1ו.𝑋2- כאשר דוגמים nפעמים באוכלוסייה בעלת שונות ידועה 𝜎 ,השונות של המדגם תהיה שהנחנו כי השונויות של 𝑋2 , 𝑋1זהות ,מתקבל כי: )(29 𝜎 𝑛√ = 𝜎𝑥1 = 𝜎𝑥2 נציב את נוסחה ( )29בתוך הביטוי עבור 𝛼𝑍 ונקבל: )(30 𝑚1 − 𝜇1 𝑛√𝜎⁄ = 𝛼𝑍 ומכאן נובע שהערך הקריטי של רמת המובהקות הוא : )𝑍𝛼 (31 𝜎 𝑛√ 𝑚1 = 𝜇1 + במבחן הסטטיסטי חישוב ההסתברויות 𝛽 𝛼,נעשה עבור אותו ערך קריטי ולכן: )𝑚1 = 𝑚2 (32 בהצבת נוסחאות ( )29ו )31(-לתוך הביטוי 𝛽 𝑍1−מתקבל: 𝜎 ) 𝛼𝑍 𝑛√ )(33 𝑛√𝜎 ⁄ 𝜇2 − (𝜇1 − = 𝛽𝑍1− ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 20מתוך 36 קירשנר 𝜎 𝑛√ .מכיוון ולאחר העברת אגפים נקבל: )(𝑍1−𝛽 + 𝑍𝛼 ) = 𝜇2 − 𝜇1 = 𝑑̅𝑚𝑖𝑛 (34 𝜎 𝑛√ לבסוף ,נמצא את ה n-המינימלי לתכנון הניסוי: 2 𝜎 [ = 𝑛𝑖𝑚𝑛 )(𝑍1−𝛽 + 𝑍𝛼 )] (35 𝑛𝑖𝑚̅𝑑 מבחן לטיב התאמה ליניארי: במעבדת "שערוך וקידום שגיאות" ,התאמתם קו בשיטת הריבועים הפחותים עם משוואה מסוג .𝑦 = 𝐿1 𝑥 + 𝐿0כמו כן ,ראינו כיצד לחשב את מקדם טיב המתאם .rמקדם הטיב אינו מייצג בלעדי או טוב במיוחד לאמינות הסטטיסטית של המתאם ,אותה יש לבדוק בנפרד .כיצד נבדוק אם הקו שהותאם בשיטה זו הוא אמין סטטיסטית? לשם כך ישנו מבחן tעל השיפוע 𝐿1שנמצא .אם 𝛬1מייצג את ערכו האמיתי של ,𝐿1אזי ההשערה הסטטיסטית הינה: )𝐻0 :𝛬1 = 0(36 𝐻1: 𝛬1 ≠ 0 למעשה ,במבחן זה בודקים אם הקו שהתאמנו אינו יותר טוב מאשר קו אופקי (שיפוע שווה .)0 כלומר בודקים אם הערכים שמדדנו הם אקראיים סביב קבוע כלשהו וניתנים לחיזוי על ידי הממוצע שלהם בלבד (מדובר בקבוע 𝐿0בהתאמת הקו) .שימו לב שמבחן זה הינו דו צדדי. מספר דרגות החופש במבחן tזה הינו מספר הדגימות (סה"כ) פחות ( 2כי ישנם 2פרמטרים במשוואה שהותאמה): )𝑡 ∗ = 𝑡1−𝛼 (𝑛 − 2)(37 2 ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 21מתוך 36 קירשנר המשתנה הסטטיסטי tהמחושב הינו: )(𝐿1 − 0 )(38 𝑆𝐿1 =𝑡 כאשר השונות של השיפוע 𝐿1משוערך על ידי: 𝑆2 𝑛 √= )(39 ∑𝑖=1(𝑥𝑖 − 𝑋̅)2 𝑆𝐿1 הממוצע הוא של כל הנתונים .שימו לב שהערך 𝑆 2הוא השונות המדגמית לפי נוסחה 17והיא ביחס להתאמה הליניארית. הערה חשובה :אם להתאמה שלכם 𝜋 פרמטרים ,מספר דרגות החופש יהיה 𝜋 .𝜈 = 𝑛 − .3מטרות הניסוי א .לימוד תכנון ניסוי תוך התחשבות בסטטיסטיקה. ב .ביצוע בדיקות סטטיסטיות על תוצאות ניסיוניות להוכחת השערה. ג .למדתם סטטיסטיקה? בוא נראה מה אפשר לעשות איתה. .4תקציר הניסוי מדענים בכלל ,ומהנדסים בפרט ,משתמשים בכלים סטטיסטיים כדי להדגים את המשמעותיות של התוצאות ולהסיק מסקנות ברות משמעות .בניסוי של השערוך והשגיאות למדתם על סוגי השגיאות השונות וכיצד לחשבן .בניסוי זה נלמד על התיאוריה והשימוש במבחנים סטטיסטיים כדי להעריך אם קיים הבדל משמעותי בין התוצאות של שני הניסויים. במהלך הניסוי נשתמש בצינורית פלסטיק המלאה בתמיסות של סוכרוז בריכוזים שונים. נמדוד את הצמיגות של תמיסות אלו בעזרת כדור מתגלגל ונבנה עקומת סטנדרט לריכוזים ידועים של הסוכר .לאחר מכן ,נמדוד את צמיגויתיהן של שתי תמיסות סוכר בעלות ריכוזים לא ידועים ונשווה ביניהן בעזרת מבחן סטטיסטי. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 22מתוך 36 קירשנר חלק ב' .5דו"ח מכין נא להגיש את הדו"ח המכין יחד עם קוד המטלב לפני ביצוע הניסוי במעבדה .לפירוט על פקודות המטלב ,נא להסתכל בסוף הפרוטוקול בנספח א'. .1חשבו את משקל הסוכרוז שיש לערבב עם 30גרם מים מזוקקים כדי לקבל תמיסות סוכרוז בעלות ריכוזים של 50ºBx , 40ºBx ,30ºBx, 20ºBx ו( .60ºBx-מעלה בריקס היא אחוז משקלי של הסוכר בתמיסה .הראו דוגמת חישוב עבור אחד הריכוזים). .2ויסקומטר כדור נופל מערב מדידת זמן נפילתו של כדור בתוך נוזל צמיג ניוטוני. בויסקומטר זה ,המרחק בין הכדור לדפנות צריך להיות גדול לפחות פי 3מקוטר הכדור מבלי להזניח את הדפנות .עבור ויסקומטר מסוג זה ,בהנחה שמספר ריינולדס = 𝑒𝑅 𝑑 𝑥𝑎𝑚𝑈𝜌 𝜇 נמוך מתקיים הקשר: 𝑔 (𝜌𝑠 − 𝜌𝑓 )𝑑 2 = )(40 𝜇18 𝑥𝑎𝑚𝑈 מתי לדעתכם עדיף השימוש בויסקומטר כדור נופל על פני ויסקומטר כדור מתגלגל ולהפך? מהם יתרונותיו וחסרונותיו של ויסקומטר כדור נופל? .3בבדיקה שנעשתה על פרסומים בכתב העת היוקרתי " "New England Journal of Medicineנמצא שרק ב 36%-מהמחקרים הקליניים שהציגו תוצאות שליליות היו בעלי עוצמה סטטיסטית גדולה מספיק כך שיוכלו לזהות שינוי משמעותי (המתואר על ידי הגודל 𝑛𝑖𝑚̅𝑑) של ,50%ורק ב 16%-מהמחקרים יכלו לזהות שינוי משמעותי של .)Moher et al. 1994( 25%תארו בקצרה את ההשלכות של שימוש במבחן tהשוואתי עם מעט מדי דגימות וכיצד יכול להיווצר מצב שבו מתקבלת תוצאה שלילית שגויה (אי דחיית .)𝐻0הסבירו בקצרה מדוע לדעתכם תופעה זו קיימת ,וציינו לפחות 2דרכים כיצד ניתן להתגבר עליה. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 23מתוך 36 קירשנר .4נסחו מבחן דו-צדדי השוואתי הבודק אם יש הבדל בין 2משתנים אקראיים המתפלגים נורמלית 𝑌1ו .𝑌2 -למשתנים יש סטיית תקן זהה ,ומהאוכלוסיות של כל אחד נלקח n דגימות .נסחו את החישוב הכללי עבור עוצמת המבחן עבור הבדל 𝑛𝑖𝑚̅𝑑. עליכם ליצור מבחן כללי כלשהו (אין צורך בחישובים)-רק הצגה פרמטרית .5במטלב ,צרו 3וקטורים C,B,Aבעלי 15איברים כל אחד המתפלגים נורמלית עם ממוצעים וסטיות תקן לפי טבלה .2הציגו היסטוגרמות עבור כל וקטור באמצעות פקודת .histעדיף להשתמש בפקודה ( subplotעם 3שורות ועמדה אחת) ,עבור כל משתנה בשביל תצוגה נוחה .על גבי כל היסטוגרמה הוסיפו עקומת נורמלית (בצבע שונה) בעלת מקצוע וסטיית תקן כנתון בטבלה ( 2השתמשו בנוסחה 18ובפקודת .)hold on/offהכפילו את העקומות בקבוע שרירותי כך שצורתן הגאוסיאנית תהיה ברורה .וודאו שלכל הגרפים טווחים זהים בצירי .Y,Xבנוסף הציגו על גרף אחד ,boxplotsעם ממוצעים עבור הוקטורים שיצרתם. טבלה :2פרמטרים סטטיסטיים עבור סעיף 5 C B A 14 11 10 𝜇 3 3 3 𝜎 .6נסחו מבחן tהשוואתי חד-צדדי ובצעו אותו בין הוקטורים Bל A-ובין הוקטורים Cל- ,Aמהנתונים שייצרתם בסעיף .5במבחנים ,בידקו את ההשערות שהממוצעים של B ו C-גדולים מ .A-בצעו את המבחנים ברמת מובהקות של 𝛼 = 0.05ושוב ברמת מובהקות של .𝛼 = 0.01הציגו תוצאות ותנו הסבר קצר למשמעותן. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 24מתוך 36 קירשנר חלק ג' .4תיאור הניסוי ראשית נמצא את הקשר בין צמיגות תמיסת הסוכרוז לבין ריכוז הסוכרוז ,על ידי זמן הגלגול של כדור למרחק קבוע .הפרמטרים המייצגים את הקשר הזה ייתנו עקום סטנדרט למדידת צמיגות .בשלב הבא ,נמדוד את צמיגותן של שתי תמיסות סוכרוז בריכוזים לא ידועים .בעיבוד הנתונים ,נבצע מבחן סטטיסטי לבדיקה אם שתי תמיסות אלו שונות אחת מהשנייה. ציוד: )1 )2 )3 )4 )5 )6 )7 )8 מתקן ויסקומטר מפלסטיק ,בעל 3זוויות שונות. שבעה צינורות פרספקס (אורך – ~25ס"מ ,קוטר פנימי 6.5מ"מ). שבעה כדורי נירוסטה (קוטר 6 -מ"מ ,צפיפות – .)7.8 g/cm3 חמש תמיסות סוכרוז בריכוזים שונים ידועים. שתי תמיסות סוכרוז בריכוזים לא ידועים. טיימר למדידת זמן גלגול הכדורים. קליבר. מד טמפרטורה. מערכת הניסוי מוצגת באיור .במערכת אפשרות לביצוע מדידת זמן גלגול בשלושה זוויות שונות .בצדו האחד נמצא חלקו העליון של הצינור .בצידו השני נמצא חלקו התחתון של הצינור. כאשר מוכנים להתחיל בגלגול ,מטים את הצינור מטה כך שהכדור יתחיל בגלגול והחלק התחתון של הצינור יושב היטב בגומחה המתאימה לו. א ב איור :8מערכת הניסוי .א .מבט על המערכת עם צינור מלא בתמיסת סוכרוז .200Bxב. מבט על החלק העליון של הצינור ,בו ניתן להבחין בכדור נירוסטה המוחזק על ידי מגנט. הסרגל של סנטימטרים. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 25מתוך 36 קירשנר .6מהלך הניסויים א .תחילה ,מדדו ורשמו את הטמפרטורה בחדר. ב .ניסוי :1עקום סטנדרט לצמיגות תמיסת סוכרוז עבור כל תמיסת סוכרוז בריכוז ידוע ,מדדו את הזמן הלוקח לכדור להתגלגל למרחק של 4ס"מ 10 ,פעמים לכל תמיסה. )1וודאו שהצינורות למדידות צמיגות מלאים עד הסוף בתמיסה ,שאינם מטפטפים ושהכדור בפנים .רשמו את המיקום החריץ במתקן הויסקומטר שבו תבצעו את הניסוי ,לפי הוראותיו של המדריך. )2סמנו על הצינוריות שקיבלתם שני סימונים באמצעות טוש ,כאשר המרחק בין הסימונים הוא לפחות 4ס"מ .מרחק זה יהיה מרחק הבקרה בו תמדדו את זמן (ומהירות) הגלגול. )3שחררו את הכדור כך שיתחיל להתגלגל מעל לקו שחור חיצוני המסומן על הצינורית (ראה )4המרחק בין זוג קווים שחורים חיצוני ופנימי הוא המרחק המינימלי הדרוש להשלמת התאוצה של הכדור ולהגעה למהירות קבועה. )5כאשר הכדור חולף על פני סימון העליון שסימנתם ,התחילו במדידת זמן הגלגול באמצעות הטיימר .כאשר הכדור חולף על פני הסימון התחתון של שסימנתם ,עצרו את הטיימר. )6רשמו את זמן הגלגול אותו מדדתם ,וחיזרו שוב על שלבים ,4-7סך הכל 10 חזרות עבור כל תמיסה. הערה :ניתן לתת לכדור להתגלגל עד סוף הצינור ,ולהפוך אותו בין מדידות עוקבות. ג .ניסוי :2תמיסות לא ידועות עבור שתי תמיסות בריכוזים לא ידועים ,בצעו מדידת זמני הגלגול של כדורים באותו אופן כמו בניסוי 1לעיל .רישמו לפניכם את השמות של התמיסות ,וציינו אותם בדו"ח המסכם. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 26מתוך 36 קירשנר איור :9צינורית אחת ,בה רואים את הקווים השחורים .כל זוג קווים מסמן את המרחק המינימלי שנדרש בשביל שהכדורים יגיעו למהירות הגלגול המקסימלית שלהם. חלק ד' .7ניתוח תוצאות כל העבודה ,כולל יצירת גרפים ,יכולה להיעשות דרך אקסל או דרך מטלב .לפירוט על פקודות מטלב ,ראו נספח ה'. א .ציינו לפחות 3מקורות לשגיאה ואת סוג השגיאה בניסויים שביצעתם .אין צורך בחישובים. ב .חשבו את מספר ריינולדס הממוצע עבור כל תמיסת סוכרוז בריכוז ידוע ,ובדקו כי למינאריות מתקיימת (איור 2ב). שימו לב שאם למינאריות לא מתקיימת עבור נתונים מסוימים ,לא ניתן להשתמש בהם ויש להשמיטם. ג .בעזרת הנתונים בנספח ב ' ,התאימו קו ישר בשיטת הריבועים הפחותים עבור תמיסות סוכרוז בתחום 200Bx – 500Bxבטמפרטורה שבה ביצעתם את הניסוי (השתמשו בפונקציה .)fit המשתנה הבלתי תלוי הוא 1 ]𝑒𝑠𝑜𝑟𝑐𝑢𝑆[ ,והמשתנה התלוי הוא 1 𝜇 (𝜇 היא צמיגות התמיסה). מצאו את r2של ההתאמה.הציגו יחד על אותו הגרף את כל הנתונים ,הקו שהתאמתם ,את משוואת הקו ואתה r2 -של ההתאמה. מה היה קורה אם הייתם מתבקשים להתאים קו ישר עבור ?00Bx – 300Bxהייתם מקבלים התאמה ליניארית יותר/פחות טובה מאשר ?200Bx – 500Bx ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 27מתוך 36 קירשנר מהי לדעתכם הסיבה לשינוי? הציגו גרף גם עבור מצב זה ו מצאו את r2של ההתאמה. ד .לכל הנתונים שאספתם מתמיסות הסוכרוז בריכוזים ידועים (ניסוי )1התאימו קו ישר בשיטת הריבועים הפחותים (השתמשו בפונקציה .)fit המשתנה הבלתי תלוי הוא 𝜇 (צמיגות התמיסה) והמשתנה התלוי הוא ( tזמן הגלגול). מצאו את r2של ההתאמה.הציגו על אותו הגרף את כל הנתונים ,הקו שהתאמתם ,את משוואת הקו ואת ה- r2של ההתאמה. ה- .חשבו את ריכוזי הסוכרוז (ממוצעים) של התמיסות הידועות באמצעות הקשרים שמצאתם בסעיפים ג' ו -ד'. הציגו היסטוגרמות עבור ריכוז הסוכרוז המחושב לכל תמיסה ידועה .בשבילתצוגה נוחה (מומלץ להשתמש בפקודת subplotעם 5שורות ועמודה אחת). על גבי כל היסטוגרמה הוסיפו עקומת התפלגות נורמלית (בצבע שונה) בעלתממוצע וסטיית תקן מדגמית (השתמשו בנוסחה Error! Reference source not found.ובפקודות .)hold on/offהכפילו את העקומות בקבוע שרירותי כך שצורתן הגאוסיאנית תהיה ברורה .וודאו שלכל הגרפים טווח זהה בצירים Xו.Y - ו .הציגו על גרף אחד ( boxplotsעם ממוצעים) של ריכוזי הסוכרוז המחושבים (כל הנתונים) עבור התמיסות בריכוזים ידועים .ציר Xהוא ריכוזי הסוכרוז הידועים, וציר Yריכוזי הסוכרוז המחושבים .וודאו שלכל הגרפים טווח זהה בציר Yבשביל שיהיה ניתן להשוות ביניהם. ז .בצעו מבחן tדו-צדדי לשיפוע הקו שהתאמתם בסעיף ד' .הציגו את חישוביכם ודונו במשמעויות התוצאות .השתמשו בפונקציית tinvלמציאת הערך הקריטי * ,tתוך וידוי כי קיבלתם את הערך הנכון על ידי נספח ב'. ח .מצאו את ריכוזי הסוכרוז (ממוצעים) בשתי התמיסות הלא ידועות שבדקתם באמצעות ההתאמות הליניאריות מסעיפים ג' ו -ד' .הציגו על גרף אחד את הקו ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 28מתוך 36 קירשנר שהתאמתם בסעיף ג' ואת הריכוזים המחושבים של שתי התמיסות הלא ידועות. בנוסף ,הציגו היסטוגרמות עבור כל תמיסה לא ידועה ,ו( boxplots -עם ממוצעים). ט .בצעו מבחן tהשוואתי דו-צדדי לריכוזי הסוכרוז של התמיסות הלא ידועות שבדקתם .הציגו את חישוביכם .השתמשו בפונקציית tinvלמציאת הערך הקריטי * ,tתוך וידוי כי קיבלתם את הערך הנכון על ידי נספח ב'. י .הסבירו ,באמצעות 2דוגמאות קלינית-מחקריות ,את החשיבות ואופן יישומו של ,power analysisוכיצד הוא מסייע לבניית מחקרים ברי משמעות והשקעה מיטביים. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 29מתוך 36 קירשנר .8דוח סופי להגשה א .דף שער עם שמות ,מספרי זהות ,מספר הקבוצה ,שם הניסוי ותאריך ביצוע הניסוי. ב .תקציר המסכם את הדו"ח :רקע ,מטרות ,מהלך הניסוי ,תוצאות ,מסקנות .אורך כחצי עמוד. ג .מבוא באורך של עד שני עמודים .המבוא יכלול בתוכו: )1תמצית הרקע התיאורטי )2מטרות הניסוי )3תיאור הניסוי בקצרה ד .גוף הדו"ח :כל התוצאות הגולמיות ,וניתוחן .יש להציג את תוצאות הניסוי (כולל הצגה גרפית) וניתוחן .יש לענות על כל השאלות בסעיף ניתוח התוצאות. ה .סיכום ומסקנות :חצי עמוד עד עמוד .יש להתייחס למשמעויות של חלקי ניתוח התוצאות בניסוי זה ,יחד עם חשיבותן למחקר בכלל .קשרו בין מסקנותיכם בניסוי שיערוך וקידום שגיאות לבין ניסוי זה. על כל הגרפים להיות ברורים ככל הניתן – נקודות יורדו על כל גרף שאינו ברור. חשוב להסביר משמעות של כל גרף הדו"ח יוגש באותן הזוגות כפי שעבדתם במעבדה .ההגשה תהיה עד שבועיים מיום ביצוע המעבדה. את הדו"ח יש להגיש בעותק קשיח ובדוא"ל [email protected] ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 30מתוך 36 קירשנר המדריך: נספח א' :טבלת הסתברות מצטברת (הפוכה) עבור התפלגות .t הערכים tשל משתנה אקראי המתפלג לפי התפלגות ,tכתלות בהסתברות )* P(t>tומספר דרגות החופש (.)df t-Distribution )p = P(t>t*) = P(t>t1-p Probability t = t*= t1-p ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 31מתוך 36 קירשנר נספח ב' :צמיגות תמיסות סוכרוז נתון כתלות בטמפרטורה וריכוז סוכרוז טהור במים ,ביחידות של : cP = 1x10-2 Poise ρ 1.018 cP 1.144 g/L 50.9 Sucr. 5 1.038 1.333 103.8 10 1.059 1.589 158.90 15 1.081 1.941 216.20 20 1.104 2.442 275.90 25 1.127 3.181 338.10 30 1.151 4.314 402.90 35 1.176 6.150 470.60 40 1.203 9.360 541.10 45 1.230 15.400 614.80 50 oBx ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 32מתוך 36 קירשנר נספח ג' :צפיפות תמיסת סוכרוז טהור כתלות באחוז משקלי (( )DSמתוך .)Asadi 2005 ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 33מתוך 36 קירשנר נספח ד' :פקודות מטלב שימושיות ( * = הפונקציה מותקנת וקיימת במחשבים בחוות הפקולטה). )normrnd(mu,sigma,m,n יצירת מטריצה בעלת mשורות ו n-עמודות ,אשר איבריה נלקחו מהתפלגות נורמלית בעלת ממוצע muוסטיית תקן .sigma )boxplot(X יצירת דיאגרמות boxplotשל מספר ניסויים כמספר העמודות של מטריצת Xומספר שורות כמספר החזרות בכל ניסוי .הדיאגרמה הבאה מציגה דוגמה לפלט הפונקציה (עמודה אחת ממטריצת .)X * * אחוזון (“whisker”) 99.65% אחוזון (“3rd Quartile”) 75.00% אחוזון (“2nd Quartile”) 50.00% אחוזון (“1st Quartile”) 25.00% אחוזון (“whisker”) 0.3500% חריג אחוזון 50.00%מייצג את הערך ש 50.00% -מהנתונים קטנים/שווים אליו ( .)medianה “box” -תחום על ידי ה“whiskers” - האחוזונים 75.00%ו.25.00% - מייצגים את האחוזונים 0.3500%ו .99.65% -חריגים הינם נתונים שנמצאים מתחת לאחוזון 0.3500%או מעל אחוזון .99.65% הערה :יש להוסיף סמן למיקום הממוצעים האלגבריים לאחר הפקודה ( hold onנותן את האפשרות לצייר על אותו הגרף עוד פעמים) ,ואז באמצעות scatterשל ערכי הממוצעים (מצייר את הממוצעים כנקודות). )hist(A,nbins יצירת היסטוגרמה מוקטור הנתונים ,Aאשר מראה את מספר הנתונים הנמצאים בתוך nbinsתחומים בגודל שווה. למשל ,אם nbinsשווה ,5הפונקציה מחלקת את הטווח של הנתונים ב A -ל 5 -תחומים שווים ,ומוצא כמה מהם נופלים בכל תחום. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 34מתוך 36 קירשנר )ffun=fittype(expr יצירת אובייקט התאמה ffunמתוך ,exprשמשתמשים בו בפונציית .fitבמקרה של התאמת פונקציה ) f(xבעלת משתנה יחיד expr ,יכול להיות מחרוזת תווים שמבטאת את ) f(xכפונציה של xעם פרמטרים שאותם יש למצוא .למשל, עבור התאמה ריבועית expr ,יכול להיות ','a+b*x+c*x^2 כאשר b ,aו c -הינם הפרמטרים .ישנם עוד שימושים מגוונים וחזקים של פונקציה זו. )t=tinv(p,free מוצא את הערך tשעבורו ההסתברות המצטברת של התפלגות tשווה .pהמשתנה freeהוא מספר דרגות החופש. )>[myfit,gof]=fit(x,y,ffun,<fitoptions ביצוע התאמה לפי אובייקט ההתאמה ffunלנתונים x (משתנה בלתי-תלוי) ו( y -משתנה תלוי) .התוצאה myfit הינו משתנה מסוג ,cfitוניתן לקבל את הערכים שהותאמו לפרמטרים על ידי, * * * myfit.ParamName ניתן להגדיר ב <fitoptions> -אופציות נוספות (ללא הסוגריים) ,כגון StartPointשמגדיר את הניחוש ההתחלתי שפונקצית fitתשתמש במציאת הפרמטרים שהוגדרו ב- ,ffunעל ידי נתינת וקטור הערכים לניחוש כל פרמטר .אופן הגדרה היא (עבור התאמה עם שני פרמטרים): )]fit(x,y,ffun,'StartPoint',[1 2 הפלט השני gofהינו structureהנותן מידע השימושי להערכת טיב ההתאמה .ספציפית r2 ,נתון על ידי, gof.rsquare ישנן עוד הרבה הגדרות שימושיות שאותן ניתן לשרשר בתוך ,fitואותן ניתן למצוא תחת הערך " "fitoptionsב help -של מטלב. ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 35מתוך 36 קירשנר hold on – hold onלאחר יצירת גרף ושרטוט עקומה ,קוראים לפקודה זו כדי לאפשר הוספת עקומות נוספות ללא איתחול הגרף. – hold offכל שינוי שיעשה בגרף עכשיו יאתחל אותו (ריק). )subplot(rows,cols,ind יצירת "מטריצה" של גרפים בתוך figureאחד ,כאשר למטריצה מספר שורות rowsומספר עמודות .colsאת הפקודה הזו יש לקרוא לפני כל פקודה ליצירת גרף חדש, כאשר rowsו cols -אינם משתנים .כדי לבחור את המיקום של הגרף החדש בתוך "מטריצת" הגרפים ,בוחרים ערך ל- indמתאים ,כאשר indהוא מספר הגרף ב"מטריצה". מספור הגרפים הוא משמאל לימין ,ומלמעלה למטה. לדוגמה: hold off 1 2 3 4 5 6 נספח ה' :מקורות 1. Asadi, M. Beet-Sugar Handbook (p. 779 – 780). John Wiley & Sons (2005). 2. Hoynak PX and Bollenback GN, This is Liquid Sugar (p. 224 – 225). Key Book Service, Inc. (1966) 2nd Ed. 3. Hubbard RM and Brown GG. The rolling ball viscometer. Indust Eng Chem 15(3): 212-218 (1943). 4. Moher D, Dulberg CS, Wells GA. Statistical Power, Sample Size, and Their Reporting in Randomized Controlled Trials. JAMA 272: 122-124 (1994). 5. Quintas M et al. Rheology of supersaturated sucrose solutions. J Food Eng 77: 844-852 (2006). ניסוי :סטטיסטיקה שימושית עדכון אחרון 06/05/2015 :ע"י נועה עמוד 36מתוך 36 קירשנר
© Copyright 2025