בחן מסכם - עיבוד תמונות

‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫‪ - 048860‬עיבוד תמונות ‪ -‬בחן מסכם‬
‫משך הבוחן ‪ 100 -‬דקות‪ .‬מותר כל חומר עזר‪ .‬יש לענות על ‪ 4‬עד ‪ 6‬שאלות באופן שתצטברנה ‪10‬‬
‫כוכביות‪ .‬משקל כל כוכבית ‪ 10 -‬נקודות‪ .‬התשובות יבדקו לפי סדרן במחברת הבחינה עד להשלמת‬
‫‪ 10‬כוכביות‪ .‬בהצלחה!‬
‫‪ .1‬קריטריון טיב לתמונות)**(‬
‫א‪ .‬המודל של ‪ Mannos & Sakrison‬מורכב מפעולה לא ליניארית וממעבר דרך מערכת‬
‫ליניארית ‪ -‬מסנן ‪ -‬בהמשך‪ .‬אם במערכת ראייה מלאכותית מסויימת‪ ,‬המדמה את‬
‫מערכת הראייה האנושית אין יכולת הבחנה בסריגים בתדר של ]‪ ,10[cpd‬איזה שינוי‬
‫ניתן לבצע במודל של ‪ Mannos & Sakrison‬כך שיתאים למערכת ראייה זו? )רמז – רצוי‬
‫להתבונן במסנן במישור המקום(‪.‬‬
‫ב‪ .‬יש לתת דוגמא לשלישיית תמונות ‪ I, Ia, Ib‬כך ש‪ Ia -‬ו‪ Ib -‬דומות ל‪ I-‬באותה המידה לפי‬
‫המטריקה של ‪ ,Mannos & Sakrison‬אולם צופה אנושי יטען ש‪ Ia -‬דומה יותר ל‪I-‬‬
‫לעומת ‪.Ib‬‬
‫‪ .2‬עיבוד תמונות צבע)**(‬
‫א‪ .‬נתונה תמונה במישור ‪ .A, C1, C2‬פרט האם ישתנו הבהירות‪ ,‬הגוון והרוויה עבור כל אחד‬
‫מהשינויים הבאים בערכי הערוצים השונים‪:‬‬
‫)‪(1‬‬
‫‪ = 2C , C‬‬
‫‪ = 2C‬‬
‫‪C‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫)‪(2‬‬
‫‪ = 1C , C‬‬
‫‪ = 2C‬‬
‫‪ , C‬כאשר נתון כי ‪. C1 = 2C2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫ב‪ .‬במהלך שידור ערוצי התמונה השונים‪ ,‬שודרו לצופה ‪ 2‬תמונות שגויות‪ ,‬כאשר ערך‬
‫השגיאה זהה בשתיהן‪ .‬בתמונה הראשונה השגיאה הינה בערוץ ‪ ,C1‬ובשנייה בערוץ‬
‫‪.C2‬‬
‫אילו מן התמונות תיראה קרובה יותר לתמונה המקורית )ללא שגיאה( לצופה אנושי?‬
‫‪ 2π x ‬‬
‫‪. C1 = C0 + 2C0 cos ‬‬
‫ג‪ .‬כעת נתון כי‪ , C2 = 0 , A = A0 :‬ו‪ -‬‬
‫‪ x0 ‬‬
‫צופה אנושי עומד במרחק ‪ d‬מהמסך עליו מוקרנת התמונה‪ ,‬ורואה תמונה אחידה חלקה‬
‫בצבע צהוב‪ .‬אם מחליפים בין ערוץ ‪ C1‬לערוץ ‪ – A‬מה יראה הצופה מאותו המיקום?‬
‫‪1‬‬
‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫‪ .3‬שחזור אות מפאזה)***(‬
‫א‪ .‬מבין התמונות להלן בחר‪:‬‬
‫)‪ (1‬זוג תמונות בעלות אמפליטודה דומה ככל האפשר‪ ,‬ופאזה שונה‪.‬‬
‫)‪ (2‬זוג תמונות בעלות פאזה דומה ככל האפשר‪ ,‬ואמפליטודה שונה‪.‬‬
‫יש לנמק את הבחירות‪.‬‬
‫)‪(b‬‬
‫)‪(d‬‬
‫)‪(f‬‬
‫)‪(a‬‬
‫)‪(c‬‬
‫)‪(e‬‬
‫ב‪ .‬נתון אות בדיד באורך ‪ . x ( n ) = ( 2, 2 ) :2‬מהי הפאזה שלו? האם ניתן לשחזרו )עד כדי כפל‬
‫בקבוע( מתוך הפאזה בלבד? יש לנמק‪.‬‬
‫‪2‬‬
‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫‪ .4‬פירמידה לפלסיאנית)*(‬
‫סטודנט בונה אתר אינטרנט לקורס עיבוד תמונות‪ .‬בעבור התמונות שמופיעות באתר‪ ,‬שהגדולה‬
‫ביותר מביניהן הינה בגודל של ‪ ,2MB‬הדרישה הינה שכעבור ‪ 200msec‬לכל היותר תעלה‬
‫התמונה‪ ,‬מכל מחשב בקמפוס‪ .‬נתון כי טווח מהירויות החיבור בקמפוס הינו ‪.1.5-10 Mbps‬‬
‫יש להציע סכמה לפיה יעמוד האתר בדרישות‪ ,‬ולפרט את התהליך עבור מהירויות של ‪,Mbps10‬‬
‫‪ ,5 Mbps‬ו‪.1.5 Mbps -‬‬
‫‪ .5‬התמרת ‪(**)Wavelet‬‬
‫א‪ .‬מהם ההבדלים העקרוניים בין התמרת גאבור דיסקרטית לבין התמרת ‪ Wavelets‬מבחינת‬
‫תמונת הזמן‪-‬תדר המתקבלת?‬
‫ב‪ .‬נתונה קבוצת פונקציות‬
‫‪N‬‬
‫}) ‪ {ϕ ( x‬המשמשת בסיס ל‪) -‬‬
‫‪k =1‬‬
‫‪k‬‬
‫(‬
‫‪ . Ψ = span {ϕ k ( x )}k =1‬עבור‬
‫‪N‬‬
‫‪N‬‬
‫פונקציה ‪ , f ( x ) ∈ Ψ‬האם תמיד מתקיים ) ‪ ? f ( x) = ∑ f ( x), ϕk ( x ) ⋅ϕk ( x‬נמק‪.‬‬
‫‪k =1‬‬
‫ג‪ .‬נסמן‬
‫) ‪ . ak = f ( x), ϕ k ( x‬האם ניתן לנסח משפט דמוי פרסוול המקשר בין אנרגיית‬
‫המקדמים ‪ ak‬לבין אנרגיית האות ) ‪ ? f ( x‬יש לנמק ולפרט תנאים‪ ,‬אם משפט כזה תקף‪.‬‬
‫ד‪ .‬מהם יתרונותיו וחסרונותיו של בסיס ‪? Haar‬‬
‫‪ .6‬דחיסת תמונות ‪(***)Still‬‬
‫א‪ .‬נתונה תמונה בעלת ההיסטוגרמה הבאה‪:‬‬
‫‪70 110‬‬
‫כפי שניתן לראות‪ ,‬התמונה הינה כהה יחסית‪ .‬על מנת לשפר את טווח רמות האפור בתמונה‪,‬‬
‫התבצעה מתיחת היסטוגרמה‪ ,‬כך שערכי רמות האפור בתמונה לאחר המתיחה נעים בתחום‬
‫‪ .0-255‬המתיחה התבצעה באמצעות ‪ Look up table‬מתאימה‪.‬‬
‫)‪ (1‬בדחיסת ‪ loss-less‬האם יחס הדחיסה של התמונה המקורית גדול‪/‬קטן מה של התמונה‬
‫לאחר המתיחה? מהם יחסי הדחיסה של התמונות?‬
‫הדרכה‪ :‬מהי האנטרופיה של התמונות?‬
‫)‪ (2‬בדחיסת ‪ – Lossy‬האם עבור שגיאה ריבועית ממוצעת זהה )קבועה ונתונה( יחס הדחיסה‬
‫של התמונה המקורית גדול‪/‬קטן מזה של התמונה לאחר המתיחה?‬
‫‪3‬‬
‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫ב‪ .‬בתהליך דחיסת ‪ ,JPEG‬נתון בלוק ‪ 8x8‬בהתמרת ה‪ DCT-‬של תמונה‪ ,‬לאחר שלב‬
‫הקוונטיזציה‪ .‬יש לרשום את שתי מילות הקוד הראשונות המתאימות לקידוד מקדמי ה‪-‬‬
‫‪.AC‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪-3‬‬
‫‪55‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪6‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪-3‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪4‬‬
‫‪0‬‬
‫‪-4‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪-6‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪ .7‬זיהוי שפות)**(‬
‫א‪ .‬להלן האופרטור האופטימלי של ‪:Canny‬‬
‫יש להסביר איך תשתנה‪ ,‬באופן איכותי‪ ,‬צורת האופרטור‪ ,‬עם הגדלת החשיבות היחסית של‬
‫כל אחד מ‪ 3-‬הקריטריונים‪:‬‬
‫)‪ (1‬גילוי‬
‫)‪ (2‬מיקום‬
‫)‪ (3‬שפה יחידה‬
‫ב‪ .‬נתון אופרטור לגילוי שפות‪ ,‬שהתגובה להלם שלו חסומה בתחום ]‪ ,[-W, W‬כאשר ‪.W=2‬‬
‫עבור אופרטור זה‪ ,‬כיצד תשתנה התגובה לשפה מהצורה‪:‬‬
‫ביחס לתגובה לשפה של מדרגה‪:‬‬
‫‪4‬‬
‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫‪ .8‬שיטות דור ב' לדחיסת תמונות ‪(**)Still‬‬
‫התמונה הבאה קודדה באמצעות קידוד שפות ומרקם‪ ,‬התפורה בדיוק לתמונות מסוגה‪.‬‬
‫‪y‬‬
‫‪x‬‬
‫‪100‬‬
‫‪pixels‬‬
‫‪100 pixels‬‬
‫מאפייני תמונות מסוג זה הינן‪:‬‬
‫‪-‬‬
‫מכילות אך ורק ריבועים וחלקי עיגולים‪ ,‬או צורות המורכבות מריבועים וחלקי עיגולים‪.‬‬
‫‪-‬‬
‫כל הצורות )וגם הרקע( הינן בעלות צבע אחיד‪ ,‬הנע בתחום רמות האפור ‪.0-127‬‬
‫א‪ .‬מהו מספר הסיביות המינימלי הנדרש‪ ,‬באופן כללי‪ ,‬לשידור ריבוע )כולל צבעו( ?‬
‫ב‪ .‬מהו מספר הסיביות המינימלי הנדרש‪ ,‬באופן כללי‪ ,‬לשידור חלק של עיגול )כולל צבעו(?‬
‫ניתן להניח כי הרזולוציה הזוויתית הינה של מעלה בודדת‪.‬‬
‫נתון כי על מנת לקודד תמונה שלמה‪ ,‬הוסיפו סיבית נוספת בתחילת שידור כל צורה – ‪ 0‬עבור‬
‫ריבוע‪ ,‬ו‪ 1-‬עבור חלק עיגול‪ .‬לפי סיבית האינדיקטור יודע המפענח כמה סיביות לשייך לצורה‬
‫הנקלטת‪ ,‬ואיך לפרש אותן‪.‬‬
‫ג‪ .‬התמונה הנ"ל קודדה ביחס דחיסה של ‪ ,1:171.3‬ביחס לתמונה סטנדרטית בעלת ‪256‬‬
‫רמות אפור‪ ,‬באותו הגודל‪ .‬מהו יחס הדחיסה לאחר שה"פאקמן" )בחלקה בתחתון של‬
‫התמונה( יאכל את הקוביות הקטנות לידו ?‬
‫‪5‬‬
‫הטכניון ‪ -‬מכון טכנולוגי לישראל‬
‫‪ 24‬ביוני ‪2009‬‬
‫הפקולטה להנדסת חשמל‬
‫לימודי מוסמכים‬
‫‪ .9‬שחזור תמונות)**(‬
‫צלם צילם את התמונה הבאה‪:‬‬
‫כאשר רמת האפור של הכד הינה ‪ ,80‬ושל הרקע – ‪.210‬‬
‫תוך כדי צילום ידו נעה כלפי מטה בקו ישר‪ ,‬במהירות קבועה של ‪ 6‬פיקסלים ל‪ .frame-‬מהי‬
‫התמונה המתקבלת? האם ניתן לשחזר את התמונה המקורית? אם כן‪ ,‬כיצד?‬
‫‪ .10‬דחיסת רצף תמונות)*(‬
‫א‪ .‬נתונים שני זוגות תמונות עוקבות בוידאו‪ .‬התמונה הראשונה בכל אחד מ‪2-‬‬
‫הזוגות מקודדת כתמונת ‪ ,I‬ואילו השנייה מקודדת כתמונת ‪ P‬ביחס לראשונה‪:‬‬
‫‪48pxls‬‬
‫‪86pxls‬‬
‫‪70pxls‬‬
‫‪32pxls‬‬
‫‪32pxls‬‬
‫‪70pxls‬‬
‫‪16pxls‬‬
‫‪54pxls‬‬
‫לאילו משני זוגות התמונות צפוי יחס דחיסה טוב יותר?‬
‫ב‪ .‬יש לתת דוגמא לתמונה עם חפץ יחיד שנע‪ ,‬בה תנועה מהירה עשויה להיות ניתנת‬
‫לקידוד ביחס דחיסה גדול יותר לעומת תנועה איטית‪.‬‬
‫‪6‬‬