חיפוש מידע – נובמבר 2014

‫חיפוש במאגרי מידע‬
‫נמרוד פלג‪( ,‬עדכון‪ :‬מרץ ‪)2014‬‬
‫השתתפו בהכנה‪ :‬ילנה יארושנקו‪ ,‬ספריית הטכניון‪ ,‬גלית גרינברג‪ ,‬ספריית חשמל‬
‫למה סקר ספרות‬
‫• ברוב – אם לא בכל – הפרויקטים נדרש בתחילה‬
‫"סקר ספרות"‬
‫• המטרה העיקרית היא לימוד נושא הפרויקט‬
‫בהיבט הרחב‪ ,‬עם "הצצה" למחקר‪:‬‬
‫מה קיים בעולם‪ ,‬סוגי פתרונות‪ ,‬יתרונות וחסרונות‬
‫של גישות שונות לפתרון הבעיה‪.‬‬
‫• לביצוע סקר ספרות יש כלים רבים‪ ,‬ונציג כאן כמה‬
‫מהם הרלוונטיים במיוחד בהנדסת חשמל‬
‫סקר ספרות‬
‫בעולם האקדמי‪ ,‬בכל שנה‪:‬‬
‫• מאות אלפי ספרים‪ ,‬מאמרים בעיתונים‬
‫(מדעי‪/‬טכנולוגי) ‪ ,‬כנסים ועוד‬
‫• בשנים האחרונות ברשת – פרסומים רבים ללא‬
‫שלב ביקורת )‪, (review‬‬
‫‪ -‬חלקם לא פחות טובים ! ‪...‬‬
‫• בנוסף‪ ,‬לאו דווקא אקדמי‪ :‬פטנטים‪ ,‬יזמות חדשנית‪,‬‬
‫רעיונות לא "מבושלים" ועוד ועוד‪....‬‬
‫לאיזה סוג מידע אזדקק ?‬
‫• החל מהרמה הנמוכה ביותר )‪(low-level‬‬
‫– מנוע‪ :‬גודל‪ ,‬משקל‪ ,‬צורה וכוח‪-‬סוס מסוימים‬
‫• ועד הרמה הגבוהה ביותר‬
‫– האם לשם של המוצר אין התנגשות עם שם של מוצר‬
‫אחר ואם הגיית שם המוצר בספרדית לא יוצרת בעיה‬
‫תרבותית או פוליטית‬
‫כמות המידע שיש אליה נגישות כיום‬
‫היא אינסופית מכל בחינה מעשית‬
... ‫כמות המידע הנוצרת בעולם‬
• The total information generated in the
year 2002 was equivalent to about five
exabytes (5 * 1018 ) which is equivalent in
size to the information stored in half a
million libraries the size of the Library of
Congress
• It is estimated that in 2020 the sum of
accumulated information will double every
73 days.
‫‪Data, Information, Knowledge‬‬
‫• ‪ :Data‬מערך של "עובדות" בדידות (‪ ,)discrete‬המתארות‬
‫אירועים‪( .‬לרוב מידע אמפירי‪ :‬מדידות‪ ,‬נתוני שוק וכו')‪ .‬מידע גלמי‬
‫שלא ניתן להסיק ממנו ישירות מסקנות מבוססות‬
‫• ‪ :Information‬דאטה שעבר עיבוד כלשהוא‪ ,‬כך שהוא מעביר‬
‫מסר מסוים (למשל עיבוד של נתוני שוק שמצביעים על פוטנציאל‬
‫מכירות של מוצר)‪ .‬מידע מסוג זה אמור להשפיע על קבלת החלטות‬
‫• ‪ :Knowledge‬מונח רחב יותר‪ ,‬עמוק ועשיר יותר‪ .‬תערובת של‬
‫נסיון‪ ,‬ערך‪ ,‬הקשרים‪ ,‬מומחיות ועוד‪ .‬יכולת להעריך ולהכליל מידע‬
‫מסוגים ותחומים שונים – וזה מונח המתאים למאמץ אנושי ולא‬
‫"עבודת מכונה"‬
‫מתי ‪ DATA‬הופך ל‪? Information -‬‬
‫כאשר היוצר של המידע מוסיף לו משמעו‪ ,‬לדוגמא‪:‬‬
‫•‬
‫•‬
‫•‬
‫•‬
‫הקשר )‪ :(context‬אנו יודעם למה המידע נאסף‬
‫חישובים‪ :‬המידע עבר עיבוד מתמטי‪ ,‬סטטיסטי‬
‫תיקונים‪ :‬מדידות שגויות או נתונים גולמיים שגויים הוסרו‬
‫תמצות‪ :‬המידע סוכם ונערך בצורה הולמת‬
‫מתי ‪ Information‬הופך ל –‬
‫‪? Knowledge‬‬
‫מחשבים לא מייצרים ידע (בינתיים‪ .)...‬תהליכי יצירת‬
‫ידע כוללים‪:‬‬
‫‬‫‬‫‬‫‪-‬‬
‫השוואה‪ :‬איך המצב הנוכחי בהשואה למצבים קודמים‬
‫תוצאות‪ :‬מה השלכות יש למידע על נקיטת צעדים‬
‫קשרים‪ :‬איך מידע מסוים קשור לנתוני מידע אחרים‬
‫שיתוף‪ :‬מה אחרים חושבים על המידע החדש‬
‫ ידע כולל בתוכו גם שיפוט ערכי ואחר‪ ,‬והתייחסות חשובה‬‫לא פחות למה אנחנו לא יודעים !‬
‫הכל באינטרנט ?‬
‫• בעיקרון – כן ! אבל‪...‬‬
‫– מידע גולמי‬
‫– לא מסונן‬
‫– לא בדוק‬
‫– לא בהכרח מעודכן‬
‫– אמת בפרסום (?)‬
‫• להבדיל מ"עתונות" מדעית‪ ,‬מקצועית‪ ,‬טכנולוגית‬
‫שעוברת לרוב ביקורת קפדנית‬
‫סוגים של מידע חשוב לתכנון הנדסי‬
‫שיטות לניתוח מידע (אנליזה)‬
‫דוחות טכניים‬
‫תכנות מחשב ייעודיות‬
‫לדוגמא‪finite element analysis :‬‬
‫לקוח‬
‫סקרים‪ ,‬משובים‬
‫מידע שיווקי‬
‫תקנות ממשלתיות‪ ,‬תקנים טכנולוגיים‬
‫ארגוני תקינה )…‪(ISO, ITU, ANSI‬‬
‫מקורות מידע לתכן הנדסי‬
‫בטיחות‬
‫עלויות‬
‫עלות מוצרים קודמים‬
‫עלות חומרים )‪(BOM‬‬
‫עלות ייצור‬
‫תכנונים דומים‬
‫מוצרים מתחרים )‪(reverse engineering‬‬
‫איפיון ותכן של גרסאות קודמות של המוצר‬
‫ייצור‬
‫בדיקות ביצועים‬
‫יכולת ייצור‬
‫שיטות אריזה (מארז)‬
‫רכיבים סטנדרטיים‬
‫קיום רכיבים ומהימנות ספקים‬
‫מידות ושאר מידע טכני‬
‫מחזור חיי המוצר‬
‫תחזוקה‪ ,‬שירות ללקוח‬
‫אמינות‪ ,‬איכות‪ ,‬אחריות‬
‫יכולת להמשך פיתוח‬
‫מאמרים‪ ,‬ספרים וכו'‬
‫ועכשיו לעבודה ‪....‬‬
‫איך מגיעים לקטלוג?‬
‫כתובת אתר‬
‫ספרית חשמל‬
‫כניסה‬
‫לקטלוג‬
‫הספריה‬
‫שימוש בקטלוג ‪"-‬אלף ‪"500‬‬
‫כניסה לכרטיס‬
‫קורא‬
‫כניסה לקטלוגים‬
‫של ספריות אחרות‬
‫תוצאות חיפושים‬
‫קודמים‬
‫תוצאות‬
‫חיפוש אחרון‬
‫חיפוש‬
‫מתקדם‬
‫חיפוש בסיסי‬
‫אופציות חיפוש‪:‬‬
‫לפי מחבר‪ ,‬לפי כותר‪,‬‬
‫לפי סוג חומר (תזה‪,‬‬
‫כתב‪-‬עת אלקטרוני וכו')‬
‫קישור ל‪"-‬אלף ‪http://aleph.technion.ac.il/F? - "500‬‬
‫אופציות חיפוש ב‪"-‬אלף ‪"500‬‬
‫חיפוש כתבי‪-‬עת אלקטרוניים (לפי‬
‫שם כתב‪-‬העת)‬
‫חיפוש ספרים חדשים‬
‫(לפי שם הפקולטה)‬
‫חיפוש תזות‬
‫לפי שם של מנחה‬
‫שאצלו כתבו את‬
‫התזה‬
‫לפי כותר‬
‫לפי שם משפחה של מחבר‬
‫לפי מספר מערכת‬
‫חיפוש תזות (‪,MSC ,MD‬‬
‫‪)PHD‬‬
‫לפי שם משפחה של סטודנט‬
‫שכתב את התזה‬
‫חיפוש ספרי לימוד‬
‫(לפי מספר הקורס)‬
‫חומר מומלץ לקורסים‬
‫לפי שם מרצה (רק‬
‫בעברית)‬
‫חיפוש בסיסי ב‪"-‬אלף ‪"500‬‬
‫חיפוש לפי מחבר‬
‫בוחרים אופציה‬
‫"‪"Author‬‬
‫מכניסים שם‬
‫משפחה של‬
‫מחבר‬
‫מפעילים‬
‫חיפוש‬
‫חיפוש לפי מחבר (המשך)‬
‫ישנם ‪ 16‬פריטים‬
‫של ‪Proakis‬‬
‫בספריות הטכניון‬
‫דרך קישור זה נכנסים‬
‫לרשימה מפורטת של‬
‫ספרים של המחבר‬
‫חיפוש לפי מחבר (המשך)‬
‫נכנסים כאן כדי‬
‫לבדוק מיקום של‬
‫הספר בספריות‬
‫הטכניון‬
‫הספר‬
‫שחיפשנו‬
‫כניסה‬
‫לרשומה‬
‫מלאה של‬
‫פרטי הספר‬
‫מיקום של פריט‬
‫רשימת עותקים בספריות הטכניון‬
‫תאריך‬
‫החזרה של‬
‫העותק‬
‫באיזה אוסף של‬
‫ספריה העותק‬
‫נמצא‬
‫לכמה זמן‬
‫ניתן להשאלה‬
‫באיזה ספריה‬
‫העותק נמצא‬
‫מיקום של‬
‫העותק על‬
‫המדף‬
‫ביצוע הזמנה‬
‫במקרה שכל העותקים של ספר מסוים נמצאים בהשאלה ניתן להזמין ספר דרך קטלוג‬
‫הזמנה של‬
‫ספר שיש לו‬
‫עותקים פנויים‬
‫על המדף לא‬
‫תתקבל!‬
‫לביצוע‬
‫הזמנה‬
‫נכנסים‬
‫כאן‬
‫ביצוע הזמנה (המשך)‬
‫מכניסים‬
‫מספר‬
‫תעודת‬
‫זהות‬
‫פעמיים‬
‫ביצוע הזמנה (המשך)‬
‫לוחצים‬
‫על‬
‫‪Order‬‬
‫ביצוע הזמנה (המשך)‬
‫שימו לב!‬
‫"אלף ‪"500‬‬
‫מאפשר לקוראים‬
‫לבצע הזמנות לבד‪.‬‬
‫באופן כללי ספרנים‬
‫לא יתעסקו יותר‬
‫בעניין זה‪ .‬רק‬
‫במקרה ויש בעיה‬
‫עם ביצוע הזמנה‬
‫עצמית יש לגשת‬
‫לספרן‪.‬‬
‫ההזמנה בוצעה‬
‫בדיקת כרטיס קורא‬
‫מה ניתן לבדוק דרך כרטיס קורא‪:‬‬
‫• השאלות (איזה ספרים יש לך‪ ,‬מאיזה ספריות‪ ,‬כמות ספרים ותאריך החזרתם)‬
‫• הזמנות (מהם פריטים שהזמנתה‪ ,‬מתי בוצע הזמנה‪ ,‬לאיזה ספריה שייך ספר שהזמנת)‬
‫• היסטוריה של השאלות (מהם ספרים שהשאלת בעבר)‬
‫• יומי איחור (במידה ואיחרת פעם עם החזרת ספרים)‬
‫כניסה לכרטיס קורא‬
‫כדי להיכנס לכרטיס קורא יש להקליד‬
‫מספר תעודת זהות פעמיים!‬
‫בדיקת כרטיס קורא (המשך)‬
‫לרשימת‬
‫השאלות‬
‫לרשימת‬
‫הזמנות‬
‫יומי איחור‬
‫היסטורית‬
‫השאלות‬
‫כאן ניתן לשנות‬
‫סיסמה ופרטים‬
‫אישיים‬
‫רשימת השאלות‪ :‬הארכה עצמית‬
‫להזכרתכם‪:‬‬
‫כדי להאריך‬
‫ספרים‬
‫לוחצים כאן‬
‫•לא ניתן להאריך פריט‬
‫מסוים אם הוא מוזמן‬
‫על‪-‬ידי מישהו אחר‪.‬‬
‫מאיזה ספריה‬
‫הספר מושאל‬
‫מה הוא תאריך ההחזרה‬
‫כמות‬
‫ספרים‬
‫בהשאלה‬
‫רשימת הזמנות‬
‫תאריך הזמנה‬
‫באיזה ספריה‬
‫לכמה זמן הספר‬
‫ניתן להשאלה‬
‫יציאה ממערכת‬
‫שימו לב! אחרי סיום‬
‫עבודה בתוך כרטיס‬
‫הקורא שלך יש תמיד‬
‫לצאת דרך ‪.Quit‬‬
‫לייעוץ בחיפוש מתקדם במאגרי מידע‬
‫ניתן לפנות‬
‫לגלית גרינברג‪ ,‬ספריית חשמל‬
‫‪[email protected]‬‬
‫ועכשיו – חיפוש במאגרים אלקטרוניים‬
‫• כמעט כל העיתונים המדעיים בעולם יוצאים בפורמט‬
‫אלקטרוני (בדר"כ ‪)Adobe Acrobat: pdf‬‬
‫• הטכניון רכש גישה אינטרנטית לרוב הספריות החשובות‪,‬‬
‫ומאפשר התחברות אליהן לכל סטודנט וחוקר‪ ,‬כאשר הוא‬
‫מחובר דרך תחנה (‪ )IP‬טכניוני‪.‬‬
‫• גישה מהבית – אפשרית‪.‬‬
‫נניח ששמענו בקורס כלשהו‪....‬‬
‫• את המילה ”‪ ,“wavelets‬סקרנותנו התעוררה‪,‬‬
‫ואנחנו רוצים ללמוד משהו על הנושא‪.‬‬
‫• חיפוש ראשון‪ :‬כמובן ב‪Google -‬‬
‫• מה נקבל ???‬
‫חיפוש ב‪Google -‬‬
‫לא רע‪...‬‬
‫משתפר !‬
‫אז מה זה ‪? Scholar‬‬
‫• התשובה של ‪ Google‬למנועי חיפוש אקדמיים‪:‬‬
‫והתוצאות ?‬
h5 :‫דוגמא נוספת ליתרון‬
‫• מקדם השפעה גבוה בחמש שנים אחרונות‬
Google Scholar has a nice new feature that can sort publications according to their h5-index (or other impact factor indexes).
So, I’ve searched for publications containing the words (signal || speech || image || video || vision || multimedia || pattern) and here’s what I got:
1. IEEE Conference on Computer Vision and Pattern Recognition, CVPR
2. IEEE Transactions on Pattern Analysis and Machine Intelligence
3. IEEE Transactions on Signal Processing
4. IEEE International Conference on Computer Vision, ICCV
5. IEEE Transactions on Image Processing
6. International Journal of Computer Vision
7. Pattern Recognition
8. IEEE Signal Processing Magazine
9. IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops
10. IEEE Transactions on Audio, Speech, and Language Processing
11. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
12. IEEE Transactions on Circuits and Systems for Video Technology
13. Journal of Vision
14. European Conference on Computer vision
15. Pattern Recognition Letters
16. IEEE Transactions on Multimedia
17. Mechanical Systems and Signal Processing
18. Image and Vision Computing
19. IEEE Journal of Selected Topics in Signal Processing
20. EURASIP Journal on Advances in Signal Processing
88
85
69
63
61
56
54
52
48
47
46
45
43
42
39
38
38
37
35
35
‫חיפוש מתקדם‬
‫פרסומים עדכניים‬
‫‪ ??? 18,300‬המממ‪....‬‬
‫• איך קראו למרצה ההוא שהזכיר ‪? wavelets‬‬
‫• כהן ?‬
‫‪ 5530‬זה עדיין‬
‫קצת הרבה‪...‬‬
‫וגם "כהנים"‬
‫לא חסר‪....‬‬
‫בעצם‪..‬מה שעניין אותי שהוא דיבר על‬
‫"התמרה אינווריאנטית להזזה" ‪...‬לא ?‬
‫עדיין אלפי‬
‫תוצאות אבל‬
‫הנה קצה החוט‪...‬‬
‫נלחץ על השם שלו‪...‬ישראל כהן‬
‫ועל הקישור‪ ...‬ולפני המאמר עצמו –‬
‫מה רואים כאן ?‬
‫בוא נראה מה קיבלנו‬
Title
Authors,
Organization
Magazine/
Conference, year
?
Fine details
‫נמשיך לגלול למטה‪...‬‬
‫התקציר – בדיוק מה שחיפשתי !‬
‫איך מקבלים את כל המאמר ?‬
‫• זוכרים ?‬
‫מה עוד אפשר להפיק‬
‫מתוצאת החיפוש ?‬
‫• מחברים נוספים – סביר להניח שיש להם עוד‬
‫פרסומים בנושאים‬
‫קרובים‪....‬‬
‫• למשל‪ ,‬לחץ על‪:‬‬
‫‪Raz, S.‬‬
‫ונקבל את כל‬
‫פרסומיו תחת ‪IEEE‬‬
‫של פרופ' שלום רז‪:‬‬
‫מאגרי מידע פורמליים נוספים‬
• Scopus
• Electronic village
• Inspec’ commdex
‫ובכל זאת‪...‬מה זה ‪? INSPEC‬‬
‫• הדרך היותר מסורתית ושיטתית לחיפוש מידע‬
‫אקדמי (מאמרים בעיתונים ובכנסים בעיקר)‪.‬‬
‫• איך מגיעים לזה ? אתר ספריית הטכניון למשל‪...‬‬
‫‪http://library.technion.ac.il/‬‬
‫קדימה לאתר הספריה‪...‬‬
‫לאזור המידע‬
‫האלקטרוני‬
‫רצינו ‪ ,INSPEC‬לא ?‬
‫ובדיוק מתחת למשרד הפטנטים‬
‫האירופי‪...‬מגלים משהו !‬
‫‪ ERL‬או ‪??? OVID‬‬
‫לא ממש משנה‪...‬‬
‫במקרה זה נקבל מייד ‪ 6‬תוצאות‬
‫נוכל לסמן את אלו שמעניינות אותנו‬
‫• ולשלוח את התוצאות שבחרת ל‪:‬‬
‫הדפסה‬
‫או שלח‬
‫לעצמך במייל‬
‫שמירה בקובץ‬
‫ואז מקבלים למשל דוא"ל ‪:‬‬
‫הסוף ?‬
‫• ממש לא‪.‬‬
‫• זו רק ההתחלה – כי עכשיו גם צריך לקרוא את‬
‫המאמרים שמצאנו !‬
‫• קריאת מאמרים היא גם נושא לדיון – אבל נפרד‪...‬‬
‫טיפ לקריאת מאמר‬
‫• התחילו תמיד בקריאה מדוקדקת של התקציר‬
‫)‪:(Abstract‬‬
‫– הוא קצר ותמציתי‬
‫– מכיל את הנקודות החשובות ביותר במאמר‬
‫– יסנן לכם מהר מאד מאמרים שאינם רלוונטיים‬
‫– יעזור לחלק את המאמרים הרלוונטיים לקבוצות‬
‫• אח"כ‪ :‬עיינו בחלק האחרון‪... Conclusions :‬‬