Data Privacy

IBM Optim Overview
‫'לחצים עסקיים' מובילים לצרכי מידע מוגברים‬
‫מראה אחיד‬
‫ללקוח‬
‫ראיה אחת של‬
‫הלקוח‬
‫כפיפות לתנאי הרגולטור‬
‫יעילות תפעולית‬
‫אפס מצאי‬
‫‪Inventory‬‬
‫ניהול סיכונים‬
‫ארגון וירטואלי‬
‫‪2‬‬
‫מיזוגים ורכישות‬
‫תמונת הנוף בארגון מורכבת‬
Operational Systems
Front Office
Mobile
ERP / ERM
Supply
Chain
Legacy
Apps
Customer
Service
Sales Force
Automation
Marketing
Automation
Field
Service
Field Sales
Cfg
Dispatch
Routing
E-MAIL
FAX
OLTP &
Intranet Devices
Voice
(ACD,IVR)
EAI & Middleware Data Exchange
Back Office
Analytical Systems
Conference
(Video,Web)
Data
Warehouse
Customer
Data Mart
Product
Data Mart
Campaign
Management
Knowledge
Management
OLAP &
Data Mining
Reference & Linkage Systems
DBoR
Customer
Merchant
Server
DBoR
Location
DBoR
Product
Web
Portal
Access, Interaction & Collaboration Systems
Extranet &
Internet Devices
‫ עקביות בנתונים והבטחת איכות‬,‫אלפי נקודות מגע מחייבות סינכרוניזציה סמנטית‬
‫‪..‬והבעיה הולכת ומחמירה‪..‬‬
‫כמות נתונים הולכת וגדלה‬
‫– ארגון ממוצע ינהל ‪ 100 terabytes‬של‬
‫נתונים עד ‪2010‬‬
‫– ארגונים גדולים ינהלו ‪1400TB‬‬
‫•‬
‫‪Source: Gartner‬‬
‫•‬
‫מהירות זרימת הנתונים‬
‫– מידע זורם מהר יותר דרך בשרשרת‬
‫הערך‬
‫•‬
‫יותר סוגי מידע‬
‫– בסיסי נתונים‪ ,‬חבילות ארגוניות‪MF ,‬‬
‫– ‪XML, Web logs, click streams, legacy‬‬
‫‪4‬‬
‫מה זה ‪? EDM‬‬
‫• ‪Enterprise Data‬‬
‫‪Management‬‬
‫• תהליכים וטכנולוגיה‬
‫לפתרון האתגרים‬
‫בתחום ניהול הנתונים‬
‫בארגון‬
‫• פותר אתגרים כגון‪:‬‬
‫–גידול בנפחי מידע ונתונים‬
‫–פרטיות וחיסיון נתונים‬
‫–יצירת סביבות טסט ופיתוח‬
‫–שדרוג יישומים‬
‫–'ירידה' מיישומיי ‪Legacy‬‬
‫‪Data Archiving‬‬
‫‪5‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫™‪ - IBM Optim‬פותר את אתגרי ה‪EDM-‬‬
‫● ‪Archiving‬‬
‫‪ ‬שיפור ביצועים‬
‫‪ ‬שליטה וניהול גידול נפחים‪ ,‬חיסכון באחסון‬
‫‪ ‬תואם ותומך בהוראות רגולטור‬
‫‪ ‬מאפשר 'ירידה' מיישומי ‪Legacy‬‬
‫‪ ‬מייעל ומקצר תהליכי שדרוג‬
‫● ‪Test Data Management‬‬
‫‪ ‬מייצר ומפשט בניית סביבת טסט מותאמת‬
‫‪ ‬משפר איכות היישומים‬
‫‪ ‬מקצר תהליכי בדיקה וטסט אינטרטיביים‬
‫● ‪Data Privacy‬‬
‫‪' ‬מיסוך' והסוואת מידע רגיש‬
‫‪ ‬שמירה על מדיניות פרטיות‬
‫‪Data Archiving‬‬
‫‪6‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
Power of the Optim Solution
JD Edwards
Oracle
Apps
Custom
in-house
… other
Siebel
Data Growth
Archive Prod & History
Data
PeopleSoft
JD Edwards
Oracle
Apps
Siebel
PeopleSoft
Data Privacy
Test Data Management /
Subsetting
Custom
in-house
… other
Governance, Risk, Compliance
Optim Relationship Engine
Oracle
SQL
Server
z/OS
Sybase
Informix
OS/390 AIX Linux
DB2 LUW DB2 z/OS MORE….
HP/UX
Solaris Windows
Optim Archiving Solution
Full Life Cycle Management Solution
‫על מה בעצם כל "המהומה" ?‬
‫היום‬
‫שנה ‪1‬‬
‫שנה ‪2‬‬
‫שנה ‪3‬‬
‫שנה ‪4‬‬
‫• תוך ‪ 5‬שנים – נפח הנתונים מכפיל עצמו ב‪!! *250%-‬‬
‫• לא כולל את נפח הקבצים הלא‪-‬מובנים – שנפחם‬
‫גדל אף בקצב מהיר אף יותר‬
‫* מקור ‪IDC‬‬
‫‪Data Archiving‬‬
‫‪9‬‬
‫שנה ‪5‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫אבל זה רק פן אחד של האתגר‪...‬‬
‫על כל ‪ 10 TB‬של נתוני ייצור – אנו שומרים ‪ /‬מנהלים‬
‫כ‪ 90TB-‬נוספים של נתונים‬
‫פיתוח‬
‫גיבוי‬
‫בדיקות‬
‫‪DRP‬‬
‫‪DWH‬‬
‫‪Data Archiving‬‬
‫‪17‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
2700%-‫גידול בנפח אחסון של כ‬
‫ שנים‬5-‫ב‬
)‫ (כולל עותקים‬267Tb -‫ הופכים ל‬10Tb
300
250
200
150
100
50
Today
1 Year
2 Year
Production
3 Year
Copies
4 Year
0
5 Year
‫ועוד זווית על הנושא‪..‬‬
‫• אופיר (לקוח) מבצע פעולה‬
‫– טווח קצר‬
‫•‬
‫•‬
‫•‬
‫•‬
‫רישום הפעולה‬
‫תיעוד‬
‫חיוב (במידת הצורך)‬
‫תיעוד לצורכי ‪BI‬‬
‫– טווח ארוך‬
‫• תיעוד היסטורי לצורכי ‪BI‬‬
‫• תיעוד לצורכי רגולציה‬
‫• האם באמת הפעולה הבודדת של אופיר מעניינת אחרי‬
‫שנתיים ?‬
‫ועדיין – מרבית המידע הלא‪-‬רלוונטי מתועד‬
‫ונשמר על גבי המדיה היקרה ביותר בארגון‬
‫‪Data Archiving‬‬
‫‪19‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫גישה לפתרון‬
‫‪Archive‬‬
‫‪Restore‬‬
‫גישה אוניברסלית לתחקור ולשאילתה‬
‫• גישה למידע דרך מחוללי דוחות‬
‫• ממשקים (‪)XML ,ODBC/JDBC‬‬
‫• יישומים (‪)..ERP ,CRM‬‬
‫‪20‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫היתרונות לארגון‬
‫‪Archive‬‬
‫‪Restore‬‬
‫גישה אוניברסלית לתחקור ולשאילתה‬
‫• חיסכון גבוה בנפחי הייצור‬
‫•חיסכון במדיה היקרה ביותר‬
‫•ניהול – אחסון המידע בהתאם לנחיצותו‬
‫• צמצום נפח העותקים‬
‫• ביצועים משופרים‬
‫• גישה שקופה למשתמש‬
‫הצורך חזרה לייצור (במידת הצורך)‬
‫• אחזור המידע במהירות בעת‬
‫‪21‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫אבל הארכוב אינו פשוט‪..‬‬
‫‪Payments‬‬
‫•‬
‫כל טבלה קשורה בקשרי גומלין עם טבלאות רבות אחרות‬
‫– מיפתוחים‪Referential Integrity ,‬‬
‫– ארכוב נתונים (לדוגמה מתאריך מסוים) – עשוי להשפיע על הקשרים העדינים‬
‫ובמקרים מסוימים אף להפיל את היישום‬
‫•‬
‫צורך באיחוד כל ה'נתונים' ו'הקשרים' ל‪-‬יחידה עסקית אחת‬
‫עוברים לניהול על פי 'יחידה עסקית'‬
‫‪Payments‬‬
‫•‬
‫יישות נתונים עסקית – תנועה‪ ,‬חשבונית‪ ,‬לקוח‪ ,‬תשלום וכד'‬
‫– איסוף הנתונים המרכיבים את היישות העסקית – לאורך כל הטבלאות‬
‫והיישומים מהן היא נגזרת‪ ,‬לרבות מטדטה‬
‫•‬
‫•‬
‫מהווה "תצלום מצב היסטורי" לפעילות עסקית‬
‫תומך במקורות מבוזרים לאורך יישומים‪ ,‬פלטפורמות ו‪ DB-‬בארגון‬
‫גישה אוניברסלית למידע‬
‫ דרך האפליקציה‬Native ‫גישה‬
•
‫– מסכים ותהליכים מוכרים ונוחים‬
)‫גישה עצמאית (ללא קשר לאפליקציה‬
:‫– שימוש בסטנדרטים נפוצים‬
SQL, ODBC/JDBC, XML
‫– פורטלים‬
Crystal Reports, :‫– מחוללי דוחות‬
Cognos, Business Objects,
Discoverer, Actuate
:Desktop ‫– יישומי‬
Excel, CSV, MS Access
Database formats –
Access Any Record, Anytime, Anywhere!
•
ILM-‫אסטרטגיה אפשרית ל‬
TIER I
TIER II
CAS
Legacy
Applications
Optical
Packaged
Applications
Tape
Files and
Databases
Disposal
Management /
Reporting
IBM Optim Test Data & Privacy
Management
Create Test /Dev Environments
Protect your data privacy
IBM Optim Test Management
Use ‘Business Objects’ to create smart sub-setting
Operational
Legacy
Applications
Packaged
Applications
Subset
‫• שליפת נתונים על פי‬
‫הגדרות משתמש‬
‫• יצירת מדגם מתאים‬
‫במהירות‬
Files and
Databases
ERP
2011 ,‫ מרץ‬23
27
Data Privacy
IBM Optim Test Management
Use ‘Business Objects’ to create smart sub-setting
Operational
Testing / Dev
Legacy
Applications
Packaged
Applications
Legacy
Applications
‫• העברת הנתונים לסביבת‬
‫• שליפת נתונים על פי‬
‫ טסט‬/ QA / ‫הפיתוח‬
‫הגדרות משתמש‬
‫• רענון פשוט של הנתונים‬
‫מדגם מתאים‬Propagate
‫• יצירת‬
Subset
Baseline ‫• השוואת הנתונים מול‬
‫במהירות‬
‫לאיתור שגיאות‬
Files and
Databases
Files and
Databases
ERP
2011 ,‫ מרץ‬23
Packaged
Applications
ERP
28
Data Privacy
‫אבל מידע בסביבות טסט מכיל מידע רגיש‬
‫אז איך בכל זאת נחשף מידע רגיש ?‬
‫•‬
‫‪ 70%‬ממקרי הפרת‪-‬מידע מקורן בתוך הארגון (גרטנר)‬
‫•‬
‫מרבית סביבות הטסטים כוללות מידע אישי בר‪-‬זיהוי‬
‫•‬
‫הסכם שמירת סודיות‪ ,‬אינם מרתיעים עובד ממורמר‬
‫•‬
‫מה לגבי נתוני‪-‬טסט הנשמרים על לפטופים ?‬
‫•‬
‫נתוני‪-‬טסט הנשלחים לספקים‪/‬יועצים חיצוניים ?‬
‫•‬
‫הנחיית מועצת אבטחת מידע לאמצעי תשלום (‪ )PCI‬מס'‬
‫‪ 6.3.4‬קובעת‪:‬‬
‫"אין להשתמש בנתוני אשראי (מספרי כרטיס אמיתיים‪,‬‬
‫תוקף וכד') בסביבות פיתוח או‪/‬ו טסט"‬
‫‪Data Privacy‬‬
‫‪29‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫הצפנה אינה מספיקה‬
‫•‬
‫•‬
‫•‬
‫•‬
‫הצפנה בבסיס הנתונים מגנה מפני גניבות והאקרים‬
‫ניתן לבצע הצפנה על שדה‪ ,‬מספר שדות או טבלה‬
‫פענוח השדה מבוצע כאשר הנתון נשלף מבסיס הנתונים‬
‫אם מידע ניתן לצפיה‪ ,‬אזי הוא ניתן גם להעתקה‪:‬‬
‫– שאילתה‬
‫– הורדה‬
‫– צילום תמונת מסך‬
‫• ארגונים רבים אינם מבצעים הצפנות על נתוני טסט‬
‫‪Data Privacy‬‬
‫‪30‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫מה זה ‪? Data Masking‬‬
‫• נקרא גם‪:‬‬
‫– ‪depersonalization‬‬
‫– ‪desensitization‬‬
‫– ‪data scrubbing‬‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫טכנולוגיה שמסייעת להסתיר נתוני אמת‬
‫"מערבלת" את הנתונים על מנת לייצר מידע "חדש" אך חוקי‬
‫שומרת על תכונות הנתון‪ ,‬כגון‪ :‬פורמט‪ ,‬סוג‪ ,‬אורך‬
‫אלגורתימים שונים ליצירת 'מסכה' לנתון (רנומלי‪ ,‬קונקטינציה‪,‬‬
‫שינויי תאריך וכו')‬
‫בשימוש סביבות לא‪-‬ייצוריות כחלק מ‪ Best Practices-‬להגנת‬
‫נתונים רגישים‬
‫‪Data Privacy‬‬
‫‪31‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫מסכה לנתוני כרטיס אשראי‬
Your Credit Card
Your Credit Card
4212 5454 6565 7780
4536 6382 9896 5200
12/09
EUGENE V. WHEATLEY
12/09
SANFORD P. BRIGGS
GOOD
THRU >
GOOD
THRU >
‫לפני המסכה‬
2011 ,‫ מרץ‬23
‫אחרי המסכה‬
32
Data Privacy
‫יצירת 'מסכה' אינה דבר פשוט‬
‫• התמונה הארגונית‬
‫מורכבת‪:‬‬
‫– ריבוי בסיסי נתונים‬
‫– קבצי ‪Legacy‬‬
‫– פלטפורמות שונות‬
‫• צורך להתאים לתהליכים‬
‫קיימים‬
‫• תהליך רציף – לא חד‬
‫פעמי‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫‪Data Privacy‬‬
‫‪33‬‬
‫שרשור מפתח לטבלאות משנה‬
Customers Table
Cust ID
Name
Street
08054
Alice Bennett
2 Park Blvd
19101
Carl Davis
258 Main
27645
Elliot Flynn
96 Avenue
Orders Table
Cust ID Item #
Order Date
27645
80-2382
20 June 2004
27645
86-4538
10 October 2005
34
Data Privacy
‫• שרשור המפתח‬
‫– שרשור ערכים במפתח‬
)Primary-key( ‫ראשי‬
‫לטבלאות קשורות‬
‫– אם נשנה שדה מפתח‬
‫בטבלה אחת – יתר‬
‫הנתונים הקשורים לאותו‬
‫שדה יאבדו את הקשר‬
‫– הכרחי לשמור על‬
referential integrity
2011 ,‫ מרץ‬23
‫שרשור מפתח לטבלאות משנה‬
De-Identified Data
Original Data
Customers Table
Cust ID
Name
Customers Table
Street
08054
Alice Bennett
2 Park Blvd
19101
Carl Davis
258 Main
27645
Elliot Flynn
96 Avenue
Cust ID
Referential
integrity is
maintained
Orders Table
Name
Street
10000
Auguste Renoir
Mars23
10001
Claude Monet
Venus24
10002
Pablo Picasso
Saturn25
Orders Table
Cust ID Item #
Order Date
Cust ID Item #
Order Date
27645
80-2382
20 June 2004
10002
80-2382
20 June 2004
27645
86-4538
10 October 2005
10002
86-4538
10 October 2005
‫‪IBM Optim™ Data Privacy‬‬
‫• יצירת מסכה לנתונים קיימים‬
‫– יישום מסכה בבסיסי נתונים קיימים עם נתונים קיימים‬
‫• יצירת מסכה לנתונים תוך העברה‬
‫– יישום מסכה לנתונים תוך כדי העברתם לסביבת הטסט‬
‫• 'מיסוך' בסיסי – מחרוזת ותווים‪ ,‬פונקציות אריתמטיות‪ ,‬מספרים אקראיים‬
‫• 'מיסוך מתקדם' – יישום מודלים לחיסוי‬
‫–‬
‫–‬
‫–‬
‫–‬
‫מזהים לאומיים‬
‫כרטיסי ומספרי אשראי‬
‫ערכי ‪ Lookup‬להבלשמירת קונטקסט (כגון‪ :‬עיר‪ ,‬מיקוד וכו')‬
‫ערבול נתונים (שמות‪ ,‬כתובות)‬
‫• תמיכה ביישומים ארגוניים קיימים ליצירת נתונים חוקיים‪ ,‬אך בדיוניים‬
‫– תמיכה ב‪SAP, Siebel , PeopleSoft, Oracle e-Business, JD Edwards-‬‬
‫‪Data Privacy‬‬
‫‪36‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
IBM Optim Test Management
with Optim Data Privacy
Operational
Testing / Dev
Legacy
Applications
Legacy•
‫הסתרת פרטים אישיים‬
Applications
‫• יישום אלגוריתמים שונים ליצירת‬
‫מיסוך‬
"‫• יצירת מידע בדיוני אך "חוקי‬
‫שמירה על עקביות לרוחב‬
•
Packaged
Propagate
Applications
‫הסביבות‬
‫• יצירת מידע חסר ערך להאקרים‬
‫חוץ‬-‫• מאפשר ביצוע טסטים במיקור‬
Packaged
Applications
Subset
Mask
Files and
Databases
Files and
Databases
ERP
2011 ,‫ מרץ‬23
ERP
37
Data Privacy
‫במה אנחנו מסתכנים ?‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫קנסות ועונשים‬
‫אובדן לקוחות (או אמון לקוחות)‬
‫אובדן הכנסות‬
‫נפילת מחיר מניה‬
‫פרסום שלילי‬
‫פגיעה במוניטין‬
‫גידול בהוצאות תפעול‬
‫בארצות הברית לבדה‪ ,‬במהלך ‪ 2006‬למעלה‬
‫מ‪ 8.4 -‬מיליון לקוחות היו קורבן להונאת‬
‫זהות; למעלה מ‪ 50 -‬מילארד דולר הפסדים !‬
‫‪Data Privacy‬‬
‫‪38‬‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫יוזמות וחקיקות בתחום‬
:‫יוזמות ממשלתיות ורגולציה בתחום נועדו להבטיח את הציבור‬
USA
HIPAA, Gramm-Leach-Bliley Act (GLB), California Security
Breach Notice Statute
European Union
Personal Data Protection Directive 1998
UK
Data Protection Act of 1998
Australia
Privacy Amendment Act of 2000
Canada
Personal Information Protection and Electronic Documents
Act
PCI Data Security Standard (including new state laws)
2011 ,‫ מרץ‬23
39
Data Privacy
•
‫החקיקה של מחר מתפתחת היום‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫‪ 23‬מרץ‪2011 ,‬‬
‫פרשנות לחוקים הקיימים‬
‫חקיקה והנחיות נשקלות‬
‫היום‬
‫שינויים הם הקבוע היחיד‬
‫רוטינות 'מיסוך' צפויות‬
‫להשתנות בתכיפות‬
‫צורך בשינויים ותגובה‬
‫מהירה‬
‫‪Data Privacy‬‬
‫‪40‬‬
‫סיכום – מה קיבלנו מ‪Optim Archive -‬‬
‫• צמצום נפחי הייצור = כסף‬
‫– פחות משאבי ניהול‬
‫– פחות שטחי אחסון (לרבות העתקים שונים בארגון)‬
‫– יותר ביצועים ויעילות מערכת‬
‫• גישה זמינה ושליפת מידע מנתוני ארכיון‬
‫באמצעות כלים וסטנדרטים פופלאריים‬
‫• תמיכה בהוראות רגולטור (שמירה‪ ,‬תיעוד‪,‬‬
‫ביקורת)‬
‫‪Data Archiving‬‬
‫‪41‬‬
‫סיכום – מה קיבלנו מ‪Optim TDM -‬‬
‫• הגדרה מהירה ויעילה של סביבות עבודה‬
‫– פחות משאבי ניהול‬
‫– יותר מהירות בעלייה לאויר‬
‫– פחות שגיאות וסבבי בדיקות‬
‫• הגנה יעילה על נתונים רגישים או חסויים‬
‫• תמיכה בהוראות רגולטור (תקנות לגבי רגישות‬
‫נתונים בסביבות לא ייצוריות)‬
‫‪42‬‬
‫• שאלות ?‬