Big Data והגנת הפרטיות באינטרנט

Big Data והגנת הפרטיות באינטרנט

מאת: עו"ד אבי רימון

מהו Big Data  ?

מונח זה מנסה לתאר מאגרי נתונים מורכבים ואדירים בתכולתם, אשר באמצעות מערכות טכנולוגיות מתקדמות ניתן לנתח את הנתונים האגורים בהם, לסווג אותם, לאתר פרטים חבויים בהם, ולהגיע בסופו של דבר למסקנות יישומיות, שלרוב ממבט ראשון נדמה היה שקשה היה לדלותן מתוך אוסף זה של נתונים. מערכות אלו לעתים גם אמונות על עצם איסוף המידע ושמירתו.

עלייתו לגדולה של ה – Big Data

תחום זה תופס תאוצה מפאת מספר גורמים. הראשון שבהם נוגע להתקדמות של התשתיות הטכנולוגיות. היום כלי החומרה והתוכנה מאפשרים בעלויות סבירות אגירה של כמויות נתונים ענקיות ויכולת להריץ אלגוריתמים סבוכים לניתוח המידע שבמאגרים במהירויות גבוהות מאד. הגורם השני, הוא חדירתן של רשתות התקשורת לכל אספקט בחיינו ובמיוחד השילוב העצמתי שנוצר בחיבור של הרשתות הניידות עם עולם האינטרנט. באופן זה רשתות התקשורת אוספות מידע רב על הרגלי השימוש שלנו בשירותיהם, למי אנו מתקשרים, היכן היינו, לאן גלשנו, מה הורדנו, עם מי התכתבנו, מה קנינו וכו'. גורם שלישי הוא התיעוד הממוחשב של רבות מפעולותינו. כל מגע עם חברה מסחרית גדולה מתועד בצורה אלקטרונית ומקוטלג באופן כזה או אחר; אנו מבצעים תשלומים רבים באמצעות כרטיסי אשראי ולכן תשלומינו מקוונים, מתועדים, שמורים וניתנים לעיבוד מתמטי. שימוש שלנו בישומים אינטרנטיים על גבי הנייד מהווים תחליף לפעולות שהיו נעשות ידנית, לדוגמא – תשלום בעבור חנייה, ולכן פעולות אלו נרשמות ונצברות בחשבון מזוהה על ידי שם או כתובת IP אותו ייחוס אחר.

לאור זאת, יש בידי גופים שונים: מאגרי מידע המכילים מידע רב הניתן לעיבוד וכלים טכנולוגים היכולים לבצע את החישובים הנדרשים. כל שנותר הוא לפתח בינה מלאכותית שתדע הכיצד לנתח, ולהפיק מסקנות יישומיות. נוצר כאן מקום לשימוש לא רק בדיסיפלינות סטטיסטיות ומתמטיות, אלא אף ישנו משקל רב לתורות סוציולוגיות, אשר יכולות בקירוב רב להפוך אוסף נתונים שהוא לכאורה סתמי לפרופיל אישיותי של האדם, היכול לנבא התנהגויות, העדפות וקבלת החלטות – דבר שיש לו ערך רב מאד.

היתרון החברתי של Big Data   וסיכוניו

המדע של Big Data היה בראשיתו נחלתן של מדינות אשר סוכנויות הביון שלהן מנסות לאתר בעזרתו גורמים עוינים או לסכל פעילויות אלו ואחרות. היום הוא Big Data  כלי אזרחי שיש לו יתרונות ציבוריים ומסחריים מרובים, היכולים לצור תיאום בין פעולות של מוסדות הציבור או של עסקים אל מול רצונותיהם, צרכיהם והעדפותיהם של אנשים רבים.

ניתוח נכון של נתונים יכול לייצר תובנות כלליות או ממוקדות יותר ביחס לקבוצות אנשים בגדלים שונים עד לרמת הפרט הבודד.

לדוגמא  –  אם רשות מוניציפלית תוכל להבין טוב יותר מהם הרגלי הקנייה שלנו היא בהתאם תוכל לתכנן טוב יותר את שטחי המסחר באזור מגורינו, או מכוח אותם נתונים, נקבל בדואר או במייל בפרסום אינטרנטי בנייד, הצעת קנייה, שתואמת באחוזים מאד גבוהים את מה שאנו חפצים לרכוש באותו רגע.

דוגמא נוספת –  חברת ביטוח המציעה לנו לרכוש ביטוח מקוון דרך הטלפון הנייד, ככל שיהיו בידה ניתוחים אודות הפרופיל של האוחז בנייד, היא תוכל לשערך את מת הסיכון שיכולה להיות מיוחסת לאותו אוחז ובהתאם לכך לקבוע את הפרמיה. למשל אם האוחז בנייד מרבה להכנס באמצעות המכשיר לאתרים העוסקים בספורט אקסטרים, הדבר יכול להצביע על נטייה להסתכנות, ומכאן שרמת התכנות להתרחשות אירוע ביטוח היא גבוהה יותר, ועל כן, הפרמיה תהא גבוהה מהממוצע. אבל גם להפך, אם פרופיל הגלישה שלנו מצביע על התנהגות שמרנית וזהירה, יתכן שחברת הביטוח תיאות להציע פרמיה נמוכה יותר.

לפיכך, יכולה להיות תועלת חיובית מאד גבוהה לטכנולוגיית .Big Data אך בצידה ישנם סיכונים לאובדן הפרטיות שלנו או לשימוש בה כנגד האינטרס האישי שלנו. הוויית החיים הנוכחית שלנו היא שרובנו בהסכמה זו או אחרת מצמצמים את גבולות הפרטיות שלנו, בעיקר תוך שימוש ברשתות החברתיות, ברשתות לשיתוף צפייה בקבצים כמו יוטיוב או אינסטגרם, בתוכניות ריאלטי, בנטייתנו להצטרף למועדוני לקוחות וכיוב'. רבים מוכנים לוותר על חלק מפרטיותם תמורת תועלות כלכליות או חברתיות המצויות ברשת האינטרנט. הוויה זו מדרבנת את טכנולוגיית ה-Big Data  יחד עם זאת, יש להציב גבולות.

Big Data   וההגנה על הפרטיות

השאלה המתבקשת היא כיצד מתמודדת טכנולוגיית ה-Big Data ובראש ובראשונה האספקט האינטרנטי של טכנולוגיה זו עם דיני הגנת הפרטיות. באירוניה ניתן לומר שלא הטכנולוגיות מתמודדות עם החוק, אלא לרוב החוק נאלץ להתמודד ולהסתגל אל הטכנולוגיה. הוראות החוק לעתים קרובות מייצגות מצב עובדתי שחלף, ובפועל מתגבשת נורמה התנהגותית בציבור, שממנה ניתן להבין שרוב הציבור מוכן לוותר על הגנות המצויות לו בחוק על מנת להנות מהטכנולוגיה. לכן לא תמיד ניתן לאכוף את החוק כפשוטו, ונוצר נוהג בציבור שקשה לקעקעו באמצעים חוקיים.

דיני הגנת הפרטיות כוונו במקורם למניעת פרסום הפוגע בצנעת הפרט. יותר מאוחר השתכללו דינים אלו על מנת לטפל במאגרי מידע של רשויות וגורמים מסחריים, אך אלו לא ממש צפו את היכולות הקיימות כיום. כל מדינה מנסה להסדיר את התחום לפי גישתה ביחס לתחומי הגנת הפרטיות תוך מתן דגש על העולם המקוון ויישומי ה-Big Data. באירופה לפרטיות ערך מאד גבוה, והממשל רואה עצמו מגן של הפרט, ולכן הקהיליה האירופית חוקקה דירקטיבה חדשה Directive (EU) 2016/680, המהווה רפורמה בתחום הגנת הפרטיות במרחב הקיברנטי, והיא מחמירה עם העוסקים בתחום. לעומת זאת, בארה"ב, החקיקה הפדרלית דלה יחסית ולא התעדכנה מזה זמן רב יחסית.  בישראל חוק הגנת הפרטיות הוא חוק חסר מאד ומיושן, שאינו מתמודד כנדרש עם עולם האינטרנט, והפסיקה בעניינו אינה ענפה.

עקרונות ההגנה על הפרטיות בעולם המקוון

כל העוסק בתחום של איסוף וניתוח מידע אודות פרטים, צריך להיזהר שלא לפגוע בפרטיותו של אדם. באופן בסיסי השאלה האם נפגעת הפרטיות מורכבת ממבחן תלת שלבי – 1) האם יש במידע כדי להיות מיוחס או מזוהה עם אדם מסוים , Identification 2) האם יש במידע המזהה כדי לפגוע בפרטיות? ברוב המקרים התשובה היא חיובית, הגישה היא שאדם רשאי לשמור את מרבית הפרטים הנוגעים אליו בחשאיות, 3) האם ניתנה הסכמה מצד אותו אדם לחשיפת אותו מידע מזוהה הפוגע בפרטיות. הסכמה זו מרפאת כביכול את הפגיעה בפרטיות. ישנם כללים נוספים הנוגעים לתחום זה, אולם אלו העיקריים הנדרשים לצורך איסוף המידע המקוון. עקרונות אלו באופן כללי מקובלים ברוב שיטות המשפט. השיטה האמריקאית נבדלת מזו האירופאית בעיקר בכל הקשור לאופן הגדרת ההסכמה של הפרט, נעסוק בכך בהמשך.

אנונמיזציה של המידע

מאחר שיסוד הזיהוי הוא הכרחי על מנת שתיווצר פגיעה בפרטיות, ניתן באמצעות אנונמיזציה של המידע, (היות המידע בלתי מזהה פרט מסוים), לחמוק מהצורך לקבל את הסכמת הפרט לאיסוף המידע, עיבודו ומסירתו לאחר.

נטייתם של רבים מהעוסקים ב –  Big Data היא להפוך את המידע לכזה שאינו מזהה ומזוהה עם אדם ספציפי. באופן זה במסגרת איסוף הנתונים יש אלו אשר אינם מעוניינים בפרטים המזהים את הפרט, וככל שאלו בידם הם מנתקים אותם מתהליכי העיבוד, הסקת המסקנות והעברתם לצדדים שלישיים.

בעולם המקוון דהיום לעתים אין צורך בשמך, די בכתובת ה  IP  של אמצעי התקשורת שלך, כדי להגיע אל המכשיר האישי שלך מבלי שאנו יודעים את זהותך המדויקת. שיטה זו יכולה לענות על צרכים רבים של המעוניינים בישומי ה Big Data- מאחר שאין צורך על מנת לנתח התנהגויות של אוכלוסייה רחבה בשמותיהם של המשתייכים לקבוצה כדי
להסיק מסקנות שיווקיות לגבי מוצר זה או אחר והתאמתו לסגמנטים, וכאמור אין בעולם המקוון מניעה להציע הצעת מכר מדוייקת לגולש אף מבלי לדעת את שמו, כתובתו ומספר הזהות שלו.

רבים מהנתונים הבלתי מזוהים נאספים אגב מתן שירותים לצרכן. לדוגמא כל המפעילים הסלולארים יודעים לאן ומתי התקשרו לקוחותיהם, לאן ומתי הם גלשו באינטרנט, היכן הם היו כשביצעו פעולות אלו ואחרות וכו'. גוגל יודעת שכתובת IP  זו או אחרת ביצעה כאלו ואלו חיפושים, יודעת לאלו דפים נכנסת מתוך החיפוש וכיוב'. מידע גולמי זה ניתן לניתוח ואפשר להפיק ממנו מסקנות לגבי המשתמש, מבלי שיש צורך לדעת את זהותו, ומסקנות אלו שמישות ויישומיות הן לצרכיי מחקר כללי אודות העדפות של אוכלוסיה מסוימת, והן לשם שיווק נקודתי באשר כתובת ה IP-או אמצעי הזיהוי האחרים של כלי התקשורת כמו ) IMEI המספר הסידורי של המכשיר הסלולארי) יכולים להוות נקודת הקשר בין הפרט לפרופיל שנבנה אודותיו באמצעות מידע בלתי מזוהה זה.

שיטה זו של הסרת הזהות מחייבת לעתים יצירת חומות סיניות ניכרות בין אותם מנגנונים של בעל מאגר המידע הזקוקים לעתים לפרטיו המזהים של אדם לבין מנגנון ניתוח הנתונים. למשל אתר מסחר אלקטרוני זקוק לפרטיו המזהים של הקונה, אך לצד פרטים חיוניים אלו הוא אוסף אגב פעולת המכירה גם פרטים רבים אודות הקונה שאינם מזהים. העברת הפרטים לצד שלישי, למשל אתר קניות אחר, ככל שהם מזוהים עם הקונה מחייבת הסכמת הקונה. אבל אם האתר מעביר את המידע לרבות כתובות ה IP-ללא פרטיו המזהים של הקונה, הוא לכאורה אינו זקוק להסכמת הקונה. באופן זה יכול להיווצר מצב שבו אם הקונה באמצעות אותה כתובת IP  יכנס לאתר הקניות השני, לאותו אתר יהיה פרופיל צרכני אודות אותו "קונה" שהגיע ללא ידיעת הקונה אל האתר השני. העניין הוא שלא מדובר בדיוק באותו קונה אלא בכלל המשתמשים באותה כתובת IP  והפרופיל אולי אינו מדויק, אם כתובת ה IP- משמשת מחשב ביתי שבשימוש כמה מבני הבית, אבל הפרופיל יהיה מאד מדויק וככזה שניתן לסמוך עליו אם כתובת ה IP –  משמשת טלפון נייד, שהוא מכשיר אישי למדי.

למותר לציין, כי קבוצת העבודה בקהיליה האירופית העוסקת בתחום החקיקה הנוגעת להגנת הפרטיות ברשת, הביעה דעתה, כי כתובת IP איננה נתון אנונימי. גישה זו טרם קיבלה ביטוי ממשי בפסיקת מוסדות הקהיליה, אולם לא מן הנמנע שתתקבל. במקרה כזו מערכות האיסוף יצטרכו להתארגן בצורה שונה ולקבל לצורך איסוף המידע והשימוש בו אישור מהמשתמש או יסתמכו על מזהים אחרים שנחשבים ליותר אנונימיים.

דה – אנונמיזציה של המידע

יש לשים לב כי כשם שיכולות הניתוח עולות, כך היכולת לחלץ מתוך פרטים בלתי מזוהים את זהותו של אדם היא גבוהה יותר, למשל מתוך הצלבה בין נתונים בלתי מזהים במאגר השמור אצל בעל מאגר מסוים לבין נתוני מאגר גלוי אחר המכיל פרטיו המזהים של אדם, לדוגמא גוגל. שיטות המשפט יצטרכו להכריע מתי בשל יכולות הזיהוי מחדש, פרטים שהנם לכאורה בלתי מזהים, הופכים לכדי מזהים ולכן עלולים לפגוע בפרטיות.

הסכמה או הפנייה

מה קורה כאשר העוסק מעוניין לעשות שימוש בפרטים מזהים הפוגעים בפרטיות. במקרה זה יש צורך בסוג זה או אחר של הסכמה מצד הפרט. בהתאם למשפט הקהילייה האירופאית יש צורך בהסכמה מפורשת מצידו של הפרט לשם שימוש במידע הפוגע בפרטיותו. בעוד שלפי השיטה האמריקאית די בהפניה למדיניות הפרטיות של מי שנוטל את הפרטים כדי לייצר הסכמה זו, משום ששיטה זו רואה את הצרכן כמסכים למדיניות אם בהתנהגותו מסר את הפרטים, כאשר ידע או צריך היה לדעת בהתאם למדיניות, שהוא הופנה אליה, מה יעשה בפרטים אלו.

הבעיה בגישה האמריקאית ובמידה פחותה הרבה יותר גם בזו האירופאית, היא שלעתים קרובות המדיניות או כתב ההסכמה הינם ארוכים באופן יחסי ומנוסחים בלשון משפטית סבוכה, אשר הקורא אינו תמיד מבין אותה או אינו מעוניין להקדיש די זמן לצורך לימודה, למרות הסכנות האפשריות הנובעות מגלגוליו של המידע, וראה מקרה חובב ספורט האקסטרים והביטוח. הצורך החברתי שלנו לעשות שימוש בשירותים המקוונים, הרצון לבצע פעולות יחסית פשוטות באמצעות שירותים אלו, והמדיום, בעיקר זה הסלולארי, שאינו מאפשר העמקה של ממש בתנאים, מוליכים לקלות באישור התנאים או להתעלמות מהם.

זכות הגישה

הקשיים המצוינים לעיל יכולים במידה מסוימת לקבל תרופה באמצעות יידועו של הצרכן על ידי בעל מאגר המידע אודות קיום פרטים אודותיו ומתן האפשרות לתקנם או אפילו במקרים מסוימים למחקם. בדירקטיבה החדשה של הקהילה האירופאית, ישנם הסדרים מפורטים בהקשר לכך, כמו כן, המוסדות הפדרליים בארה"ב ממליצים על קיום הסדרים שיעניקו זכויות כאלו לפרטים אל מול בעלי המאגרים. כמו כן, ההסדרים הנדונים חותרים ליצירת דפוסי פעילות שיש בהם כדי להקל על הצרכנים בבואם להתמודד עם מדיניות הפרטיות של בעלי היישומים. לכן חשוב שבבנייה של מערכות Big Data  ושל יישומים הנוטלים את הפרטים תינתן הדעת על קיום כלים מחשוביים לשם התמודדות עם הרגולציה החדשה בתחום זה, כמו אף ביחס לעיצוב הממשקים מול הפרט מבחינה תפעולית, מסחרית ומשפטית.

אבטחת מידע

היקף המידע, התובנות שיכולות להלמד ממנו, קלות האיסוף, הקישור לרשתות תקשורת פתוחות ויתר המאפיינים של ביג דאטה מחייבים מכל בעל מאגר לשכלל את רמת אבטחת המידע של המאגר שבידו, ולצור חומות ומערכות הרשאה קפדניות, שכן לזליגת המידע מתוך המערכות יכולה להיות תוצאות קשות מבחינה כלכלית ואנושית לנשואי המידע, והדבר יכול להוות עילה לתביעת נזיקין בסכומים משמעותיים. בישראל הותקנו ב- 2017 תקנות הגנת הפרטיות (אבטחת מידע), התשע"ז-2017, הקובעות סטנדרטים לאבטחת מאגרי מידע בהתאם למאפיינים שונים של המאגר.

ילדים

כמו כן, מאחר שהזירה האינטרנטית בין באמצעים הנייחים ובין באלו הניידים פתוחה הלכה למעשה לקטינים ולילדים צעירים, ישנו חשש ברור, כי אלו אינם מבינים את המשמעויות של נטילת פרטים אישיים מהם, ולכן לפי הגישות האירופאיות והאמריקאיות הסכמתם או הפנייתם למדיניות הפרטיות אין בה די, ויש צורך בהתערבות הוריהם. מכיוון שכך, מנגנונים שמיועדים ליטול פרטים של אוכלוסיה צעירה זו צריכים להיות מותאמים במיוחד לקבלת אישור ההורים.

לסיום

ישנן סוגיות נוספות הנוגעות ל Big Data  ולהגנת הפרטיות בעולם המקוון, וכל המפורט לעיל הינו בגדר "על קצה המזלג". כמו כן, לכל מאגר מידע ויישום מאפיינים משלו.

אנו נשמח לסייע לכם בייעוץ לגבי הכללים החלים בשיטות המשפט השונות וביחס לאופן התמודדות עימם.