כוחו של הרגל: יצירת פרופילים מתוך הקשר של זמן ומקום - מיסטר ביג ומר דאטה - הבלוג של ד"ר יעקב רימר - TheMarker
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

כוחו של הרגל: יצירת פרופילים מתוך הקשר של זמן ומקום

דע מאין באת ולאן אתה הולך – כיצד עובדים אלגוריתמים התנהגותיים מבוססי מקום?

מפה, טיול
rawpixel on Unsplash

שילוב של נתונים ממדים שונים, למשל זמן ומקום, מעשיר את ההבנה שלנו. בפוסט הקודם הבאתי דוגמות נוספות לשימושים באלגוריתמים התנהגותיים (אוBehavioral Analytics). כל הדוגמות עד כה עסקו בתובנות מניתוח של נתוני אירועים בזמן, אבל לאירועים שונים יש מאפיין חשוב נוסף – מקום.

ב-2015 פירסם העיתונאי האוסטרלי וויל אוקנדן (Will Ockenden) את הנתונים של שיחות הטלפון שלו, אותם קיבל מחברת הסלולר. לא מדובר בתוכן השיחות, אלא במטה-דאטה שלהן. אלו נתונים שמתארים מתי הוא שוחח, עם מי, ובאיזו אנטנה סלולרית נקלטה השיחה (איכון). כלומר, כל שיחה התרחשה לא רק בזמן מסוים, אלא גם במקום שמזוהה על סמך האנטנה בה השיחה נקלטה. וויל פרסם את נתוניו כחלק מדיון פומבי לגבי פרטיות האזרח (או יותר נכון, אובדנה). עבורנו זאת הזדמנות ללמוד על היכולת לנתח התנהגות של אדם במרחב ולא רק בזמן.

למשל, ניתוח הנתונים של שעות היום מצביע בקלות על מקום העבודה שלו בסידני וגם היכן הוא נוהג לשתות קפה או לאכול צהריים. אם נבודד רק את נתוני הלילה, נאתר מיד את ביתו. אם תתבוננו בקישור הזה תראו שניתן לזהות בקלות גם את המסלולים של וויל לעבודה, באוטובוס או במעבורת. אנשים שניתחו את הנתונים שוויל פרסם זיהו גם מתי הוא עבר דירה ולהיכן. זאת מכיוון שחרג מהשגרה היומית של בית-עבודה. ומעבר לשגרת ימי העבודה, ניתן ללמוד גם על חייו הפרטיים בסופי שבוע ובחגים. הקוראים זיהו בקלות היכן גרים הוריו, אליהם נסע בחגים, כמו גם אירועים משפחתיים ובילויים נוספים. חלקם אף העירו שניכר שוויל אינו בליין גדול. לצערו הוא נאלץ להודות שהם צודקים.

מה זה מלמד אותנו? ראשית, שניתן ללמוד המון על אדם רק מנתוני האירועים שקשורים אליו. שנית, ששילוב של ממדים שונים, במקרה שלנו זמן ומקום, מעשיר את ההבנה שלנו. ללא מיקומי השיחות יכולנו אמנם לדעת עם מי הוא מדבר ומתי, אבל לא על שגרת חייו. ודוגמה אחרת, ידוע שאנשים דתיים אינם נוהגים לשוחח בטלפון בשבת. אם נבנה להם פרופיל התנהגותי לפי שיחות הטלפון, נבחין בכך. במידה ובשבת מסוימת יש שיחות, זה יהיה תמוה. אולי גנבו את המכשיר? אבל אם נתוני מיקום השיחות בשבת יראו שהן בוצעו בדרך אל או בסביבת בית חולים, הדברים יראו אחרת.

בלש אילוסטרציה
Getty Images IL

כיצד מרכיבים פרופיל התנהגותי

לרוב האנשים יש הרגלים קבועים. על הרעיון הבסיסי הזה מבוססים האלגוריתמים שבונים פרופיל התנהגותי לאנשים. הדוגמה של וויל העיתונאי המחישה את היכולת לבנות פרופיל התנהגות לאדם בודד. ניתן לכאורה לבצע את אותו התרגיל גם לכל המנויים של חברת הסלולר. אפשר לחשוב על שימושים שונים. למשל, קל יהיה לזהות אוהדים של קבוצה מסוימת. צריך רק לבדוק האם הם ממוקמים במגרשים בזמן המשחקים של הקבוצה. נוכל לראות מי הם האוהדים השרופים המלווים את קבוצתם בכל מצב, ומי הם אלו שמגיעים רק כאשר היא מתחילה סוף סוף לנצח. נוכל גם לזהות בקלות נהגי משאיות, או נהגי אוטובוסים של תיירים. זאת כי נהגים אלו יקיימו כשגרה שיחות לאורכה ולרוחבה של המדינה. ויש עוד דוגמות רבות.

ואם אתם תוהים למי יש גישה לנתונים כאלו, היום לכל טלפון יש GPS ואפליקציות רבות מבקשות אישור גישה אליו. כל אפליקציה שאישרתם לה לגשת לנתוני ה-GPS שלכם יכולה להשתמש בהם כדי ללמוד אתכם וגם כדי להבין לאיזו קבוצת אנשים אתם שייכים. אבל לא רק לנתוני טלפון יש זמן ומקום. יש דוגמות נוספות, למשל קניות בכרטיסי אשראי.

כחלק מהניסיון למנוע הונאות בכרטיסי אשראי, חברת האשראי יכולה ללמוד היכן אתם נוהגים לשלם בכרטיס שלכם. כך אפשר לזהות אם לפתע מופיעים חיובים ממקום חדש. מצד אחד, אולי נסעתם לחופשה. אם כך, תבלו ותיהנו. מצד שני, אם הכרטיס שלכם הוצג וחויב בחנות באילת, וכחצי שעה לאחר מכן הוא הוצג וחויב בחנות בתל אביב, זה כבר נראה חשוד מאוד. לפחות עד שיהיה לכם מטוס סילון פרטי (מאוד מהיר).

כרגיל, חשוב לסייג ולומר שהדברים כמובן אינם פשוטים. אם נחזור רגע לוויל, הנתונים שלו יכולים להיות גם מבלבלים. מסתבר שהוא עובד לפעמים משמרות לילה ואז הזיהוי של הבית ומקום העבודה "מתהפכים". באופן דומה, אולי אותו אוהד קבוצה שתיארתי לעיל הוא בכלל האפסנאי של הקבוצה. הוא אמנם נוסע אתה, אבל אולי הוא אוהד בסתר ליבו את היריבה העירונית? בהקשר הזה נתונים דינמיים ופרופילים התנהגותיים אינם שונים משאר הנתונים. תמיד צריך להבין היטב את הנתונים ולנקוט משנה זהירות בהסקת המסקנות אודות המשמעות שלהם.

הרשמה לניוזלטר

כל הסקירות בזירת הניתוחים של TheMarker - בתיבת המייל שלכם

ברצוני לקבל ניוזלטרים, מידע שיווקי והטבות


תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר TheMarker

סדר את התגובות

כתבות שאולי פיספסתם

*#