נא להתנהג בהתאם: על אלגוריתמים התנהגותיים - מיסטר ביג ומר דאטה - הבלוג של ד"ר יעקב רימר - TheMarker
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

נא להתנהג בהתאם: על אלגוריתמים התנהגותיים

אלגוריתמים התנהגותיים הוא מונח שיווקי לניתוח של נתוני אירועים ■ מהם נתונים דינמיים לעומת נתונים סטטיים?

תגובות
בית "האח הגדול"
עמית גירון

בפוסט הפותח של בלוג זה עסקתי בנושא של אלגוריתמים לגילוי אנומליות. ציינתי בסופו שבהקשר של ניתוח הרגלים אנושיים הם יכונו לעיתים גם אלגוריתמים התנהגותיים (או Behavioral Analytics). בשנים האחרות זהו באזז-וורד חזק בעולמות שונים, לטעמי יותר בפן השיווקי. אסביר.

אפשר לחלק באופן גס את הנתונים בעולם הביג-דאטה לשתי קבוצות: סטטיים ודינמיים. בנתונים סטטיים הכוונה בדרך כלל לנתונים שמאפיינים (או מתארים) ישות מסוימת ועונים על השאלה "מי היא". אם מדובר באדם אז הכוונה למשל לשמו, גילו, שנת לידתו, מספר תעודת הזהות שלו וכדומה. בעולם הסייבר נתאר קובץ במחשב לפי הסוג שלו, שמו, אורכו ומאפיינים אחרים שנוכל למצוא עליו. לעומת זאת נתונים דינמיים בדרך כלל מאפיינים אירועים שהתרחשו בנקודת זמן מסוימת וקשורים לישויות האלו. הם עונים למשל על השאלה "מה הם עושים".

בעולם הדיגיטלי בו אנו חיים כל אחד מאתנו משאיר שובל של נתונים דינמיים. אנחנו גולשים לאתרים ולרשתות חברתיות, שולחים ומקבלים הודעות, נוסעים או טסים, מורידים אפליקציות, קונים ועוד. כל אירוע כזו נרשם איפשהו, או במספר מקומות. באופן דומה, קובץ של תכנה במחשב, או אפליקציה בטלפון, מבצעים פעולות שונות בזמן שהם בשימוש (כלומר פעילים) וגם אותן ניתן לרשום כמובן ולנתח באופן אלקטרוני.

ומה אפשר לעשות עם נתוני אירועים? המון דברים. ראשית, שימו לב שכמעט בכל אירוע מאלו שמניתי יש (לפחות) שלשה שחקנים. מבצע הפעולה, מה נעשה ועל מי (או אל מי) היא נעשתה. ניקח לדוגמה טיסה של דוד למדריד. ראשית, יש את הנוסע דוד. אפשר לבנות עבורו פרופיל סטטי שיכיל שם, אזרחות, מספר דרכון וכו'. ניתן גם ליצור פרופיל דינמי שיתאר את אופי הטיסות שלו. למשל, כמה פעמים דווד טס בשנה, לאילו יעדים, האם הוא טס לבד או עם המשפחה ועוד. למה זה מעניין? זה מעניין מאוד את חברות התעופה, בכל מה שקשור למועדוני לקוחות, וזה מעניין לא פחות את גורמי הביטחון שעוסקים באבטחה של טיסות מפני טרור. ואם, כמו רבים אחרים, גם אתם מזמינים טיסות באינטרנט, אז זה מעניין גם חברות כמו גוגל ואחרות שעשויות לנצל את המידע הזה להפקת רווחים.

מטוס ריאנאייר
REUTERS

שנית, יש את הטיסה למדריד (=מה נעשה). לקו התעופה עצמו יש נתונים סטטיים כגון יעד, סוג מטוס ועוד. אבל כל אירוע טיסה משאיר גם שובל ארוך של נתונים דינמיים. כמובן נתונים לגבי הנוסעים, אבל גם מתי הוזמנו הכרטיסים, איפה, באיזה מחיר, כמה ביטולים היו, כמה מזוודות ועוד. איסוף נתונים כאלו מכל טיסות הקו נתב"ג-מדריד יכולים לשרת את חברת התעופה בפן הלוגיסטי וגם בתכנון אופן השיווק של הטיסות, שיטת תמחור הכרטיסים ועוד. ואפשר גם לנתח את נתוני הטיסות היוצאות למדריד אל מול הטיסות החוזרות. אולי אפילו לנסות להבין מתי עלולים להתרחש אירועים שקשורים לשוקולד.

ויש את יעד הטיסה, מדריד. בדיוק כפי שניתן לבנות פרופיל דינמי לכל נוסע על פי אופי הטיסות השונות שלו, כך אפשר לבנות פרופיל לכל יעד טיסה על פי נתוני כל הטיסות והנוסעים שמגיעים אליו. הפעם מי שאמור להתעניין בנתונים הם הנהלת שדה התעופה ומשרד התיירות של אותה מדינה (בהנחה שהם מבינים עניין). בדוגמה של אירוע טיסה יש שחקנים נוספים, אבל נסתפק בזה.

כלומר, בכל פעם שדויד טס למדריד או רון טס לבון, נאגרים נתונים ומבוצעים ניתוחים שונים. מדובר בנתונים של אותו האירוע בדיוק, אבל כידוע "דברים שרואים מכאן לא רואים משם". כל אחד יכול לקחת את אירוע הטיסה הבדיד, לחבר אותו לאירועים דומים ולנתח אותו מהזווית שלו לטובת היישום שמעניין אותו. ניתן עקרונית להשתמש בכל אחת מהשיטות השונות שכבר סקרתי בפוסטים הקודמים, כגון אישכול, סיווג, זיהוי אנומליות ואחרות, או בשיטות נוספות שעוד אסקור (בלי נדר) בעתיד. הכול תלוי באופן הגדרת מבנה הנתונים וכמובן במטרה של הניתוח.

אז מהו אלגוריתם התנהגותי? ניתוח שעוסק בנתונים של אוסף אירועים הוא עקרונית "התנהגותי". אמנם טבעי יותר להשתמש במונח "התנהגותי" בהקשר של אנשים מאשר של שדות תעופה, אבל זוהי הבחנה מלאכותית שהומצאה כדי לתמוך במצגות של אנשי שיווק ומכירות. בפועל ממילא ייעשה שימוש באותן השיטות בדיוק בהן משתמשים כבר עשרות שנים לניתוח של נתונים דינמיים, עוד לפני שסיפרו לנתונים שהם "התנהגותיים". עוד על הנושא בפוסט הבא.

אשמח לקבל רעיונות לנושאים לפוסטים עתידיים לכתובת זו: MrBigDataThemarker@gmail.com



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר TheMarker

סדר את התגובות

כתבות שאולי פיספסתם

*#