נא להתנהג בהתאם: על אלגוריתמים התנהגותיים

אלגוריתמים התנהגותיים הוא מונח שיווקי לניתוח של נתוני אירועים ■ מהם נתונים דינמיים לעומת נתונים סטטיים?

יעקב רימר
ד"ר יעקב רימר
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקיםכתוב תגובה
בית "האח הגדול"
בית "האח הגדול"צילום: עמית גירון

בפוסט הפותח של בלוג זה עסקתי בנושא של אלגוריתמים לגילוי אנומליות. ציינתי בסופו שבהקשר של ניתוח הרגלים אנושיים הם יכונו לעיתים גם אלגוריתמים התנהגותיים (או Behavioral Analytics). בשנים האחרות זהו באזז-וורד חזק בעולמות שונים, לטעמי יותר בפן השיווקי. אסביר.

אפשר לחלק באופן גס את הנתונים בעולם הביג-דאטה לשתי קבוצות: סטטיים ודינמיים. בנתונים סטטיים הכוונה בדרך כלל לנתונים שמאפיינים (או מתארים) ישות מסוימת ועונים על השאלה "מי היא". אם מדובר באדם אז הכוונה למשל לשמו, גילו, שנת לידתו, מספר תעודת הזהות שלו וכדומה. בעולם הסייבר נתאר קובץ במחשב לפי הסוג שלו, שמו, אורכו ומאפיינים אחרים שנוכל למצוא עליו. לעומת זאת נתונים דינמיים בדרך כלל מאפיינים אירועים שהתרחשו בנקודת זמן מסוימת וקשורים לישויות האלו. הם עונים למשל על השאלה "מה הם עושים".

בעולם הדיגיטלי בו אנו חיים כל אחד מאתנו משאיר שובל של נתונים דינמיים. אנחנו גולשים לאתרים ולרשתות חברתיות, שולחים ומקבלים הודעות, נוסעים או טסים, מורידים אפליקציות, קונים ועוד. כל אירוע כזו נרשם איפשהו, או במספר מקומות. באופן דומה, קובץ של תכנה במחשב, או אפליקציה בטלפון, מבצעים פעולות שונות בזמן שהם בשימוש (כלומר פעילים) וגם אותן ניתן לרשום כמובן ולנתח באופן אלקטרוני.

ומה אפשר לעשות עם נתוני אירועים? המון דברים. ראשית, שימו לב שכמעט בכל אירוע מאלו שמניתי יש (לפחות) שלשה שחקנים. מבצע הפעולה, מה נעשה ועל מי (או אל מי) היא נעשתה. ניקח לדוגמה טיסה של דוד למדריד. ראשית, יש את הנוסע דוד. אפשר לבנות עבורו פרופיל סטטי שיכיל שם, אזרחות, מספר דרכון וכו'. ניתן גם ליצור פרופיל דינמי שיתאר את אופי הטיסות שלו. למשל, כמה פעמים דווד טס בשנה, לאילו יעדים, האם הוא טס לבד או עם המשפחה ועוד. למה זה מעניין? זה מעניין מאוד את חברות התעופה, בכל מה שקשור למועדוני לקוחות, וזה מעניין לא פחות את גורמי הביטחון שעוסקים באבטחה של טיסות מפני טרור. ואם, כמו רבים אחרים, גם אתם מזמינים טיסות באינטרנט, אז זה מעניין גם חברות כמו גוגל ואחרות שעשויות לנצל את המידע הזה להפקת רווחים.

מטוס ריאנאייר
מטוס ריאנאיירצילום: REUTERS

שנית, יש את הטיסה למדריד (=מה נעשה). לקו התעופה עצמו יש נתונים סטטיים כגון יעד, סוג מטוס ועוד. אבל כל אירוע טיסה משאיר גם שובל ארוך של נתונים דינמיים. כמובן נתונים לגבי הנוסעים, אבל גם מתי הוזמנו הכרטיסים, איפה, באיזה מחיר, כמה ביטולים היו, כמה מזוודות ועוד. איסוף נתונים כאלו מכל טיסות הקו נתב"ג-מדריד יכולים לשרת את חברת התעופה בפן הלוגיסטי וגם בתכנון אופן השיווק של הטיסות, שיטת תמחור הכרטיסים ועוד. ואפשר גם לנתח את נתוני הטיסות היוצאות למדריד אל מול הטיסות החוזרות. אולי אפילו לנסות להבין מתי עלולים להתרחש אירועים שקשורים לשוקולד.

ויש את יעד הטיסה, מדריד. בדיוק כפי שניתן לבנות פרופיל דינמי לכל נוסע על פי אופי הטיסות השונות שלו, כך אפשר לבנות פרופיל לכל יעד טיסה על פי נתוני כל הטיסות והנוסעים שמגיעים אליו. הפעם מי שאמור להתעניין בנתונים הם הנהלת שדה התעופה ומשרד התיירות של אותה מדינה (בהנחה שהם מבינים עניין). בדוגמה של אירוע טיסה יש שחקנים נוספים, אבל נסתפק בזה.

כלומר, בכל פעם שדויד טס למדריד או רון טס לבון, נאגרים נתונים ומבוצעים ניתוחים שונים. מדובר בנתונים של אותו האירוע בדיוק, אבל כידוע "דברים שרואים מכאן לא רואים משם". כל אחד יכול לקחת את אירוע הטיסה הבדיד, לחבר אותו לאירועים דומים ולנתח אותו מהזווית שלו לטובת היישום שמעניין אותו. ניתן עקרונית להשתמש בכל אחת מהשיטות השונות שכבר סקרתי בפוסטים הקודמים, כגון אישכול, סיווג, זיהוי אנומליות ואחרות, או בשיטות נוספות שעוד אסקור (בלי נדר) בעתיד. הכול תלוי באופן הגדרת מבנה הנתונים וכמובן במטרה של הניתוח.

אז מהו אלגוריתם התנהגותי? ניתוח שעוסק בנתונים של אוסף אירועים הוא עקרונית "התנהגותי". אמנם טבעי יותר להשתמש במונח "התנהגותי" בהקשר של אנשים מאשר של שדות תעופה, אבל זוהי הבחנה מלאכותית שהומצאה כדי לתמוך במצגות של אנשי שיווק ומכירות. בפועל ממילא ייעשה שימוש באותן השיטות בדיוק בהן משתמשים כבר עשרות שנים לניתוח של נתונים דינמיים, עוד לפני שסיפרו לנתונים שהם "התנהגותיים". עוד על הנושא בפוסט הבא.

אשמח לקבל רעיונות לנושאים לפוסטים עתידיים לכתובת זו: MrBigDataThemarker@gmail.com

יעקב רימר

ד"ר יעקב רימר | מיסטר ביג ומר דאטה

יועץ בכיר ומרצה בנושאי סייבר, ביג דאטה ומדעים, בעל דוקטורט ממכון ויצמן למדע. עוסק בעשור האחרון במחקר מדעי במקביל לייעוץ לחברות היי-טק ומשרדי ממשלה. בעבר שימש בתפקידים בכירים בהיי-טק ובמשרד ראש הממשלה. מרצה משופשף ומנוסה, שמתמחה בהמחשת נושאי מדע וטכנולוגיה "קשים לעיכול" בגובה העיניים. משלב בכתיבתו והרצאותיו את הניסיון ארוך השנים בתעשיית ההיי-טק ובאקדמיה, יחד עם העברת מסרים ברורה והומור.

הבלוג ינסה להמחיש לקורא המתעניין (וגם הלא-מקצועי) מה כוחם האמיתי של ניתוח נתונים, למידת מכונה או ביג דאטה. מה אפשר (או אי אפשר) לעשות באמצעות שיטות אלו ואיך כל זה נוגע לפרטיות שלנו.

LinkedIn 

Home Page

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker