הֲיֵלְכוּ שְׁנַיִם יַחְדָּו בִּלְתִּי אִם נוֹעָדוּ – על ניתוח קשרים

ניתוח קשרים הוא אחד התחומים המרתקים בעולם הביג-דאטה

יעקב רימר
ד"ר יעקב רימר
"טיטאניק"
"טיטאניק"צילום: /אי־פי
יעקב רימר
ד"ר יעקב רימר

עמוס הנביא שואל "הֲיֵלְכוּ שְׁנַיִם יַחְדָּו בִּלְתִּי אִם נוֹעָדוּ". אם ראינו שני אנשים שהולכים יחדיו, סביר יותר שהם קבעו להיפגש, מאשר שהם נפגשו באקראי. כלומר, יש ביניהם קשר. על ההיגיון הפשוט הזה מבוססת היכולת שלנו לחקור פשעים חמורים. נניח שנמצאה גופת אישה שנרצחה (לא עלינו). קיימת אפשרות שמדובר ברוצח מזדמן, אולם ניסיון העבר מלמד שיש סבירות גבוהה יותר שמדובר ברוצח מ"המעגל הראשון" של המכרים שלה. במקרים רבים לצערנו קרוב משפחה מדרגה ראשונה כמו בן-זוג, אח או בן.

מה הקשר של כל זה לביג-דאטה? שאלה מצוינת. זאת דוגמה מזעזעת מעט אך פשוטה לניתוח קשרים (Link Analysis), אחד התחומים המרתקים בעולם הביג-דאטה. כאשר מדובר בניתוח של קשרים בין אנשים, בייחוד בעידן הרשתות החברתיות, מקובל לכנות זאת גם ניתוח רשתות חברתיות (Social Network Analysis). יש לתחום זה יישומים רבים, החל ממחקר פשעים, סיכול טרור וכדומה, ועד לתחום השיווק והפרסום הוויראלי.

מקובל להציג רשתות של קשרים באמצעות גרפים (תמונה 1). כל עיגול (או צומת בגרף) מייצג ישות אחת (למשל אדם) והקווים מייצגים את הקשרים שקיימים ביניהם. שיטות שונות לניתוח של קשרים מבוססות על אלגוריתמים מתוך "תורת הגרפים" (Graph theory), תחום במתמטיקה שנוסד בשנת 1736 על ידי המתמטיקאי המוכשר לאונרד אוילר. התחום שהיה תיאורטי בתחילה קיבל תנופה רבה במאה הקודמת, ביחוד לאור היישומים הרבים שיש לו בתחומים שונים של עולם המחשבים.

תמונה 1: דוגמה לגרףצילום: https://commons.wikimedia.org/wiki/File:Pseudoforest.svg

כדי להמחיש יישום אחד פשוט של תורת הגרפים, נחזור לרגע לעסוק בפענוח פשעים. נניח שדווח למשטרה על שני נמלטים מזירת הפשע. האחד זוהה כאברהם, דמות מוכרת היטב למשטרה, ואילו דיווחים נוספים שונים מצביעים על יצחק כשותפו של אברהם לפשע. יצחק אינו בעל עבר פלילי, והתיאור שהתקבל עבורו אינו חד משמעי. אם נצליח למצוא קשר בין אברהם ליצחק, נוכל לבסס את החשד נגדו. מתוך המידע שבידי המשטרה, נמצא כי יצחק מוכר כחברו הטוב ביותר של יעקב, גיסו של אברהם (נשוי לשרה, אחותו). כלומר, אם נניח שיש לנו גרף ענק שמכיל את כל הקשרים בין אנשים בישראל, בשפת תורת הגרפים מצאנו מסלול בגרף שמקשר בין אברהם ליצחק, באמצעות יעקב ושרה (ראו תמונה 2).

תמונה 2: מסלול בגרף המקשר בין אברהם ליצחק. שרה היא אחותו של אברהם, היא נשואה ליעקב, ויצחק הוא חברו של יעקב.

וכיצד יתכן שיהיה לנו גרף ענקי של כל קשרי האנשים בארץ? כאן באים לידי ביטוי העוצמה של האינטרנט בשילוב עם עולם הביג-דאטה. ראשית, רשתות חברתיות הן מקור מידע מצוין לקשרים בין אנשים. קיימים גם אתרים שונים שאוגרים עצי יוחסין של משפחות. אתרים אחרים מקשרים בין אנשים למקום העבודה שלהם, וזהו מקור מידע מצוין לקשרים עסקיים בין אנשים (מעבר לרשת לינקדאין כמובן). יש עוד מקורות מידע רבים לקשרים בין אנשים, חלקם פתוחים רק לרשויות החוק, כדוגמת מאגר מרשם האוכלוסין ועוד.

יש ערך רב לניתוח קשרים בעולמות מגוונים, גם כשלא מדובר באנשים. למשל, ניתוח קשרים בין חלבונים בתוך תא לצורכי מחקר ביולוגי ורפואי. בתוך התא קיימים עשרות אלפי סוגים של חלבונים. יש להם תפקידים רבים ויכולת להיקשר זה לזה או לרכיבים אחרים בתא. היכולת לזהות ולאגור את הקשרים האפשריים בין החלבונים ולנתח אותם חשובה מאוד להבנה של תהליכים שונים בתא בריא, פגום או סרטני. מדובר בתחום מחקר מורכב מאוד (בגלל הכמות העצומה של האפשרויות), שמשלב גם תחומי ידע נוספים. כל גילוי נוסף מקרב אותנו להבנת גורמים למחלות או ליכולת לפתח תרופות חדשות. לא פחות חשוב, לנסות לזהות מראש תופעות לוואי שעלולות להיגרם בגלל התרופה, בשל היכולת שלה להשפיע גם על חלבונים אחרים בגוף וכדומה.

דוגמות נוספות ליישומים הן ניתוח קשרים עסקיים בין חברות או קשרים פיננסים בין חשבונות, למשל כדי לאתר הונאות מסוגים שונים או הלבנות הון. ניתוח קשרים בין מילים בשפה מסוימת לצורכי ניתוח טקסטים. ניתוח קשרים בין מחשבים וישויות רשתיות אחרות לטובת הגנת סייבר, או לצורך ייעול של רשתות תקשורת שונות ועוד יישומים רבים אחרים. וכפי שאמרתי בפתיחה, יש יישומים גם לניתוח רשתות חברתיות. על כך בפוסט הבא.

אשמח לקבל רעיונות לנושאים לפוסטים עתידיים לכתובת המייל הנ"ל

MrBigDataThemarker@gmail.com

לחצו על הפעמון לעדכונים בנושא:

כתבות מומלצות

קציר חיטה בסוריה, יוני 2022. הקציר מגדיל את היצע החיטה, אבל החשש ממיתון מקטין את הביקוש

פתאום ההשקעות הכי חמות צונחות: נפט, סחורות, תשואות – למה זה קורה?

העיר לא זולה, אבל זה היה משתלם מכל בחינה אחרת

"הבית שלי בגד בי": תל אביבית שעוזבת אחרי שלושה עשורים מגלה מה שבר אותה

שי שרון. "הרגשתי שאני מתאמץ בעיקר בשביל שהבעלים של חברת האופנה ירוויחו יותר"

"חייתי במסיבה תמידית, אבל זה היה כלוב מזהב. עבודה חסרת משמעות"

נמל חיפה. הפקק בשנה וחצי האחרונות גרם למשק הישראלי נזק של עשרות מיליוני שקלים ביום, לפי משרד האוצר

פקק האוניות מול נמלי ישראל דועך והולך, ולא מהסיבות הנכונות

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker

כתבות שאולי פספסתם

"מבחוץ זה נראה סקסי ומגניב, אבל כשנכנסים פנימה מתברר שזאת עבודה קשה והיא חייבת להיות מדויקת"

"אפשר להרוויח 30-20 אלף שקל בחודש מעבר למשכורת": איזה עסק הכי רווחי - פלאפל, פיצה, סושי או שווארמה?

עורכי דין שפרשו מהמקצוע. ״הדור שלנו מחפש מהר, קצר, ענייני, ומבקש שיהיו לו דברים נוספים בחיים, לא רק עבודה"

"הדור הזה עובר בקלות בין עבודות - ומשאיר מאחור את משרדי עריכת הדין"