ביג דאטה לשלטון: האם ניתן לחזות את תוצאות הבחירות? - מיסטר ביג ומר דאטה - הבלוג של ד"ר יעקב רימר - TheMarker
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

ביג דאטה לשלטון: האם ניתן לחזות את תוצאות הבחירות?

שיטות ביג דאטה מתקשות מאוד בחיזוי תוצאות של אירועים ייחודים כדוגמת בחירות ■ בעבר היו מעלים באוב או קוראים בקפה ■ היום יש סקרים ומומחים פוליטיים

2תגובות
Getty Images IL

בתקופת בחירות סוערת זו, עתירת מפצים, פילוגים, מיזוגים ומפלגות גוססות, אני נשאל האם ניתן לחזות את תוצאות הבחירות בשיטות של ביג-דאטה. התשובה במילה אחת היא לא. בשתי מילים – ממש לא. אבל רגע, איך זה שכל יום מתפרסמים עוד ועוד סקרים שמתיימרים לעשות בדיוק את זה?

לכאורה, חיזוי בחירות הינו בעיה מתאימה לתחום הביג-דאטה. יש נתונים רבים של תוצאות אמת ממערכות בחירות קודמות. אפשר לאסוף הרבה נתונים חדשים באמצעות סקרים או איסוף אוטומטי וניתוח טרנדים ברשתות חברתיות וגם בשילוב של ניתוח טקסטים. כלומר, אין שום קושי לאסוף מאגר של ביג-דאטה. ומכאן לכאורה קצרה הדרך לנסות ולהזין את כל הנתונים האלו לשיטות שונות של למידה או סטטיסטיקה ולחזות את תוצאות מערכת הבחירות. לצערנו יש כאלו שעושים את זה. הם מקבלים "תוצאות" ורצים לספר לחברה בתקשורת, מבלי להבין (במקרה הטוב) שמדובר בתוצאות חסרות בסיס.

אז מדוע לא ניתן לחזות תוצאות של בחירות? הרי יש כאמור שפע של נתונים. גם קיימות שיטות לחיזוי שעובדות היטב במקרים רבים. למשל, יש מערכות חיזוי מוצלחות שחוזות איזה ספרים או סרטים יעניינו אותך, על סמך רכישות קודמות. וקיימות דוגמות נוספות לחיזוי מוצלח בתחומים עסקיים מגוונים. העניין הוא שלמרות שהשיטות האלו עובדות היטב במקרים אלו, לחזות תוצאות של בחירות בישראל זה סיפור אחר לגמרי. יש לכך הרבה סיבות ואעמוד רק על חלקן.

כל שיטות החיזוי, ללא יוצא מהכלל, מבוססות על למידה מנתוני עבר. למשל, שיטות חיזוי שמשתמשות בטכניקת סיווג כלשהי, לומדות מדוגמות אמיתיות שהתוצאה עבורן ידועה. במקרה שלנו אפשר לחשוב על נתוני כל המצביעים בקלפיות בעיר מסוימת. אילו היו לנו בישראל רק שתי מפלגות, למשל מפלגת הצמחונים ומפלגת הקרניבורים, אולי אפשר היה להסתמך על דפוסי הצבעה במספר מערכות בחירות קודמות כדי לחזות את התוצאות בבחירות הבאות.

תומר אפלבאום

אבל במדינת ישראל יש הרבה מאוד מפלגות. נכון לסגירת הרישום, 47 (!) במספר. רבות מהן חדשות לגמרי ואין לגביהן שום נתוני עבר. אחרות משתמשות בשמות של מפלגות מהעבר, ללא קשר למפלגה המקורית. יתרה מזו, גם חלק מהמפלגות הוותיקות שינו את פניהן. אם בעקבות פילוגים ואחודים או בשל חילופי מועמדים. ואם לא די בזה, הנושא המרכזי עליו נסובה מערכת בחירות בישראל הוא שונה בכל פעם (ממש לא צמחונים מול קרניבורים). יש גם שיאמרו שארבע שנים במדינת ישראל שקולות לשנות דור במדינה "רגועה" יותר. האם מישהו חושב ברצינות שדפוסי הצבעה בבחירות קודמות מנבאים את הבחירות הנוכחיות?

ומה לגבי סקרים ואיסוף טרנדים מהאינטרנט? גם שני אלו עמוסים בעיות כרימון. למתעניינים, קל למצוא כתבות של אנשי מקצוע שמסבירים היטב מדוע הסקרים של הבחירות הן הבל. אני אסתפק בהצבעה על מספר בעיות שורש. קושי מרכזי בסקרי בחירות הוא היכולת לפלח את האוכלוסייה המאוד הטרוגנית של מדינת ישראל. זהו תנאי הכרחי כדי לבנות מדגם של נסקרים שייצג נאמנה את כל גווני הציבור. מדובר במשימה קשה עד בלתי אפשרית. אם בעבר ניתן היה לבצע ניחוש "מושכל" של אופי אוכלוסייה לפי כתובות מגורים בספר הטלפונים של בזק, היום כידוע זה ממש לא רלוונטי. בנוסף, קיימות אוכלוסיות שאינן מוכנות לשתף פעולה עם סקרים מלכתחילה, בעוד נסקרים רבים (מאוד) סתם מסרבים לענות. וגם אלו שכבר עונים, לפעמים עונים "לא יודע" או משקרים.

בנימין נתניהו בהודעה לתקשורת, אתמול
גיל כהן מגן

איסוף מהאינטרנט לוקה בבעיות משלו, כאשר בעיית השורש דומה במהותה. דגימה כזו רלוונטית רק לאוכלוסייה ספציפית מאוד - גולשים שפעילים ברשתות/אתרים שנדגמים. האוכלוסייה הזו רחוקה מאוד מלייצג את כל גווני הציבור בישראל. זה מעט מזכיר לי אנשים שמופתעים מתוצאות הבחירות, מכיוון שלתפיסתם הרוב חושב כמותם. המופתעים צריכים לשאול את עצמם האם חוג המכרים שלהם משקף נאמנה את מצביעי כל המפלגות בישראל.

אל תטעו, סקרים הם כלי מצוין שמבוסס על שיטות מחקר מדעיות. יש סוקרים מקצועיים ואמינים שמבצעים עבודה מצוינת, למשל של סקרים עבור חברות עסקיות. אבל מכלול הפרמטרים והמידע שנדרש כדי לנסות ולנבא תוצאות בבחירות הוא כל כך גדול, עד שלא בכדי נאמר שהנבואה ניתנה לשוטים (או שרלטנים). בעבר היו מעלים באוב או קוראים בקפה. היום יש סקרים ומומחים פוליטיים. שיטות ה"עבודה" אמנם השתנו, אבל איכות התחזיות נותרה בעינה. מה שכמובן לא יפריע להסביר בדיעבד ש"הכתובת היתה על הקיר".

הרשמה לניוזלטר

כל הסקירות בזירת הניתוחים של TheMarker - בתיבת המייל שלכם

ברצוני לקבל ניוזלטרים, מידע שיווקי והטבות


תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר TheMarker

סדר את התגובות

כתבות שאולי פיספסתם

*#