ביג דאטה לשלטון: האם ניתן לחזות את תוצאות הבחירות?

שיטות ביג דאטה מתקשות מאוד בחיזוי תוצאות של אירועים ייחודים כדוגמת בחירות ■ בעבר היו מעלים באוב או קוראים בקפה ■ היום יש סקרים ומומחים פוליטיים

ד"ר יעקב רימר
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
צילום: Getty Images IL

בתקופת בחירות סוערת זו, עתירת מפצים, פילוגים, מיזוגים ומפלגות גוססות, אני נשאל האם ניתן לחזות את תוצאות הבחירות בשיטות של ביג-דאטה. התשובה במילה אחת היא לא. בשתי מילים – ממש לא. אבל רגע, איך זה שכל יום מתפרסמים עוד ועוד סקרים שמתיימרים לעשות בדיוק את זה?

לכאורה, חיזוי בחירות הינו בעיה מתאימה לתחום הביג-דאטה. יש נתונים רבים של תוצאות אמת ממערכות בחירות קודמות. אפשר לאסוף הרבה נתונים חדשים באמצעות סקרים או איסוף אוטומטי וניתוח טרנדים ברשתות חברתיות וגם בשילוב של ניתוח טקסטים. כלומר, אין שום קושי לאסוף מאגר של ביג-דאטה. ומכאן לכאורה קצרה הדרך לנסות ולהזין את כל הנתונים האלו לשיטות שונות של למידה או סטטיסטיקה ולחזות את תוצאות מערכת הבחירות. לצערנו יש כאלו שעושים את זה. הם מקבלים "תוצאות" ורצים לספר לחברה בתקשורת, מבלי להבין (במקרה הטוב) שמדובר בתוצאות חסרות בסיס.

אז מדוע לא ניתן לחזות תוצאות של בחירות? הרי יש כאמור שפע של נתונים. גם קיימות שיטות לחיזוי שעובדות היטב במקרים רבים. למשל, יש מערכות חיזוי מוצלחות שחוזות איזה ספרים או סרטים יעניינו אותך, על סמך רכישות קודמות. וקיימות דוגמות נוספות לחיזוי מוצלח בתחומים עסקיים מגוונים. העניין הוא שלמרות שהשיטות האלו עובדות היטב במקרים אלו, לחזות תוצאות של בחירות בישראל זה סיפור אחר לגמרי. יש לכך הרבה סיבות ואעמוד רק על חלקן.

כל שיטות החיזוי, ללא יוצא מהכלל, מבוססות על למידה מנתוני עבר. למשל, שיטות חיזוי שמשתמשות בטכניקת סיווג כלשהי, לומדות מדוגמות אמיתיות שהתוצאה עבורן ידועה. במקרה שלנו אפשר לחשוב על נתוני כל המצביעים בקלפיות בעיר מסוימת. אילו היו לנו בישראל רק שתי מפלגות, למשל מפלגת הצמחונים ומפלגת הקרניבורים, אולי אפשר היה להסתמך על דפוסי הצבעה במספר מערכות בחירות קודמות כדי לחזות את התוצאות בבחירות הבאות.

בני גנץצילום: תומר אפלבאום

אבל במדינת ישראל יש הרבה מאוד מפלגות. נכון לסגירת הרישום, 47 (!) במספר. רבות מהן חדשות לגמרי ואין לגביהן שום נתוני עבר. אחרות משתמשות בשמות של מפלגות מהעבר, ללא קשר למפלגה המקורית. יתרה מזו, גם חלק מהמפלגות הוותיקות שינו את פניהן. אם בעקבות פילוגים ואחודים או בשל חילופי מועמדים. ואם לא די בזה, הנושא המרכזי עליו נסובה מערכת בחירות בישראל הוא שונה בכל פעם (ממש לא צמחונים מול קרניבורים). יש גם שיאמרו שארבע שנים במדינת ישראל שקולות לשנות דור במדינה "רגועה" יותר. האם מישהו חושב ברצינות שדפוסי הצבעה בבחירות קודמות מנבאים את הבחירות הנוכחיות?

ומה לגבי סקרים ואיסוף טרנדים מהאינטרנט? גם שני אלו עמוסים בעיות כרימון. למתעניינים, קל למצוא כתבות של אנשי מקצוע שמסבירים היטב מדוע הסקרים של הבחירות הן הבל. אני אסתפק בהצבעה על מספר בעיות שורש. קושי מרכזי בסקרי בחירות הוא היכולת לפלח את האוכלוסייה המאוד הטרוגנית של מדינת ישראל. זהו תנאי הכרחי כדי לבנות מדגם של נסקרים שייצג נאמנה את כל גווני הציבור. מדובר במשימה קשה עד בלתי אפשרית. אם בעבר ניתן היה לבצע ניחוש "מושכל" של אופי אוכלוסייה לפי כתובות מגורים בספר הטלפונים של בזק, היום כידוע זה ממש לא רלוונטי. בנוסף, קיימות אוכלוסיות שאינן מוכנות לשתף פעולה עם סקרים מלכתחילה, בעוד נסקרים רבים (מאוד) סתם מסרבים לענות. וגם אלו שכבר עונים, לפעמים עונים "לא יודע" או משקרים.

בנימין נתניהוצילום: גיל כהן מגן

איסוף מהאינטרנט לוקה בבעיות משלו, כאשר בעיית השורש דומה במהותה. דגימה כזו רלוונטית רק לאוכלוסייה ספציפית מאוד - גולשים שפעילים ברשתות/אתרים שנדגמים. האוכלוסייה הזו רחוקה מאוד מלייצג את כל גווני הציבור בישראל. זה מעט מזכיר לי אנשים שמופתעים מתוצאות הבחירות, מכיוון שלתפיסתם הרוב חושב כמותם. המופתעים צריכים לשאול את עצמם האם חוג המכרים שלהם משקף נאמנה את מצביעי כל המפלגות בישראל.

אל תטעו, סקרים הם כלי מצוין שמבוסס על שיטות מחקר מדעיות. יש סוקרים מקצועיים ואמינים שמבצעים עבודה מצוינת, למשל של סקרים עבור חברות עסקיות. אבל מכלול הפרמטרים והמידע שנדרש כדי לנסות ולנבא תוצאות בבחירות הוא כל כך גדול, עד שלא בכדי נאמר שהנבואה ניתנה לשוטים (או שרלטנים). בעבר היו מעלים באוב או קוראים בקפה. היום יש סקרים ומומחים פוליטיים. שיטות ה"עבודה" אמנם השתנו, אבל איכות התחזיות נותרה בעינה. מה שכמובן לא יפריע להסביר בדיעבד ש"הכתובת היתה על הקיר".

יעקב רימר

ד"ר יעקב רימר | מיסטר ביג ומר דאטה

יועץ בכיר ומרצה בנושאי סייבר, ביג דאטה ומדעים, בעל דוקטורט ממכון ויצמן למדע. עוסק בעשור האחרון במחקר מדעי במקביל לייעוץ לחברות היי-טק ומשרדי ממשלה. בעבר שימש בתפקידים בכירים בהיי-טק ובמשרד ראש הממשלה. מרצה משופשף ומנוסה, שמתמחה בהמחשת נושאי מדע וטכנולוגיה "קשים לעיכול" בגובה העיניים. משלב בכתיבתו והרצאותיו את הניסיון ארוך השנים בתעשיית ההיי-טק ובאקדמיה, יחד עם העברת מסרים ברורה והומור.

הבלוג ינסה להמחיש לקורא המתעניין (וגם הלא-מקצועי) מה כוחם האמיתי של ניתוח נתונים, למידת מכונה או ביג דאטה. מה אפשר (או אי אפשר) לעשות באמצעות שיטות אלו ואיך כל זה נוגע לפרטיות שלנו.

LinkedIn 

Home Page

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker