ביג דאטה לשלטון: האם ניתן לחזות את תוצאות הבחירות?

שיטות ביג דאטה מתקשות מאוד בחיזוי תוצאות של אירועים ייחודים כדוגמת בחירות ■ בעבר היו מעלים באוב או קוראים בקפה ■ היום יש סקרים ומומחים פוליטיים

יעקב רימר
ד"ר יעקב רימר
כדור בדולח
צילום: Getty Images IL
יעקב רימר
ד"ר יעקב רימר

בתקופת בחירות סוערת זו, עתירת מפצים, פילוגים, מיזוגים ומפלגות גוססות, אני נשאל האם ניתן לחזות את תוצאות הבחירות בשיטות של ביג-דאטה. התשובה במילה אחת היא לא. בשתי מילים – ממש לא. אבל רגע, איך זה שכל יום מתפרסמים עוד ועוד סקרים שמתיימרים לעשות בדיוק את זה?

לכאורה, חיזוי בחירות הינו בעיה מתאימה לתחום הביג-דאטה. יש נתונים רבים של תוצאות אמת ממערכות בחירות קודמות. אפשר לאסוף הרבה נתונים חדשים באמצעות סקרים או איסוף אוטומטי וניתוח טרנדים ברשתות חברתיות וגם בשילוב של ניתוח טקסטים. כלומר, אין שום קושי לאסוף מאגר של ביג-דאטה. ומכאן לכאורה קצרה הדרך לנסות ולהזין את כל הנתונים האלו לשיטות שונות של למידה או סטטיסטיקה ולחזות את תוצאות מערכת הבחירות. לצערנו יש כאלו שעושים את זה. הם מקבלים "תוצאות" ורצים לספר לחברה בתקשורת, מבלי להבין (במקרה הטוב) שמדובר בתוצאות חסרות בסיס.

אז מדוע לא ניתן לחזות תוצאות של בחירות? הרי יש כאמור שפע של נתונים. גם קיימות שיטות לחיזוי שעובדות היטב במקרים רבים. למשל, יש מערכות חיזוי מוצלחות שחוזות איזה ספרים או סרטים יעניינו אותך, על סמך רכישות קודמות. וקיימות דוגמות נוספות לחיזוי מוצלח בתחומים עסקיים מגוונים. העניין הוא שלמרות שהשיטות האלו עובדות היטב במקרים אלו, לחזות תוצאות של בחירות בישראל זה סיפור אחר לגמרי. יש לכך הרבה סיבות ואעמוד רק על חלקן.

כל שיטות החיזוי, ללא יוצא מהכלל, מבוססות על למידה מנתוני עבר. למשל, שיטות חיזוי שמשתמשות בטכניקת סיווג כלשהי, לומדות מדוגמות אמיתיות שהתוצאה עבורן ידועה. במקרה שלנו אפשר לחשוב על נתוני כל המצביעים בקלפיות בעיר מסוימת. אילו היו לנו בישראל רק שתי מפלגות, למשל מפלגת הצמחונים ומפלגת הקרניבורים, אולי אפשר היה להסתמך על דפוסי הצבעה במספר מערכות בחירות קודמות כדי לחזות את התוצאות בבחירות הבאות.

בני גנץצילום: תומר אפלבאום

אבל במדינת ישראל יש הרבה מאוד מפלגות. נכון לסגירת הרישום, 47 (!) במספר. רבות מהן חדשות לגמרי ואין לגביהן שום נתוני עבר. אחרות משתמשות בשמות של מפלגות מהעבר, ללא קשר למפלגה המקורית. יתרה מזו, גם חלק מהמפלגות הוותיקות שינו את פניהן. אם בעקבות פילוגים ואחודים או בשל חילופי מועמדים. ואם לא די בזה, הנושא המרכזי עליו נסובה מערכת בחירות בישראל הוא שונה בכל פעם (ממש לא צמחונים מול קרניבורים). יש גם שיאמרו שארבע שנים במדינת ישראל שקולות לשנות דור במדינה "רגועה" יותר. האם מישהו חושב ברצינות שדפוסי הצבעה בבחירות קודמות מנבאים את הבחירות הנוכחיות?

ומה לגבי סקרים ואיסוף טרנדים מהאינטרנט? גם שני אלו עמוסים בעיות כרימון. למתעניינים, קל למצוא כתבות של אנשי מקצוע שמסבירים היטב מדוע הסקרים של הבחירות הן הבל. אני אסתפק בהצבעה על מספר בעיות שורש. קושי מרכזי בסקרי בחירות הוא היכולת לפלח את האוכלוסייה המאוד הטרוגנית של מדינת ישראל. זהו תנאי הכרחי כדי לבנות מדגם של נסקרים שייצג נאמנה את כל גווני הציבור. מדובר במשימה קשה עד בלתי אפשרית. אם בעבר ניתן היה לבצע ניחוש "מושכל" של אופי אוכלוסייה לפי כתובות מגורים בספר הטלפונים של בזק, היום כידוע זה ממש לא רלוונטי. בנוסף, קיימות אוכלוסיות שאינן מוכנות לשתף פעולה עם סקרים מלכתחילה, בעוד נסקרים רבים (מאוד) סתם מסרבים לענות. וגם אלו שכבר עונים, לפעמים עונים "לא יודע" או משקרים.

בנימין נתניהוצילום: גיל כהן מגן

איסוף מהאינטרנט לוקה בבעיות משלו, כאשר בעיית השורש דומה במהותה. דגימה כזו רלוונטית רק לאוכלוסייה ספציפית מאוד - גולשים שפעילים ברשתות/אתרים שנדגמים. האוכלוסייה הזו רחוקה מאוד מלייצג את כל גווני הציבור בישראל. זה מעט מזכיר לי אנשים שמופתעים מתוצאות הבחירות, מכיוון שלתפיסתם הרוב חושב כמותם. המופתעים צריכים לשאול את עצמם האם חוג המכרים שלהם משקף נאמנה את מצביעי כל המפלגות בישראל.

אל תטעו, סקרים הם כלי מצוין שמבוסס על שיטות מחקר מדעיות. יש סוקרים מקצועיים ואמינים שמבצעים עבודה מצוינת, למשל של סקרים עבור חברות עסקיות. אבל מכלול הפרמטרים והמידע שנדרש כדי לנסות ולנבא תוצאות בבחירות הוא כל כך גדול, עד שלא בכדי נאמר שהנבואה ניתנה לשוטים (או שרלטנים). בעבר היו מעלים באוב או קוראים בקפה. היום יש סקרים ומומחים פוליטיים. שיטות ה"עבודה" אמנם השתנו, אבל איכות התחזיות נותרה בעינה. מה שכמובן לא יפריע להסביר בדיעבד ש"הכתובת היתה על הקיר".

לחצו על הפעמון לעדכונים בנושא:

כתבות מומלצות

מטוס של וויז אייר. החברה הציעה פיצוי של 600 יורו

אל על מובילה בביטולים, המטוס של וויז אייר "קיבל מכת ברק": קיץ כאוטי בנתב"ג

רכבת תחתית בספרד. הקמת המטרו בישראל מוערכת בעלות של 150 מיליארד שקל

מיליארדים מהפקעות קרקע, סמכויות אגרסיביות, ופוליטיקה קטנה: המלחמה על חוק המטרו

סטודנטים באוניברסיטה העברית בירושלים. שיעורי התעסוקה עולים בהתמדה עם העלייה ברמת ההשכלה

איך מטפסים לעשירון השכר העליון — ומי מצא דרך עקיפה כדי להגיע אליו

גמר אקס פקטור. הוחלט שלא תשמש יותר לבחירת הנציג לאירוויזיון

"הכל זה הוא": שורת עזיבות ורייטינג צונח - למה רשת מובסת בקרב מול קשת?

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker

כתבות שאולי פספסתם

כספומט ביטקוין ברומניה. רשתות בלוקצ'יין שיצליחו לשרוד את התקופה הנוכחית - ייתכן שיזכו בכל הקופה

המשבר בקריפטו נכנס לשלב הבא: מלחמת כל בכל

עומסים בנתב"ג

מבחינת חברות התעופה, השאלה אם תגיעו ליעד עם המזוודה היא "בעדיפות אחרונה"