הבעיה של גוגל: צירוף של מספרים לא בהכרח מניב מסקנות נכונות

ניק בילטון מ"ניו יורק טיימס": "אנחנו ממהרים להשתמש בנתונים של גוגל ושוכחים כי מדובר באסופת מספרים שמתעלמת מההקשר"

סוכנויות הידיעות
סוכנויות הידיעות

לפני מספר שנים גוגל יצרה משוואה מפוארת שיכולה לפענח כמה אנשים חולים ברגע מסוים בשפעת. החשבון עבד כך: מיקום האדם יחד עם חיפוש הקשור לשפעת במנוע גוגל בתוספת אלגוריתמים חכמים במיוחד: מספר האנשים בארה"ב החולים בשפעת.

ניק בילטון מספר בבלוג ב"ניו יורק טיימס" כי בעוד לפי נתוני גוגל, בחורף הנוכחי 11% מאוכלוסית ארה"ב היתה חולה בשפעת, ולפי מאמר שפורסם במגזין המדעי Nature, האלגוריתמים של גוגל שגויים והתוצאות כפולות לעומת הנתונים של המרכז האמריקאי לפיקוח על מחלות שמדווח על 6% מהאמריקאים חלו בשפעת.

מנכ"ל גוגל, לארי פייג'צילום: רויטרס

לפי בילטון, ייתכן שהבעיה באלגוריתם של גוגל היא כי הוא מסתכל על מספרים, ולא על תוכן. לא רק אנשים החולים בשפעת בודקים באינטרנט על המחלה אלא גם אנשים שצפו בסיקור הנרחב בתקשורת על העלייה בשיעור החולים.

"בעולם של היום, המידע נמצא בכל מקום. כמעט כל דבר שאנחנו נוגעים בו הוא חלק מקבוצת נתונים רחבה. אבל האנשים שמנתחים את המידע הזה נכשלים לפעמים בצירוף חומר רקע ותנאים חיצוניים ומתעסקים רק במספרים", כותב בילטון.

בילטון מוסיף חוויה דומה שהתרחשה כאשר לימד באוניברסיטת ניו יורק ב-2010. בשיעור של סטודנטים לתואר שני בתקשורת ניסתה הכיתה לערוך ניסוי שיקבע האם אפשר להשתמש בחיישנים כך שיאספו מידע ויספרו סיפור. בניסוי שנערך מוקמו חיישנים בבניין באוניברסיטה בכדי לקבוע האם סטודנטים משתמשים יותר במדרגות או במעלית, וזאת על ידי בדיקת כמות הפעמים שמודלק האור במדרגות.

לפי תוצאות הניסוי, סטודנטים השתמשו במעליות בשעות הבוקר, כנראה כי עוד היו עייפים מהלילה, ובלילות עברו לשימוש במדרגות. בשיחה אקראית עם אחד מעובדי האבטחה, גילה בילטון כי הסיבה האמיתית לתוצאות היתה כי אחת המעליות היתה מקולקלת במספר ערבים באותה התקופה, ולכן לסטודנטים לא היתה ברירה אלא לצעוד במדרגות.

תגיות:

תגובות

הזינו שם שיוצג כמחבר התגובה
בשליחת תגובה זו הנני מצהיר שהינני מסכים/ה עם תנאי השימוש של אתר הארץ