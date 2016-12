לגוגל יש בעיה קטנה: אחד המוצרים הוותיקים ביותר שלה - ההשלמה האוטומטית של מונחים שמקלידים לתיבת החיפוש (autocomplete) - מעוות מדי פעם את המציאות.

למשל, אם מקלידים Hillary Clinton is - אחת ההשלמות הראשונות שתיבת החיפוש מציעה היא Hillary Clinton is dead (הילרי קלינטון מתה). כמות תוצאות החיפוש שעונות על נוסח החיפוש שגוגל מציעה עצום. בראש הרשימה אפשר למצוא קישורים לעשרות פריטים שעוסקים במותה של המועמדת שהפסידה בבחירות לנשיאות בארה"ב, אף שכולם יודעים שהיא עדיין חיה ובועטת.

אבל זאת לא רק בעיה שקשורה לקלינטון, או לדונלד טראמפ, שהשלמות החיפוש של גוגל מינו אותו לנשיא עוד לפני היבחרו, וכיום הורגות אותו, או מחליטות שהוא בכלל פקיסטאני. אם מקלידים את המלים "Did the holocaust" (האם השואה...), ההצעה הראשונה של מנגנון ההשלמה האוטומטית של גוגל היא ?Did the holocaust really happen (האם השואה באמת התרחשה?). לחיצה על ההצעה הזאת מובילה לקטעי וידיאו וקישורים שמסבירים שהאפיזודה הזאת בחיי העם היהודי מוטלת בספק.

ודווקא דוגמאות אלה הן הבעייתיות פחות, משום שבעניינן האמת ההיסטורית ברורה, וכמות המידע בנושאים האלה ברשת והאיכות שלו ראויים. אבל אלפי שאילתות בנושאים פחות שכיחים עלולות להיפגע מהאלגוריתם שמחולל את ההשלמה האוטומטית. בתקופה שבה מיליארדי אנשים מושפעים ומקבלים החלטות באמצעות מנוע החיפוש הפופולרי בעולם - התקלה הזאת מציפה גם שאלות מוסריות. גוגל, שמודעת לבעיות האלה, מנסה להילחם בתופעה. עד לפני שבועות אחדים כל מי שהתחיל להקליד "האם נשים...", המנגנון הציע לו לחפש ״האם נשים מרושעות?״, ולתחילת המשפט ״האם מוסלמים..." הוצע החיפוש המלא "האם מוסלמים רעים?". כיום האפשרויות האלה אינן קיימות.

הרכיב במנוע החיפוש שאחראי ל"תקלות" האלה הוא אלגוריתם שהגה עובד של גוגל ב-2004. הרעיון שאפשר לנחש או לצפות מראש מה המשתמש רוצה לשאול, עלה במוחו של קווין גיבס בזמן שנסע במיניבוס של גוגל בדרכו מביתו למטה החברה בפאלו אלטו שבעמק הסיליקון. השירות נולד מתוך הבנה שהמשתמשים ישמחו אם מישהו יקצר עבורם תהליכים (גם אם מדובר בחיסכון של הקלדת כמה תווים בודדים), ובהתבסס על המאגר העצום של השאילתות. זה אותו מנגנון שמנחש השלמת כתובות כבר אחרי הקלדת האות הראשונה בשם האתר, ומתבסס על האתרים השכיחים ביותר. פיתוח האלגוריתם והשירותים נעשו באותה תקופה במרכז הפיתוח של גוגל בישראל, בראשות ד"ר יואל מארק ומיקי הרשקוביץ.

ההשלמה האוטומטית לא באמת מנחשת מה הגולש חושב, אלא מסתמכת על היסטוריית החיפושים של הגולש ועל החיפושים הפופולריים של כלל המחפשים בעולם. כלומר, אין מדובר באלגוריתם חדש או כזה שקשה מאוד לבצע בו שינויים והתאמות - וגוגל משתמשת בו גם כדי להעלים, למשל, אתרי סקס. אין שאלה בכלל סביב העובדה שמלים הקשורות בסקס נמצאות בראש טבלאות החיפושים הפופולריים בעולם. עם זאת, בהקלדת אפילו שתי האותיות במלה הקצרה sex, לא עולה כל הצעה שקשורה בתחביב הזה. גם אם מקלידים את כל המלה, מנגנון ההשלמה האוטומטי מציע שאילתות (מהוגנות ונקיות ביותר), שללא ספק אינן באמת החיפושים הפופולריים ביותר עבור המלה sex.

חדשות כוזבות נהפכו לכלי נשק

במשך יותר מעשר שנים שירת מנגנון ההשלמה מיליארדי משתמשים כמעט ללא תלונות. גם כשנשמעה ביקורת, הנימה שלה היתה לרוב משועשעת ואנקדוטלית. אלא שהכל השתנה לפני כמה חודשים עקב תופעה שהתפתחה דווקא בפייסבוק וגררה אחריה ביקורות רועמות ומתוקשרות - בעיית החדשות הכוזבות. אחד מכלי הנשק במאבק של תומכי טראמפ נגד קלינטון בחזית הרשתות החברתיות היה הפצה של חדשות כוזבות במטרה לפגוע במוניטין שלה. מכיוון שהאלגוריתם מבוסס על חיפושים פופולריים, בכל פעם שנפוצה שמועה כוזבת כלשהי בפייסבוק או בטוויטר, מיהרו המתעניינים לחפש את המקור של הידיעה דווקא בגוגל. וכך, עלייה בכמות חיפושים אחר "הילרי מתה", למשל, העלתה את משקל השאילתה באלגוריתם והנציחה אותה בהשלמה האוטומטית - עד היום. פייסבוק, מצדה, אחרי שבועות ארוכים של הכחשה, הודתה שגם האלגוריתם שלה היה אשם בקידום חדשות כוזבות, בדיוק בגלל אותו גורם: הסתמכות אוטומטית על פופולריות של תוכן, גם אם הוא שקרי או מעוות את האמת החדשותית.

האלגוריתמים הם המתכון הסודי שסביבו בנויות הפלטפורמות הגדולות ששולטות בחיינו בלי שנבקש זאת בכלל. זוהי חבילה של פקודות, התניות, הגבלות, תעדוף ודירוג, שאורזת ביעילות פעילות מורכבת שמתרחשת מתחת לפני השטח ביישומים הדיגיטליים. וככל שהבינה המלאכותית והאלגוריתמים שבונים אותה נכנסים עמוק יותר למרקמי החיים, כך גם עוד ועוד טכנולוגים לומדים לשלוט בהם ולבצע עליהם מניפולציות - על אף אווירת הסודיות שאופפת את המבנה שלהם.

הפעם הראשונה שבה נחשף הציבור לאופי החמקמק של האלגוריתמים היתה במנוע החיפוש של גוגל. הסדר שבו מופיעות תוצאות החיפוש הוא תוצר של חישוב סודי שרקחו מייסדי גוגל עוד בהיותם סטודנטים, ולכן הוא רשום, גם כיום, כפטנט ששייך לאוניברסיטת סטנפורד. הסדר של תוצאות החיפוש נקבע על פי שורת תנאים, ובהם גודל האתר, הרלוונטיות שלו לחיפוש, אמינותו, איכות התוכן שבו, מספר הלינקים שמובילים אליו ועוד אלפי סעיפים שלכל אחד משקל משלו ביחס לאחרים.

הדירוג שנקבע על ידי האלגוריתם חורץ את גורלם של אתרים - אלה שמידרדרים ברשימת התוצאות, לעומת אלה שמצליחים לשפר את מיקומם בתור וכך עולים לגדולה. ככל שעלתה חשיבותו של מנוע החיפוש, כך גברה התלות באלגוריתם שלו. על בסיס העמימות שסביבו התפתחה תעשייה שלמה של מומחים שהתיימרו לזהות כיצד פועלת הנוסחה הסודית, ומכרו ללקוחותיהם שיטות לשפר את מעמדם ברשימת התוצאות. אלא שגוגל משנה מדי פעם את הנוסחה, משפרת אותה ומתאימה אותה לרוח הזמן.

הפעם, על פי הערכות המומחים, אנשי גוגל הגדילו ככל הנראה את המשקל של רכיבי הפופולריות של החיפושים, וחשוב מכך - את משקל יחס ההמרה (כמה אנשים לחצו על השאילתה שהמנגנון הציג מתוך כלל האנשים שנחשפו אליה), על חשבון הערך הסגולי של מקורות המידע. בשנותיו הראשונות של השירות, האלגוריתם של גוגל נתן עדיפות ומשקל גדולים למקורות מידע אמינים, כמו אתרי חדשות חשובים, אוניברסיטאות או מוסדות רשמיים. בשנה האחרונה מתרבות האינדיקציות שמשקלם של ספקי המידע בשקלול המלא יורד, ואילו משקל הפופולריות מתחזק.

האלגוריתם שבאמת מבין אותי

מנוע החיפוש של גוגל היה אחד הכלים הראשונים והפופולריים ביותר שבאמצעותם נפגשו המשתמשים לראשונה עם אלגוריתמים בחיי היומיום שלהם. אחריו בנתה גם אמזון מנגנון שנועד למקד את לקוחותיה בקנייה יעילה. הודעות כמו "אנשים שרכשו את המוצר הזה, התעניינו גם במוצרים האלה והאלה", התחילו לבצבץ בעמודי אמזון, והן השתכללו ככל שמאגרי המידע ספגו עוד מידע על הרגלי הקנייה של המשתמשים. כך התפתחה גם התעשייה של שיווק תוכן דיגיטלי בפלטפורמות כמו אאוטבריין וטאבולה, תחת הכותרת "כתבות נוספות שעשויות לעניין אותך". אבל עדיין מדובר בפורמט בסיסי יחסית של תובנות מלאכותיות.

ואז הגיע האלגוריתם הפופולרי מכולם: זה ששולט בניוזפיד האישי בפייסבוק, ומציג את עצמו כדבר הקרוב ביותר להבנת האישיות האמיתית של המשתמש. האלגוריתם של פייסבוק משקלל את הפרמטרים האישיים ביותר, והתוצאה היא רשימה ארוכה של פוסטים, תמונות, קישורים ופרסומות שנבנית על פי הפרטים האישיים שכל משתמש תרם לרשת. אלא שהמשתמשים רואים בפיד שלהם רק את התוצאות שהאלגוריתם בחר עבורם - ולא את כל התוצאות האפשריות. בכך, האלגוריתם מסנן את המציאות ויוצר אג'נדה חדשה, לעתים מעוותת.

בינה מלאכותית משרתת אינספור יישומים - למשל זיהוי תמונה בפייסבוק, זיהוי קול בסירי של אפל או אלקסה של אמזון, ניתוח טקסטים למחקר אקדמי וניתוח התנהגות צרכנים בתחום השיווק. אינטליגנציה מלאכותית עומדת מאחורי הצ'אטבוט שנותן שירות באפליקציות מסרים, או המוח שיקבל את ההחלטה לעבור נתיב במכונית האוטונומית. הבינה המלאכותית כבר מושרשת כל כך עמוק בחיינו - במרחבים הפיזיים ובמרחבים הדיגיטליים - שאנחנו כמעט לא שמים לב לקיומה ולעובדה שהיישומים שלה מלווים אותנו בכל מקום.

האלגוריתמים האלה ושכמותם עומדים בלב המהפכה הבאה בחייהם של אזרחי התרבות הדיגיטלית. אחרי מהפכת המחשב האישי, מהפכת האינטרנט ומהפכת המובייל, הבינה המלאכותית היא המועמדת המבטיחה הבאה לשנות את הרגלי החיים של משתמשי הטכנולוגיה.