תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

הקפיצה הטכנולוגית הבאה כבר כאן - וצריך לדבר על זה

לכתבה

מסך המגע היה השינוי הגדול האחרון בתקשורת בין בני אדם למחשבים - אבל האינטראקציה בין בני אדם לטכנולוגיה שסביבם באמצעות דיבור משמעותית וחשובה עוד יותר ■ כדי לממש את הפוטנציאל המלא שלה, הטכנולוגיה דורשת עוד פריצות דרך - וגם פתרון לשאלות שעולות לגבי היחס בין נוחות לפרטיות ■ כתבה ראשונה בסדרה

16תגובות

"אם הטכנולוגיה מתקדמת מספיק — אי־אפשר להבדיל בינה לבין קסם", אמר סופר המדע הבדיוני הבריטי ארתור סי. קלארק. טכנולוגיית מחשוב הקול המתהווה במהירות מוכיחה את טענתו. השימוש בה הוא כמו הטלת כישוף: הגידו כמה מלים לחלל, ומכשיר שנמצא בקרבת מקום ימלא את בקשתכם.

אמזון אקו, מחשב בצורת גליל שפועל באמצעות קול ועונה לשם אלקסה, יכול להשמיע שירים ותחנות רדיו לפי בקשה, לספר בדיחות, לענות על שאלות טריוויה ולשלוט במכשירי חשמל חכמים — והוא נמצא כבר בקרוב ל–5% ממשקי הבית בארה"ב. העוזרים הקוליים משגשגים גם בסמארטפונים: סירי של אפל מגיבה ליותר מ–2 מיליארד פקודות בשבוע, ו–20% מהחיפושים בגוגל בסמארטפונים עם מערכת הפעלה אנדרואיד בארה"ב, מתבצעים בפקודה קולית. הכתבה של מיילים והודעות טקסט היא כיום מהימנה מספיק כדי להיות שימושית. מדוע להקליד כשאתה יכול לדבר?

מדובר בשינוי עצום. עד כמה שזה נראה פשוט, לקול יש את היכולת לשנות מחשוב על ידי הפיכת האינטראקציה לטבעית ככל האפשר. חלונות, אייקונים ותפריטים, ולאחר מכן מסכי מגע, התקבלו בברכה כדרכים אינטואיטיביות יותר להתמודד עם עולם המחשבים האישיים, לעומת השימוש בפקודות מקלדת מורכבות. אבל היכולת לדבר עם מחשב מבטלת למעשה את כל הניסיונות להפוך את "ממשק המשתמש" לפשוט יותר. כפי שטלפונים ניידים היו יותר מטלפונים אלחוטיים, ומכוניות היו יותר מכרכרות ללא סוסים — מחשבים ללא מסכים ומקלדות הם בעלי פוטנציאל להיות שימושיים, זמינים וחזקים יותר מכפי שאנשים יכולים לדמיין כיום.

הופעתו של מסך המגע היתה השינוי הגדול האחרון באופן שבו בני אדם מתקשרים עם מחשבים. הזינוק לדיבור משמעותי אפילו יותר. קול לא יחליף לחלוטין צורות שונות של קלט ופלט. לפעמים יהיה נוח יותר לתקשר עם מחשב בעזרת הקלדה מאשר בדיבור (לפי דיווחים, אמזון עובדת על פיתוח מכשיר אקו עם מסך). אבל החשיבות של הקול באינטראקציה בין בני אדם לטכנולוגיה שסביבם תגדל ותלך — החל ממכונות כביסה שיגידו כמה זמן נותר עד סוף השימוש ועד עוזרים וירטואליים בשירות לקוחות של תאגידים. עם זאת, כדי להגיע לפוטנציאל המלא שלה, הטכנולוגיה דורשת עוד פריצות דרך, ופתרון לשאלות שעולות לגבי היחס בין נוחות לפרטיות.

אינפו טיימליין

אלקסה, מהי למידה עמוקה?

מערכות הכתבה ממוחשבות קיימות כבר שנים. אבל בעבר הן לא היו מהימנות ונדרשו אימון ממושך עד שהצליחו לזהות את קולו של משתמש מסוים. היכולת החדשה של מחשבים, לזהות כמעט כל דיבור, באופן מהימן וללא אימון, היא הדוגמה האחרונה ללמידה העמוקה — בינה מלאכותית שבה מערכת תוכנה לומדת משימוש במיליוני דוגמאות, שבדרך כלל נלקחות מהאינטרנט.

הודות ללמידה עמוקה, יכולות השעתוק של מחשבים כיום משתוות כמעט לאלה של בני אדם, מערכות תרגום ממוחשבות משתפרות במהירות ומערכות שהופכות טקסט לדיבור נהפכות פחות רובוטיות ונשמעות אנושיות יותר. בקיצור, מחשבים הרבה יותר טובים בהתמודדות עם שפה טבעית, בכל מובניה.

אף שלמידה עמוקה משמעותה שמחשבים יוכלו לזהות דיבור באופן מהימן יותר וידברו באופן מאולץ פחות, הם עדיין לא מבינים את המשמעות של שפה. זהו הפן הבעייתי ביותר, וזה שחייבים למצוא לו פתרון — אם מחשוב המונע על ידי קול באמת ימשיך לשגשג.

מחשבים חייבים להיות מסוגלים להבין הקשרים כדי להצליח לקיים שיחה קוהרנטית, ולא סתם לענות לפקודות קוליות פשוטות, כפי שהם עושים כיום. חוקרים באוניברסיטאות ובחברות גדולות וקטנות עובדים על פתרון הבעיה הזאת, בונים "בוטים" שיכולים לנהל שיחות מפורטות יותר על מגוון של משימות, החל משליפת מידע, דרך ייעוץ במשכנתאות ועד סידורי נסיעה. אמזון, למשל, מציעה פרס של מיליון דולר עבור בוט שיכול לנהל שיחה קוהרנטית במשך 20 דקות.

גם לצרכנים ולרגולטורים יש תפקיד בהחלטה כיצד יתפתח מחשוב הקול. אפילו בצורתו הנוכחית, הפרימיטיבית יחסית, הטכנולוגיה מציבה דילמה: מערכות המונעות באמצעות קול מגיעות ליעילות מרבית כשהן מותאמות אישית ומקבלות גישה למקורות מידע כמו יומנים, מיילים ופרטים רגישים נוספים — מה שמעלה חששות בנוגע לפרטיות ואבטחה.

חוקרים באוניברסיטאות ובחברות גדולות וקטנות עובדים על בניית "בוטים" שיכולים לנהל שיחות מפורטות יותר על מגוון של משימות, החל משליפת מידע, דרך ייעוץ במשכנתאות ועד סידורי נסיעה. אמזון, למשל, מציעה פרס של מיליון דולר עבור בוט שיכול לנהל שיחה קוהרנטית במשך 20 דקות

מקרר של LG המשלב טכנונולגיית זיהוי קול של אמזון, שהוצג בתערוכת CES2017
בלומברג

כדי לסבך את העניין אף יותר, המערכות המונעות באמצעות קול נמצאות תמיד בהקשבה, ממתינות להיות מופעלות. יש אנשים שכבר חוששים מפני ההשלכות של מיקרופונים המחוברים לאינטרנט ו"מאזינים" להם בכל חדר ומכל סמארטפון. אבל לא כל קול מפעיל פקודת הקלטה והנעת המכשיר לפעולה —המכשירים מחכים למילת מפתח (למשל "אלקסה", "אוקיי גוגל" או "היי סירי") לפני שהם מתחילים להעביר את קולו של המשתמש לשרתי הענן של החברה, שבאמת מטפלים בבקשה. אבל כשמדובר בשמירה של קובצי קול, לא ברור מי שומר מה ומתי.

המשטרה, למשל, חוקרת מקרה רצח בארקנסו, ארה"ב, שככל הנראה תועד ונשמר על ידי אמזון אקו. רשויות החוק ביקשו מהחברה גישה לכל שמע שאולי נקלט במכשיר, אך אמזון סירבה לשתף פעולה בטענה (שגובתה על ידי שוחרי פרטיות) שהסטטוס החוקי של הבקשה אינו ברור. זהו מצב דומה לסירובה של אפל ב–2016 לעזור ל–FBI לפרוץ למכשיר אייפון של טרוריסט; שני המקרים מדגישים את הצורך בחוקים שמפרטים אילו חדירות לפרטיות מצדיקות את האינטרסים הביטחוניים.

צרכנים יאמצו את השימוש במחשוב קול גם אם הנושאים האלה יישארו בלתי־פתורים. במקרים רבים השימוש בקול הוא הרבה יותר נוח וטבעי מאמצעי תקשורת אחרים. אפשר להשתמש בקול בזמן שעושים דברים אחרים (נוהגים, מתעמלים או הולכים ברחוב). הוא יכול להיות שימושי במיוחד עבור אנשים עם נכויות, או כאלה שאינם יכולים, מסיבה זו או אחרת, להשתמש במסכים ומקלדות. יתרה מכך, לשימוש בקול יכולה להיות השפעה דרמטית לא רק על מחשוב — אלא על השימוש בשפה. מחשוב של תרגום סימולטני יכול להפוך את הצורך לדבר בשפה זרה ללא רלוונטי עבור אנשים רבים; ובעולם שבו מחשבים יכולים לדבר, לשפות שאותן דוברים אנשים מעטים יחסית יש סיכויים גדולים יותר לשרוד.

המחשב עדיין אינו מסוגל לנהל שיחה

מחשבים כיום יכולים לייצר העתק דומה באופן מצמרר של שפה אנושית, אם ייתנו להם את החומרים המתאימים. מה שהם עדיין לא יכולים לעשות זה לנהל שיחה אמיתית. אינטראקציה אמיתית בין אדם למכונה תדרוש הבנה נרחבת של העולם. בהיעדר הבנה זאת, מחשבים אינם יכולים לנהל שיחה על מגוון של תחומים, לעקוב אחרי שיחות ארוכות, או להתמודד עם הפתעות.

עם זאת, מכונות שהוכשרו לעשות מגוון מוגבל של משימות יכולות להגיע לביצועים מרשימים. הדוגמאות הבולטות הן העוזרים הדיגיטליים שיצרו ענקיות הטכנולוגיה. המשתמשים יכולים לשאול אותם שאלות בדרכים שונות: "מה הטמפרטורה בלונדון?", "מה מזג האוויר בחוץ?", או "האם יהיה קר היום?"

העוזרים יודעים כמה דברים על המשתמשים, למשל, היכן הם גרים ומיהם בני המשפחה שלהם, ולכן הם גם יכולים להגיב לבקשות אישיות יותר, כמו "איך נראית הדרך שלי לעבודה היום?", או "שלח הודעת טקסט לבעלי שאהיה עוד רבע שעה בבית".

מתוך הסרט היא

והם גם משתפרים עם הזמן. מיליארדי הבקשות בחודש שמקבלת סירי משמשות גם להמשך הלמידה שלה. לדוגמה, אפל אומרת שסירי מכירה כל דרך אפשרית שבה משתמשים יכולים לשאול על תוצאה בספורט, ויש לה גם תשובה מלבבת לילדים ששואלים על "פיית השיניים". מיקרוסופט למדה מהפלטפורמות הקודמות שלה שעסקו בשפה טבעית שכ–10% מהאינטראקציות האנושיות הן פטפוטי סרק, והיא משתמשת בשיחות אלה כדי ללמד את העוזרת הדיגיטלית שלה, קורטנה. הצוות שכותב לקורטנה כולל שני מחזאים, משורר, תסריטאי וכותב נובלות. גוגל שכרה כותבים מפיקסאר, העוסקת באנימציה ממוחשבת, ומהאתר הסאטירי "דה אוניון" — כדי להפוך את העוזרת החדשה של גוגל למצחיקה יותר. לא פלא שאנשים מודים לעתים קרובות לעוזרים הדיגיטליים שלהם. העוזרים עונים תשובות שונות, למשל "העונג כולו שלי", או "אתה לא צריך להודות לי".

האם המחשב באמת מבין אותי?

כיצד פלטפורמות לשפה טבעית יודעות מה אנשים רוצים? הן לא רק מזהות את המלים שבהם אדם משתמש — הן מפרקות את הדיבור לדקדוק ולמשמעות. ניתוח דקדוקי הוא יחסית תחום מתקדם, מאחר שהוא נכנס תחת שדה המחקר המבוסס של "עיבוד שפה טבעית". אבל משמעות נכנסת תחת הכותרת "הבנה של שפה טבעית" — תחום קשה בהרבה.

ראשית, הניתוח הדקדוקי. מרבית האנשים אינם מצטיינים בניתוח תחבירי של משפטים, אבל מחשבים נהפכו למיומנים בכך — אף שרוב המשפטים הם דו־משמעיים בדרכים שבני אדם אפילו לא שמים לב אליהן. בנוסף, ככל שמשפט מתארך, האפשרויות הנכונות מבחינה דקדוקית — אבל שאין בהן היגיון — גדלות בצורה משמעותית.

כיצד יכול מחשב לדעת מהו הדקדוק הנכון? עוזר לו לדעת שיש צירופי מלים נפוצים יותר מאחרים. כמו כן, יש מבנים נפוצים יותר מאחרים: "שם עצם, פועל, שם עצם, שם עצם", הוא בדרך כל נפוץ יותר מ"שם עצם, שם עצם, פועל, שם עצם". מנתח תחבירי יכול לחשב את ההסתברות הכללית של כל הצירופים ולבחור את זה שמתקבל על הדעת.

כיצד יכול מחשב לדעת מהו הדקדוק הנכון? עוזר לו לדעת שיש צירופי מלים ומבנים תחביריים נפוצים יותר מאחרים. עם זאת, המשמעות עדיין מורכבת יותר מהניתוח התחבירי - מה שמצריך תכנות ידני

הצגת מכשיר גוגל הום
בלומברג

המנתח התחבירי לקסיקאליסט יכול לעשות אף יותר. קחו לדוגמה את הבדיחה של גראוצ'ו מרקס: "בוקר אחד יריתי בפיל בפיג'מה. איך הוא הצליח ללבוש פיג'מה, לעולם לא אדע". המשפט הראשון הוא דו־משמעי, אבל הלקסיקאליסט יכול לזהות שרוב הסיכויים שהדובר של המשפט נמצא בפיג'מה, ולא הפיל.

עם זאת, המשמעות עדיין מורכבת יותר מהניתוח התחבירי. "מי משחק את תור ב'תור'?" — ייתכן שמי שאתה שואל לא יזכור את השחקן האוסטרלי ששיחק את הדמות בסרט של מארוול. אבל כששואלים את האייפון, סירי עונה תשובה בלתי־צפויה: "איני מוצאת סרטים שתואמים את המלה 'תור' ומציגים היום בתור, אייווה, ארה"ב".

תור, אייווה, עם אוכלוסייה של 184 איש, נמצאת במרחק אלפי קילומטרים ממקום השואל, ו"תור" הסרט אינו מוצג בבתי הקולנוע כבר שנים. סירי ניתחה נכונה את השאלה, אבל התשובה היתה חסרת הגיון, והפרה את החוקים של מה שהבלשנים מכנים פרגמטיזם: הידע וההבנה המשותפים שבהם אנשים משתמשים כדי לעשות סדר בבלגן של השפה האנושית. מערכות של שפה טבעית צריכות להיות מתוכנתות ידנית כדי להבין למה אנשים מתכוונים — שזה לא בהכרח מה שהם אומרים.

ישות בעלת אינטליגנציית־על

מתוך הסרט 2001: אודיסאה בחלל

"אני מצטער, דייב. לצערי, איני יכול לבצע את זה", כך משיב בקול שליו ומקפיא המחשב האל 9000 בסרט "2001: אודיסאה בחלל" — כשהוא מותיר את האסטרונאוט דייב באומן מחוץ לחללית. ההחלטה של המחשב שיקפה את החשש האנושי ששרר בסוף שנות ה–60 מאינטליגנציה מלאכותית. באותה שנה, 1968, המחשבה על מחשבים שיכולים לדבר כבני אדם היתה שמורה בעיקר לספרות המדע הבידיוני ולקולנוע, אלא שמאז חלו שינויים טכנולוגיים רבים ואלה לוו בשינוי ביחס של בני האדם לממשק הקול עם המחשב.

דיבור הוא במהותו תכונה אנושית, ולכן קשה לדמיין מכונות שיכולות באמת לשוחח כמו בני אדם בלי לדמיין אותן כישויות בעלת אינטליגנציית־על. ואם הן סופר־אינטיליגנטיות, וללא פגמים אנושיים, קשה לדמיין שהן לא ירצו להשתלט על העולם — לא רק לטובתן שלהן, אלא גם לטובת האנושות. אך אפילו בעולם טוב יחסית, שבו מכונות עושות את כל העבודה, קל לראות כיצד בני האדם ניזוקים כשהם מחוסרי מעש.

אם הוליווד היתה צריכה להפיק כיום סצינה של שיחה בין אסטרונאוט למחשב החללית, סביר להניח שהיא היתה נשמעת יותר כמו:

- מחשב: "אני מצטער דייב, לא הבנתי את השאלה".

סירי

- אסטרונאוט: "האל, תפתח את דלתות המעבורת".

- מחשב: "אני לא בטוח שהבנתי, אבל הנה מה שמצאתי באינטרנט על השוואת מחירים של דלתות למעבורת".

למרבה המזל, על המטלות שמכונות מדברות יכולות לעשות במקום בני אדם, רבים היו שמחים לוותר. מכונות מסוגלות יותר ויותר לבצע מטלות קשות אבל מוגדות היטב. בקרוב, כל מה שהמשתמשים יצטרכו לעשות זה להורות על המשימה בקול, בניסוח רגיל. בעבר, רק בן משפחה אחד ידע כיצד להפעיל את המחשב, או להקליט בווידיאו. אבל אז, ממשקים גרפיים (אייקונים ועכבר) ומסכי מגע הפכו את הטכנולוגיה נגישה לכולם.

פרנק צ'אן מחברת ההון סיכון אנדרסן הורוביץ רואה בממשקים של שפה טבעית בין בני אדם למכונות כצעד נוסף בהפיכת מידע ושירותים נגישים לכולם. עמק הסיליקון, הוא אומר, נהנה מתור הזהב של טכנולוגיות בינה מלאכותית. כמו שבתחילת שנות ה–90 חברות השקיעו באינטרנט ובנו אתרים בלי לדעת בדיוק מדוע, כיום כולם מהמרים על שפה טבעית. עם זאת, הוא מוסיף, "מבחינת קול, אנחנו ב–1994".

אבל 1995 תגיע בקרוב. זה לא אומר שאנשים יתקשרו עם המחשבים שלהם רק באמצעות דיבור. אתרי אינטרנט לא גרמו להפסקת השימוש בטלפון, ומכשירים ניידים לא הפכו את המחשבים הנייחים למיותרים. באותו אופן, אנשים ימשיכו לבחור בין טקסט לקול באינטראקציה עם מחשבים. לא כולם יעדיפו שימוש בקול על פני טקסט. ביפן לדוגמה, לא נהוג לדבר בקול רם בטלפון בציבור, ולכן השימוש בסירי נמוך שם בשעות היום וגבוה בערבים ובסופי שבוע. עבור אחרים, שימוש בטכנולוגיה באמצעות קול היא ברכה של ממש: היא מאפשרת לאנשים עם דיסלקציה לכתוב בלי להקליד, ומקלה על קשישים, שמתקשים לראות את המקשים הקטנים. כמו כן, המשתמשים הצעירים ביותר, שחלקם לומדים כיום להקליד לפני שהם יודעים לכתוב, עשויים בקרוב ללמוד לדבר אל מכונות לפני שילמדו להקליד.

גם אנשים עם פציעות, או נכויות, שמקשות עליהם לכתוב יכולים להרוויח מהטכנולוגיות החדשות. מיקרוסופט מתגאה, ובצדק, במכשירים חדשים שיאפשרו לאנשים עם ALS, מחלה ניוונית קשה, לדבר על ידי בחירת אותיות המופיעות על מסך, באמצעות שימוש בעיניים.

תוכנה חדשה מאפשרת כיום לחוקרים לתעד שפות בסכנת הכחדה באופן מהיר מאי־פעם. וכשיש מספיק מידע, יש גם אפשרות לפתח משאבים — מזיהוי דיבור לממשקים עם תוכנה לשפות שהשימוש בהן מצומצם

ג׳ון רובינסון פירס

ייתכן שאנשים יפנו למחשבים כשירגישו צורך בחברה. שיאואייס של מיקרוסופט, צ'אטבוט שהושק בסין, למד להגיב באופן שיאריך את השיחה ככל האפשר. איש אינו חושב שמדובר בבן אנוש, אבל הוא גורם למשתמשים להיפתח בדרכים מפתיעות. ג'יבו, "רובוט חברתי" חדש, נועד לספר לילדים סיפורים, לעזור לקרובי משפחה רחוקים לשמור על קשר ופעולות דומות נוספות.

קבוצה נוספת שיכולה להרוויח מהטכנולוגיה היא קהילות שדוברות בשפות בעלות תפוצה קטנה יחסית. תקשורת נתונים יכולה לעודד אפקט של "המנצח לוקח הכל": אם יש שפע של תוכנה טובה ותוכן באנגלית ובסינית, שפות פחות משומשות נהפכות פחותות ערך ברשת. לעתים, עצם הישרדותן מוטל בספק. אבל לדברי רוס פרלין, מארגון ברית השפות שבסכנת הכחדה, תוכנה חדשה מאפשרת כיום לחוקרים לתעד שפות כאלה באופן מהיר מאי־פעם. וכשיש מספיק מידע, יש גם אפשרות לפתח משאבים — מזיהוי דיבור לממשקים עם תוכנה לשפות שהשימוש בהן מצומצם.

ענקיות עמק הסיליקון כבר מעניקות את שירותיהן בעשרות שפות; רשתות נוירונים מלאכותיות, ותוכנות אחרות, מאפשרות לייצר גרסאות חדשות מהר יותר וביעילות רבה מבעבר. המאמצים הטכנולוגיים האלה פותחים מגוון עצום של אפשרויות, שבהן תוכנה העוסקת בשפה משפרת את עצמה על ידי תרגול קולו של משתמש יחיד, אוצר המלים שלו, מסמכיו הכתובים והרגליו.

אבל קיימים שני חסמים גדולים לעלייתן של טכנולוגיות השפה הטבעית: אחד מהם הוא השיבוש הצפוי בשוק העבודה והחשש שהמכונות ישתלטו על עוד ועוד מקצועות שבני האדם מתפרנסים מהם. החסם השני הוא החשש מפגיעה בפרטיות המשתמשים. יש יותר ויותר מכשירים שמאזינים לסביבה כל הזמן וברגע שיש מיקרופונים שפתוחים תמיד בכיסי המשתמשים ובבתיהם, מדובר בשחיקה נוספת של מושג הפרטיות המסורתי.

כל השירותים מבוססי המיקום של החברות הגדולות — ואפילו מדי התאוצה בטלפונים שמזהים תזוזות קטנות — משפרים ללא הפסקה את הניחושים שלהם לגבי הצרכים והרצונות של המשתמשים. הרגע שבו סירי, אלקסה, קורטנה, או העוזר של גוגל, יפתיעו משתמש עם משפט כמו "בית המרקחת קרוב, סטיב, האם תרצה לקנות עוד משחה לטחורים?" עשוי להיות הרגע שבו המשתמש ייאלץ לשקול מחדש את יחסי הגומלין בין שירותים חדשים ומדהימים לבין הפרטיות שלו. במקרים אלה, תפקידן של חברות הטכנולוגיה הוא לעזור בכך שייתנו למשתמשים יותר בחירה.

הרשמה לניוזלטר

הירשמו עכשיו: סיכום דו שבועי בנושאי טכנולוגיה והייטק ישירות למייל

ברצוני לקבל ניוזלטרים, מידע שיווקי והטבות


תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות