"בסוף הדרך המחשבים יוכלו לנתח כל מצב כמעט כמו בני האדם: מי כועס, מי עצוב ומי צריך עזרה" - Markerweek - TheMarker
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

"בסוף הדרך המחשבים יוכלו לנתח כל מצב כמעט כמו בני האדם: מי כועס, מי עצוב ומי צריך עזרה"

פרופ' שמעון אולמן מסביר מה עומד מאחורי המחקר פורץ הדרך שלו על תבונה ממוחשבת, שזיכה אותו בפרס ישראל לחקר המתמטיקה ומדעי המחשב

6תגובות

כבר תקופה ארוכה שגוגל עסוקה במבחני דרך למכונית האוטונומית שהיא מאמינה כי תכבוש את העולם. בניסויים האלה מתמודדת החברה עם בעיות שטמונות ב"חוסר האנושיות" של כלי הרכב, שאמור להסתדר בכבישים בלי נהג. המכונית האוטונומית מתקשה לתפקד בסיטואציות שבהן היא צריכה להתמודד עם הנהגים האנושיים שמולה. מכונית כזו שניצבת בכניסה לצומת וצריכה להביט בנהג שמולה ולהבין ממבט עיניו ותנועותיו אם הוא עומד לתת לה להיכנס לצומת לפניו או לא - לא יודעת כיצד לפעול. אחד האנשים שהמודלים שלו ניצבים בבסיס יכולותיה של המכונית הזאת כפי שהיא מתפקדת כיום, ושמנסה בימים אלה להתמודד גם עם בעיות חוסר האנושיות הוא פרופ' שמעון אולמן, שהמחקרים פורצי הדרך שלו בתחום העניקו לו את פרס ישראל בתחום חקר המתמטיקה ומדעי המחשב ביום העצמאות האחרון.

"ההבנה של מה קורה סביבנו בעולם מורכבת מאלפי דקויות, שהפענוח שלהן גורם לכך שבן אדם שרואה תמונה מבין עליה מיד פרטים, למשל, באיזו עונה של השנה היא צולמה, מבלי שהוא שם לב לדרך שבה הוא הבין את זה", מסביר אולמן. "כשעוסקים בהבנת תמונה בעולם הראייה הממוחשבת, מבינים איזה עושר גדול של אינפורמציה משמעותית טמון בכל תמונה שאנו רואים. לדוגמה, אדם שמסתכל על אדם אחר שעומד על שפת המדרכה מבין מיד אם הוא עומד לחצות עכשיו את הכביש - או שיש לו דברים אחרים בראש כרגע. כך שמכונת ראייה שהיא חלק ממכונית אוטומטית כמעט וצריכה להבין את הפסיכולוגיה האנושית כמו שבני אדם מבינים אותה. לא רק להבין מה בני אדם עושים עכשיו, אלא גם מה הם עומדים לעשות".

אייל טואג

איפה היית ממקם כיום את המרוץ המדעי בעל ההשלכות העסקיות הגדולות ביותר?

"בתחום הראייה הממוחשבת, גם בתעשייה וגם באקדמיה, קיים ספקטרום שמתפרש מרמה נמוכה של ראייה ממוחשבת בצד אחד - הרמה הראשונית שאליה משתייך תחום עיבוד התמונה שעוסק בפרמטרים כמו חידוד תמונה ודחיסת תמונה, ובצד השני, הרמה הגבוהה של הבנת תמונה ברמה הקוגנטיבית. והרמה הזאת היא החיבור המשמעותי לעולם המחקר שלנו כיום".

למה הכוונה ב"הבנת תמונה ברמה הקוגנטיבית"?

"מכונת ראייה שפועלת ברמה גבוהה של הבנת תמונה היא מכונה, שלדוגמה, מציצה לחדר שבו אנו יושבים ואומרת 'יש פה כמה אנשים שיושבים ומשוחחים', ואולי אפילו מזהה שיש פה מישהו שמראיין מישהו אחר, כי אחד יושב וכותב והשני מדבר".

למחקר של אולמן יש משמעויות עסקיות גדולות. כל מי שמחזיק בביתו שואב אבק רובוטי, שמכוון את עצמו לעבר הלכלוך, יכול להעיד על כך, אך שכששואלים את אולמן על "איירובוט" ודומיו הוא אומר כי "דווקא הרובוטים האלה לא מתחברים למודלים שלי. מדובר אמנם ב'טור דה פורס' טכנולוגי, מכשיר זול שלא נתקע בקירות, אבל הבסיס הטכנולוגי שלו פשוט יותר. במכונות מתקדמות, כמו של חברות שמנסות לייצר רובוט שהוא קצת יותר אנושי עם רמה קוגנטיבית גבוהה יותר ובעל תפקודים גמישים יותר - שם המודלים שלי מתחילים להיות משמעותיים. ויש כיום רובוטים שמתחילים להיות מרשימים בתחומים האלה, עם יכולות מתוחכמות ברמת האלגוריתמים של מדעי המחשב שמשתמשים בהם לייצורן. אלה רובוטים שכבר מתחילים להיכנס לחיים האמיתיים ויכולים לשנות קצת את העולם שבו אנחנו חיים".

נראה שאתה הופך את המחשב לאיש קטן.

"זה תחום מדעי שנמצא על הגבול שבין קוגניציה אנושית למדעי המחשב, שמאוד סיקרן אותי לאורך השנים. כדי להבין כיום מה קורה בתמונה אתה צריך להבין מה יש לאנשים בראש. בני אדם התפתחו כך שהם מסוגלים להוציא מתמונה את האינפורמציה הרלוונטית מהר מאוד. גם ילדים קטנים ותינוקות מוציאים כל הזמן אינפורמציה רלוונטית מתמונות. כשמישהו מזיז את היד לכיוון מסוים, תינוקות יזיזו את העין שלהם אל היעד שאליו היד שלו מכוונת. המנגנונים האלה מעניינים לא רק ברמה של הבנה קוגנטיבית, אלא גם איך ניתן לבנות אלגוריתם שיחקה אותם".

אילו יישומים מעשיים יש כיום ליכולת לפתח אלגוריתמים כאלה?

"כיום, כשעושים ברשת חיפוש של תמונות רלוונטיות לנושא מסוים, בגוגל למשל, רוב החיפוש של התמונות הוא על סמך טקסט. במאגרי התמונות הממוחשבים יש טקסט שמוצמד לתמונה. למשל 'מסיבת צהרים אצלי בגינה'. או 'הלכנו לגן חיות'. ומהתיאור יודעים במנוע החיפוש מה יש בתמונה. אחר כך, כשמישהו יחפש 'אנשים בגן החיות' — יחפשו על סמך הטקסט הזה. במקרה הזה, היעד המחקרי כיום הוא להבין מה יש בתמונה בלי להיעזר במה שרשום בטקסט הנלווה".

אייל טואג

אתה מתכוון להפסיק להסתמך על תיוג?

"כן. ובמקום זה להתבסס על היכולת של המחשב לחקות את הפענוח של מי שמסתכל על התמונה. זה תקף לעוד מישורים. אם, למשל, אתה רוצה ליצור מערכת שתעזור לכבדי ראייה להתנהל בעולם. במשך הרבה שנים הדגש של המחקר בתחום הזה היה לספק לעיוורים תחליף סנסורי לראייה, כמו מצלמה שתקלוט את המציאות ותתרגם את תמונת האור למשטח משנה צורה - שהעיוור יוכל למשש אותו, ובעזרת חוש המישוש לקבל תחליף סנסורי לחוש הראייה.

"עם השנים התברר שאין תחליף לעיניים ולחלקים במוח שמנתחים את התמונה. אם אדם עיוור נכנס ללובי של בית מלון, מקל הנחייה לא יודע לומר לו לאן ללכת. כיום המטרה היא להגיע למצב שבו לאדם עיוור יהיה מכשיר מזהה תמונה שיאמר לו 'פקיד הקבלה יושב כאן, השירותים שם, ואם אתה רוצה לעלות לחדר - המעלית פה'. או, 'זה חדר מגורים ויושבים בו שלושה אנשים על הספה'".

הכוונה היא לרובוט שהוא מדריך נייד.

"כן. מדריך שקולט את משמעות הדברים, שיודע מה חשוב לאדם בחדר. מה יכול לעניין אדם שנכנס ללובי של בית מלון. העולם הולך לכיוון של הבנה אוטומטית של תמונות. זה בולט בנהיגה אוטומטית, תחום שבו מה שנחשב בלתי אפשרי לפני חמש שנים, כיום הוא ישים".

רויטרס

מה עם אפליקציית זיהוי פרצופים לדוגמה? כזו שתעזור לנו לזהות בחדר שאנחנו נכנסים אליו מהיכן מוכרות לנו כל מיני דמויות?

"זיהוי פרצופים הוא דבר קשה, אבל יש כיום אלגוריתמים ממוחשבים שיכולים לעשות אותו בצורה טובה מאוד. מעניין להשוות בתחום הזה מכונות לבני אדם. כיום, כשאתה נכנס לארה"ב יש מכונות שמצלמות אנשים ומחפשות אותם במאגר הנתונים שלהן באופן אוטומטי. עם השנים, יותר ויותר סומכים על מערכות ממוחשבות שיעשו את זה בהצלחה ברמה גבוהה יותר מבני אדם. כשמדובר במכשיר שיוכל לזהות עבורך פרצופים שהכרת במהלך חייך, או סתם אנשים מפורסמים - זה כבר נוגע בשאלות של פרטיות. אפשרי כיום לייצר תוכנה שתשתמש במצלמה הקטנה בטלפון שלך כדי לומר לך אם אתה מכיר את מי שאתה מסתכל עליו ומאיפה. אבל יש תמיד מרחק בין מה שאפשרי למה שעושים בפועל".

לאן הולך התחום הראייה הממוחשבת? אילו תחומים מחקריים מעסיקים אותך כיום?

"הדברים נהפכים מתוחכמים יותר. כיום מתחילים להגיע לרמה שבה מחשבים מבינים אם אנשים כועסים. למדנו לזהות מאפיינים, כך שמסתבר שאם מישהו כועס יש ייחוד להבעת הפנים ותנוחת הגוף שלו. לפעמים אלה מאפיינים קטנים - אנשים הרי מסתכלים על תמונה של שני אנשים ויכולים לומר מי הבוס ומי המועסק. הם מזהים מי קצת כפוף מול השני, מי מסתכל ישר בעיניים ומי משפיל אותן. אלה רמזים שאנחנו מלמדים את המחשב להוציא".

מה השימושים של יכולות כאלה למחשבים?

"מעניין קודם כל לדעת איך אנשים עושים את זה. יש משהו מעניין ביכולת שלנו להסתובב בעולם בלי הדרכה ולהוציא אינפורמציה. אם אתה רוצה לבנות מכונות אינטליגנטיות, אתה צריך לרצות מראש שהן יוכלו להבין את הדברים עד הסוף. כשמדובר במכונות כאלה הייתי רוצה לראות מכונות אנושיות יותר, עם יכולת תהליכי למידה כלליים. למכונות אינטליגנטיות יהיו בסוף הרבה שימושים, אם זה רובוט שיעזור לנו בבית חולים ואם זה המכוניות שנוסעות לבד ברחוב - שלפי מה שאני שומע הבעיות שבהן הן נתקלות כיום נוגעות לתהליכים מאוד אנושיים. הן יכולות לשפוט מרחק מהמדרכה, אבל כשאתה מנסה להיכנס לצומת ולהבין אם הנהג שבא ממול נותן לך לעבור, מדובר באינטראקציה אנושית מורכבת. מערכת אמיתית שתנהג לבד צריכה את היכולת להבין למה האדם שממול מתכוון - להאט ולתת לך לעבור, או להאיץ".

יש כיום דברים שהמדע עשוי להשיג שלפני 20 שנה חשבת שאין סיכוי שיגיעו אליהם? איך השתנו היעדים בתחומים שלך בשנים האחרונות?

"כשהגעתי ל–MIT היו חוקרים שהציעו לסוכנות שמממנת מחקרים חדשניים בארה"ב לייצר רובוט שישחק פינג פונג נגד בני אדם, והקצו לעצמם כמה חודשים להגיע לזה. זה היה לפני 50 שנה, וכיום אין עדיין רובוט שיכול לשחק פינג פונג. יש את בעיית הראייה ויש את השליטה על הזרוע - בשני הדברים האלה יש התקדמות, אבל לא הגענו ליכולת ליצור משהו שעושה את זה. היה חוסר הערכה דרמטי של רמת הסיבוך של החישוביות בתחומים האלה. המוח התפתח והתרגל כל כך לעשות דברים ביעילות שאנחנו כבני אדם יושבים בקומה עליונה ברמה המודעת שלנו ולא מודעים לקומות התחתונות שבהן כל המחשבים האנושיים טוחנים מידע".

יש לי ילד שקורא ספרים של סופר המדע הבדיוני אסימוב ושואל מתי יהיה רובוט אנושי אמיתי. ויתרנו כבר על השאיפה הזאת?

"יש תכונות הנדסיות שהאבולוציה פתרה מצוין ואנחנו לא יודעים לייצר במחשב. בטבע, תיש שנולד מהסס כמה שעות - ומתחיל לדלג לו בהרים. אצל רובוט זה מורכב יותר. יש חברות רובוטיקה מתקדמות שמנסות לבנות רובוטים עם ידיים גמישות גם לצרכים תעשייתיים. הרובוטים שנמצאים כיום במפעלים של חברות כמו טויוטה יודעים לכופף את הגג של הרכב בצורה מסוימת מהר מאוד. אבל במפעל קטן אתה יום אחד צריך לגזור משהו לצורכי תפירה, וביום אחר לעשות משהו שונה. בארה"ב יש כיום תחרות לבניית רובוט שייראה כמו אדם, וינהג במכונות - לא שהוא יהיה מחשב שמורכב במכונית אלא רובוט שיודע לפתוח את דלת הרכב, להיכנס למכונית, להתיישב, לכוון את מושב הנהג ולשים ידיים על ההגה".

מה המטרה?

"לראות איך דוחפים את תחום הרובוטיקה קדימה"

אני מניח שחיקוי אנושי יכול לסייע לנכים, למשל.

"אפשר לשאוף לפתח רובוטים שיסתובבו בבית של אנשים מבוגרים ויעזרו להם לא ליפול במדרגות ולהגיע לשירותים. כאן כבר יש ממד של פסיכולוגיה אנושית. מבחינות מסוימות אדם מבוגר שלא מחובר לטכנולוגיה יתחבר יותר לעוזר דמוי אדם מאשר לעגלה עם ארבעה גלגלים. היתה תנועת מטוטלת בתחום הזה. בהתחלה אמרו 'בואו נבנה רובוט כזה'. אחר כך אמרו 'זה כל כך מסובך שזה לא יקרה גם בעוד 30 שנה', ועכשיו יש עוד פעם תחושה של 'התקדמנו כל כך - בוא ננסה שוב'. יש כיום תחושה שאנחנו בתחילת עידן המכונות האינטליגנטיות. ההרגשה היא שעכשיו זה קרוב יותר מאי־פעם".

alex.ch

חלק מ"המאפיה הירושלמית"

באמצע הראיון, בניסיון לערער מעט את שלוות הנפש של אולמן, אנו שואלים אם הוא התרגש והופתע כשקיבל את ההודעה על כך שזכה בתואר חתן פרס ישראל בתחום חקר המתמטיקה ומדעי המחשב ביום העצמאות האחרון. אולמן מחייך אבל מתעקש שלא לחלוק את רגשותיו: "בוודאי שהופתעתי. אתה לא יודע שתזכה". מי שמתנדב להרחיב הוא אשר לוי, מנכ"ל חברת אורבוטק שיושב עמנו במשרדי החברה: "פרופ' אולמן קיבל את הפרס בין היתר על תרומתו לחקר מדעי המחשב וקידום תעשיית ההיי־טק בישראל. כשהוא נבחר הוא שלח לי מייל והזמין אותי לטקס, ואמר שאין להפריד בין אורבוטק לכך שהוא קיבל את הפרס. זה היה מאוד מרגש והביא הרבה גאווה לכולנו. מה שהיה מצחיק זה שישבנו בקהל וראינו אותו ניגש לקבל את התעודה מראש הממשלה. הוא נעצר לידו, דיבר איתו, ונוצר תור של אנשים מאחוריו. אחר כך הוא הגיע לנשיא, ראובן ריבלין, וגם מולו נעצר, עמד ודיבר יותר מכולם. בסוף הוא עבר לנשיאת בית המשפט העליון, וגם כן - הוא היחיד מבין הזוכים שקיבל ממנה נשיקה".

אתה מכיר את נשיאת בית המשפט העליון?

אולמן: "יצא לנו להכיר".

לוי: "זו המאפיה הירושלמית. כולם מכירים את כולם".

ואת הנשיא?

אולמן: "עם הנשיא היה רגע מרגש. כשהגעתי אליו הוא שאל אם אני הבן של הרופא אולמן. אבא שלו, שהיה חוקר קוראן וערבית, היה חולה כליות. ואבי, שהיה רופא בהדסה, היה נפרולוג. הוא טיפל באביו של ריבלין, והיה משמעותי מאוד ביכולתו של אבא של ריבלין להמשיך בחייו ולהמשיך לעבוד גם כשהיה חולה, ונוצר ביניהם קשר. רובי הכיר אותו כרופא הירושלמי. ואז כשהוא לחץ לי את היד על הבמה, הוא נורא התרגש".

ומה עם נתניהו?

אולמן: "אנחנו מכרים ותיקים. עברנו הרפתקאות ביחד. היכרנו כששנינו למדנו באוניברסיטת MIT. בין היתר, כשפרצה מלחמת יום כיפור מיהרנו מאוד לחזור, נסענו לניו יורק והיינו שנינו יחד על המטוס שיצא בשבת והחזיר אותנו ארצה מארה"ב למלחמה".

גם כיום היית חוזר בטיסה בהולה כזו? נגיד למבצע צוק איתן?

"אם היתה סכנה למדינת ישראל הייתי חוזר".

אולמן נולד ב-1948 בירושלים, למד בתיכון גימנסיה רחביה שבעיר, וב-1967 התגייס לחיל האוויר וסיים קורס טיס כטייס קרב. את התואר הראשון שלו השלים באוניברסיטה העברית במתמטיקה, פיזיקה וביולוגיה, ומכאן המשיך במסלול ישיר לדוקטורט באוניברסיטת MIT שבבוסטון, במעבדה לאינטליגנציה מלאכותית במחלקה למדעי המחשב. במסגרת הדוקטורט פיתח מודל חישובי של ראיית תנועה של עצמים וראייה תלת־ממדית מבוססת על תנועה. הוא גם עסק בדרך שבה אנו מזהים עצמים על ידי חלוקה של תמונה לכמה שברי תמונה שמאפשרים לנו לסווג. במקביל לקריירה האקדמית כפרופסור בבוסטון, הוא הקים בתחילת שנות ה–80, יחד עם קובי ריכטר, צבי לפידות ועמי כספי את חברת אורבוט - שהיא הבסיס של חברת אורבוטק. עד היום אולמן חבר דירקטוריון באורבוטק, ששוויה הבורסאי כיום הוא כ-600 מיליון דולר. אולמן החזיק במקור ב-5% ממניות החברה, ומכר את מרבית אחזקותיו לאורך השנים. במקביל שימש כמדען הראשי של אורבוטק ושל אפלייד מטיריאלס ישראל.

בשנות ה-80 התחיל לחלק את זמנו בין מכון ויצמן לבין מכון MIT, עד שבשנות ה–90 ויתר על המשרה בבוסטון ועבר לבלות את כל זמנו ברחובות. בפרס ישראל הוא זכה בגין מה שהוגדר כתרומות מרחיקות לכת בבינה מלאכותית וקוגניציה בכלל, ובתחום הראייה הממוחשבת בפרט, וכן על תרומתו המשמעותית לפיתוח התעשייה עתירת הידע בישראל.

כשמדברים על תרגום המחקרים לפוטנציאל כלכלי, נראה כי השדה הטבעי הוא שוק הרכב. שם נמצא הפוטנציאל הכלכלי הגדול כיום של ראייה ממוחשבת, אם כי אין עדיין ביטוי לזה בפועל. "צוואר הבקבוק בתחום הזה כבר נמצא על הגבול שבין יכולת טכנולוגית לרגולציה", אומר אולמן. "כבר כיום אתה יכול להיכנס למכונית כזאת בהרצליה ולנסוע אתה לירושלים. השאלה אם זה מספיק טוב כדי לתת מחר בבוקר למכוניות האלה לנסוע לבד היא יותר רגולטורית. אם היית שואל לפני חמש שנים על התחום הזה, היו אומרים לך שזה חלום רחוק. כיום אנחנו כבר קרובים מאוד לפתרונות מעשיים בתחום. אני מעריך שבעתיד הקרוב אפשר יהיה לתת למכוניות עם פונקציית נהיגה אוטומטית לעשות לבד הרבה דברים". אולמן היה המנחה של אמנון שעשוע, מייסד חברת מובילאיי המפתחת מערכות נהיגה אוטונומיות, בתואר השני שלו. שעשוע הסביר בעבר שמחקריו של אולמן הם שדחפו אותו להיכנס לתחום.

מה עם המעבר מנהיגה אוטומטית בכביש לטיסה אוטומטית בשמים? במלחמת ההתשה המטוס שלך נפגע בתקיפה למצרים ונאלצת לנחות בסיני. מטוס מונחה בראייה ממוחשבת היה יכול לבצע את זה?

אז אולי לא, אבל כיום כנראה שכן. מעבר לטייסים אוטומטיים סטנדרטיים שמשייטים בגובה קיימים כבר הרבה שנים. יש כיום הרבה אוטומטיזציה שנכנסת לטיסה. לפני שנה, בראשונה, מטוס ניסיוני ללא טייס של ארה"ב, בגודל של F16, המריא ונחת על נושאת מטוסים שמשייטת בים מבלי שיהיה טייס בפנים, וביצע נחיתה קרובה למושלמת. זאת משימה שנחשבת לאתגר גדול מאוד גם לטייסים בשר ודם, שכן היא כוללת - מעבר לכל התגובות המהירות שצריך להציג כדי לבצע נחיתה בתנאים של מסלול קיים שלא זז - גם הרבה תגובות מהירות למצבים משתנים שנובעים מזה שמדובר בנושאת מטוסים. כך שהטכנולגיה היא שם.

"מהבחינה הזאת צריך להבין שאנחנו דווקא הרבה יותר רחוקים ביכולת הראייה הממוחשבת כשמדובר בנושאים שנוגעים להבנת תמונה של אדם ממוצע לגמרי שאינו טייס קרב. ברמה הזאת יש דברים שילד בן 10 עושה במחשב, והם הרבה יותר קשים למחשב מלהנחית מטוס על נושאת מטוסים".

באילו שימושים מסחריים מפתיעים נתקלת שמעורבים בהם מודלים שבנית במחקר שלך?

"יש סטארט־אפ אחד של סטודנט מאוד מוכשר מהמכון, שבו מתמצתים לך סרטוני וידיאו שצילמת בטלפון או במצלמה. לא כולנו מומחים בצילום, וכיום, כשאתה מצלם, למשל, את יום ההולדת של הילד, חלק מהזמן התמונה תהיה קופצנית, ובהרבה מקרים יהיו קטעים ארוכים של אותו דבר. אפשר לשבת על הסרטים האלה עם תוכנות עריכה, אבל התוכנה שפותחה עושה את זה אוטומטית. היא לוקחת את החומרים שצילמת ויכולה לתמצת אותם לסרטון קצרצר של חמש שניות, דקה או חצי דקה לפי רצונך. והיא יודעת מה מעניין אנשים, אילו חלקים של הסרטון נראים אותו הדבר, אילו חלקים קופצניים ולא ראויים. מי האנשים המעניינים יותר מבחינתך - והיא מוציאה לך בסופו של דבר כמוצר סרטון גמור.

"יש לזה ביקוש והצלחה גדולה. לא כל כך פשוט לגרום למחשב לייצר סרט תמציתי שקולע למטרה ולטעם של אנשים. זו דוגמה לשימוש מפתיע במודלים של ראייה ממוחשבת. לא כל שלושה מתכנתים יכולים להתכנס ולבנות תוכנה כזאת. זה מחייב תחכום. מהבחינה הזאת, תחום הראייה הממוחשבת הוא תחום מעניין שמתאים לישראל, כי זה תחום שמנסה להבין מודלים קוגנטיביים מתוחכמים וליישם אותם במחשב. זה שונה מתחומים - שאני לא מזלזל בהם - כמו ייצור מסך עם יותר פיקסלים. זה תחום שלפחות עד היום, לישראל היתה בו הצלחה יחסית בהקמת סטארט-אפים שמשיגים תוצאות טובות יותר או זולות יותר. יש דברים שמצטיינים בהם יותר בישראל, ויש דברים שלא. חברות כמו סמסונג, LG ויונדאי, שהוקמו בקוריאה, אין פה. אבל יש כאן התמחויות ייחודיות שאין במקומות אחרים".

היית מדען ראשי באורבוטק הישראלית אבל גם באפלייד מטיריאלס האמריקאית. הרגשת את הבדלי התרבויות?

"במקרה הזה, אפלייד מטיריאלס ישראל היתה זרוע ישראלית שלא הורגשה בה תרבות אמריקאית. אבל ביקרתי בקוריאה לדוגמה, וזה כל כך שונה מפה. ההבדלים עצומים. מרשים לראות שם חברות שהן 'ממותות', עם פרויקטים שמעסיקים אלפי אנשים, שכולם תורמים את חלקם. זה משהו הרבה יותר מתועש ומתוכנן יחסית לסטארט־אפ ישראלי של שלושה אנשים. הדבר הנכון מבחינתנו הוא לנסות להמשיך לנצל הדברים שאנחנו הוכחנו עד עכשיו שישראל עשתה יפה, אבל להבין שיש דברים שחסרים לנו".

אילו דברים חסרים?

"אי אפשר להמשיך לחיות רק על רעיונות ויצירתיות. זה חלק נהדר מהתעשייה, אבל לא מספיק. אורבוטק היא דוגמה טובה למה שאפשר לעשות. כי היא לא חברת ענק - אבל בדברים שהיא עושה זאת חברה בולטת לטובה - גם ברמה הטכנולוגית וגם ביכולת הביצוע שלה. זאת חברה שעושה גם חומרה וגם תוכנה. גם אופטיקה וגם הנדסת מכונות. וכל זה בחברה לא גדולה במונחים בינלאומיים. אלה דברים שאי־אפשר להשיג בלי היכולת להיות מאורגן ומסודר, וזה בא לידי ביטוי עכשיו, כשהם מגייסים סטודנטים (על תוכנית הגיוס החדשה של אורבוטק ראה תיבה) - אתה רואה שיש בחברה ועדה שיושבת וחושבת מה הקריטריונים שעל פיהם צריך לגייס. מראיינת ומדרגת. יש משהו נכון בגישה הזאת של אם אני רוצה לעשות את X - אני עושה את X הכי טוב שאפשר".

לפני יותר משני עשורים חזרת לישראל תוך ויתור על קריירה ב-MIT. זאת החלטה שהיית חוזר עליה גם היום?

"הייתי לא מעט ב-MIT. תמיד היה לי ברור שבסופו של דבר ארצה לחזור לישראל, מסיבות אישיות של הגדרה של המקום שארצה לחיות בו. זה התחזק גם כשהיו לי ילדים קטנים. ידעתי שאני רוצה שהם יגדלו פה. ישראל נראתה לי מקום נכון לחיות בו".

באיזה מובן?

"ברמה האישית - כי המשפחה היתה פה. ברמת סגנון החיים, ברמת יחסי האנוש. היו הרבה דברים שנראו טובים יותר בישראל, וגם ברמה של קבוצת השתייכות וחברה גדולה יותר שאני מרגיש חלק ממנה. ישראל היא קבוצת השתייכות שאני חלק ממנה ואני לא בהכרח חלק מהקבוצה במקומות אחרים. לא שהכל פה בסדר, ולא שבארה"ב הכל לא בסדר. והיתה גם ראייה כללית יותר: אני מאמין שזה היה דבר נכון להקים פה את המדינה שהקימו פה".

כך נלמד את המחשב לזהות פיל

הניסיון להבין עבור אילו פריצות דרך זכה אולמן בפרס ישראל אינו פשוט עבור הקורא מן השורה. מדובר באלגוריתמים שעומדים בבסיס פעילותם של מחשבים שלא ניתן להבין ללא השכלה מתמטית רלוונטית. כשמבקשים מאולמן להסביר זאת, הוא מבהיר כי החלק הראשון שבגינו זכה להערכה הזאת קשור לתרומת מחקריו ליכולת הממוחשבת לראייה תלת-ממדית.

"בעולם הראייה נושא התלת־ממד העסיק גם מדענים וגם אמנים כמו ליאונרדו דה וינצ'י כבר מאות שנים - כי תמונה בבסיסה היא דבר שטוח. את האמנים הטרידה השאלה איך לשים על הבד משהו שיעביר תמונה תלת-ממדית, אבל גם הרשתית של העין שלנו היא אחרי הכל משטח דו־ממדי, ובכל זאת אנו רואים בשלושה ממדים - והעולם התלת־ממדי מאורגן אצל כולנו בצורה מדויקת. כשמנסים להבין איך המוח מקבל תמונה תלת־ממדית אפשר לחשוב במונחים ביולוגיים של נוירונים שמעבירים את המידע, או במונחי אלגוריתמים. את התרגום של תמונה דו־ממדית לעולם תלת־ממדי המוח עושה בכל מיני שיטות. אחת מהן היא הסתמכות על ראייה בשתי עיניים.

"המוח מסתכל על כל סצנה משתי זוויות שונות של שתי העיניים, ומההבדלים הקטנים אפשר להוציא נוסחה שמגדירה את העומק של התמונה. אבל מצד שני - כשאדם עוצם עין אחת - העולם לא הופך לדו־ממדי מיד. לאנשים בעלי עין אחת יש בעיות, לפעמים עם נהיגה ולפעמים עם מזיגת יין, אבל הם כן מקבלים תמונה של המציאות. כך שיש עוד דרכים לקבל תמונת תלת-ממד. עוד דרך היא באמצעות תנועה של עצמים. בתמונה סטטית אין אינפורמציה של עומק, אבל כשגוף מסתובב יש בתמונה שינויים שמהם ניתן להסיק מה הצורה התלת־ממדית של הגוף.

"המוח מסוגל לקחת את השינויים האלה ולומר שהם נולדו מגוף שנשאר קבוע במרחב. כשאתה כותב אלגוריתם ונוסחאות שמתארות את התהליך הזה מדובר בחישוב מאוד מסובך. בראייה ממוחשבת יש ליכולת הזאת לפענוח תלת־ממדי שימושים אינסופיים. למשל, מצלמה על מכונית נוסעת שתדע להימנע ולהתחמק ממכשולים ותזהה מכוניות אחרות. אתה רוצה רובוט שיודע לתפוס חפץ ולהעבירו ממקום למקום", מסביר אולמן.

"המחקרים המאוחרים יותר שלי קשורים למשמעות התמונה המזוהה. נניח שאתה רוצה להגיד באופן ממוחשב על תמונה שמדובר בכלב או בחתול. התמונה שמקבל המחשב במקרה הזה היא פרימיטיבית. אם המוח מזהה זנב או רגליים - המחשב מקבל פיקסלים, תמונה של 2,000 נקודות קטנות על 2,000 נקודות קטנות אחרות.

יש קבוצה ענקית של תמונות אפשריות. אם זה לברדורים או פודלים, ואם זה כלב שאנחנו רואים מהצד, מקדימה, שוכב על הרצפה או קופץ - בכל מקרה מדובר בתמונה אחרת. שתי שאלות מאתגרות ברמה האלגוריתמית הן להבין אילו תכונות הופכות חתול לחתול וכלב לכלב ואיך לומד מחשב לעשות את זה באופן אוטומטי, כך שתראה לו תמונות והוא ילמד מה משותף להן. אנחנו פיתחנו אלגוריתם זיהוי אוטומטי על סמך דוגמאות. כזה שיביא לכך שמחשב שמביט באוסף תמונות של פילים ילמד מה המאפיינים של הפילים. הדרך לכך היא על ידי מציאת תת-תמונות בתוך התמונה. תת־אלמנטים שמופיעים בתדירות גבוהה - וכך המחשב לומד מהי רגל של פיל ומהו זנב של פיל. הוא בוחן את כל התת־תמונות ושואל לגבי התת־תמונה אם היא מופיעה בפיל יותר מבתמונות שאינן פיל. לגבי זיהוי של תת־תמונה אחת המחשב יכול לטעות, אבל כשיש עשר כאלו, ההצלחה גבוהה יותר. אחרי שאתה מזהה את אבני הבניין המאפיינות את התמונה אתה מנתח גם את היחסים האופייניים בין אבני הבניין".

מה השימושים התעשייתיים של אלגוריתמים כאלה?

"דוגמה אחת היא היכולת של רופאים שמסתכלים בתמונות רנטגן או בתמונות מיקרוסקופיות של תאים שמשהו בהם לא בסדר. לרופא יש כל כך הרבה תמונות שהוא אינו יכול להסתכל על כולן. ואם הוא יכול להראות למחשב אוסף דוגמאות של תאים בריאים, עם כל השונות שיכולה להיות בהם - הוא יכול להיעזר בו לזהות חריגות. זה יכול להיות גם בזיהוי בני אדם, מדרכה, שלטי רחוב. וגם בתחומים כמו בקרה על תהליכי ייצור ובדיקות איכות בתעשייה".

באורבוטק מנסים למשוך 
את הצעירים ליבנה

חברת אורבוטק מיבנה היא זן שונה בנוף תעשיית הטכנולוגיה הישראלית. חברה בינונית בגודלה שניתן למצוא את המעגלים המודפסים שהיא מייצרת, המוליכים ומארזי הצ'יפים שלה במוצרים רבים בעולם.

בעולם הסטארט־אפים הישראליים היא נחשבת כמעט לחברת "תעשייה כבדה" - עם סקס אפיל נמוך משל חלום האקזיט שמוכרות חברות האינטרנט מהרצליה פיתוח. זאת אחת הסיבות לכך שהחברה מוציאה לדרך בימים אלה תוכנית שנועדה למשוך אליה סטודנטים ישראלים מצטיינים שסיימו את לימודיהם וייקלטו בחברה. החברה הגדירה רף קבלה גבוה לסטודנטים שיתקבלו לתוכנית במטרה לסנן מתוכם את בעלי היכולות הגבוהות.

אשר לוי, המנכ"ל, מגדיר את התוכנית כשילוב של תעסוקה והכשרה, ומסביר את המניעים מאחורי התוכנית בכך ש"כשאתה נמצא ביבנה, החבר'ה שסיימו לימודים נמשכים יותר להרצליה פיתוח או לרמת החייל. אנחנו רוצים מסה של צעירים אחרי לימודים. להביא 60 חבר'ה שסיימו ללמוד זה עבור אורבוטק שינוי של הרכב אוכלוסיית העובדים. זה סוג של מפגש תרבויות שבו שני הצדדים יוכלו להרוויח".



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר TheMarker

סדר את התגובות

כתבות ראשיות באתר

כתבות שאולי פיספסתם

*#