העיניים של כבדי הראייה: המהפכה שמתכננים מייסדי מובילאיי - TechNation - TheMarker
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן
צפו

העיניים של כבדי הראייה: המהפכה שמתכננים מייסדי מובילאיי

אורקם, החברה החדשה של אמנון שעשוע וזיו אבירם, פיתחה התקן לביש שמקריא למשתמשיו טקסטים, מזהה מוצרים בסופרמרקט וגם מתריע על צבע האור ברמזור ■ שעשוע: "אני רוצה מערכת שתסתכל על העולם ותבין מה היא רואה"

17תגובות

ההתקדמות הטכנולוגית בשנים האחרונות מקלה יותר ויותר על הסובלים מלקות בראייה, ומציעה פתרונות שונים - כמו רמזורים קוליים להולכי רגל ויישומים ייעודיים בסמארטפונים - אך אלה מגושמים למדי ולא פותרים לגמרי קשיים בהתנהלות היומיומית. התקן הראייה הממוחשבת של החברה הישראלית אורקם ‏(OrCam‏) עשוי לשנות את כל זה, ולחולל מהפכה בחייהם של מאות מיליוני אנשים.

ההתקן כולל מצלמת וידיאו זעירה שניתנת להרכבה על משקפיים ויחידת עיבוד וחשמל. באמצעות אלגוריתמים לראייה ממוחשבת, הוא יודע להקריא למשתמש טקסטים שבהם הוא נתקל במהלך היום - שילוט רחוב, תפריט במסעדה, עיתון או ספר - וכן לזהות מוצרים בסופרמרקט, להבחין בין שטרות ולזהות את צבע האור ברמזור. הזיהוי מועבר למשתמש במערכת קולית, כמעט ללא שהות מרגע בקשת המידע.

לצפייה בסמארטפונים ובטאבלטים

כתבות נוספות ב-TheMarker

סקס, אלימות וגזענות: כל מה שבאמת קורה בבתי הספר ולא ידעתם

גוגל חוגגת 15 ורוצה להכיר אתכם יותר

ההתקן מיועד לסובלים מפגמי ראייה שאינם ניתנים לתיקון באמצעים אופטיים, אך שומרים על רמת ראייה מסוימת. עם זאת, גם עיוורים יכולים להשתמש בו. לפי המרכז הלאומי לנתוני בריאות בארה"ב, ב–2011 היו בארה"ב 21.2 מיליון כבדי ראייה מעל גיל 18. אורקם מעריכה כי בעולם כולו יש 342 מיליון כבדי ראייה מעל גיל 18, שכ–52% מהם בעלי הכנסה ממוצעת או יותר מכך.

לפני כחודשיים הכריזה אורקם, שהוקמה ב–2010, על מכירת 100 המכשירים הראשונים. בתוך שעות הוזמנו כל המכשירים, אף שמחירו של ההתקן הוא 2,500 דולר, הדומה לזה של התקן עזר לשמיעה. לאחר מכן הכריזה החברה על מכירת 500 מכשירים נוספים, וגם אלה הוזמנו בתוך כיממה. לאחר עיכוב של כחודש מהמועד המקורי, צפויים 600 המכשירים הראשונים להישלח למשתמשים באוקטובר.

למעשה, פרט לפתרונות רפואיים להשבת ראייה באמצעות שתלים תוך־עיניים, כמו אלה של ננו־רטינה הישראלית, Second Sight האמריקאית ו–Retina Implant הגרמנית, ההתקן של OrCam הוא פתרון יחיד מסוגו - מערכת ניידת שמאפשרת לכבדי ראייה זיהוי טקסט ועצמים כמעט בזמן אמת.

אורקם הוקמה בידי פרופ' אמנון שעשוע וזיו אבירם, שני מייסדיה של מובילאיי. בדומה לחלוקת התפקידים במובילאיי, גם באורקם משמש שעשוע יו"ר ואבירם יושב על כיסא המנכ"ל. החברה, שגייסה הון ממשקיעים פרטיים, פועלת כיום מקומה במשרדי מובילאיי בהר חוצבים שבירושלים, ומעסיקה 25 עובדים. מלבד פיתוח התוכנה והחומרה, גם הרכבת המכשירים נעשית בישראל, אך בכוונת החברה להעביר את ההרכבה לסין, כשתגיע לייצור המוני.

הגרסה הנוכחית של המכשיר דוברת אנגלית בלבד, ובהתאם נרכשה המערכת רק על ידי משתמשים בארה"ב, בבריטניה ובאוסטרליה. בשנה הקרובה אורקם מתכוונת להרחיב את המערכת גם לגרמנית, לצרפתית ולספרדית, ולהתאים את בסיס המידע במערכת - כמו זיהוי שטרות, רמזורים וכלי התחבורה הציבוריים - למדינות שבהן שפות אלה מדוברות.

מוותרים על השימוש בכתב ברייל

"בתחום העיסוק האקדמי שלי אני עוסק בבניית מודלים של ראייה - ללמד מחשב לראות אובייקטים שונים", אומר שעשוע בראיון ל–TheMarker. "זה מה שמובילאיי עושה: מסתכלת על וידאו ומזהה עצמים שונים. בשלב כלשהו החלטתי ללכת צעד נוסף - אני רוצה מערכת שתסתכל בצורה כללית על העולם ותבין את מה שהיא רואה. אמרתי לעצמי שאני רוצה להתאמץ ולעשות משהו כזה, ואז התחלתי לחשוב על שימושים אפשריים.

אמיל סלמן

"המחשבה הראשונה היתה על רובוטים, אבל לא ראיתי עדיין רובוטים שדורשים סוג כזה של ראייה, והיעד הבא בתור היה סיוע לעיוורים. ככל שבחנו יותר את השוק, הבנו ששוק העיוורים קטן מדי, ושמעבר לכך, סוג הבעיות של עיוורים - כמו לא להיתקל בחפצים - דורשות מערכת שונה, שעלותה גבוהה מאוד. היעד הבא היה כבדי ראייה - אנשים עם בעיות בשתי העיניים, שהמשותף לרבים מהם הוא אובדן היכולת לקרוא, ובהמשך גם איבוד היכולת לזהות פרצופים".

"בארה"ב יש כיום כמיליון ורבע עיוורים, אך יותר מ–20 מיליון כבדי ראייה", אומר שעשוע. "ההגדרה הזו מתייחסת לספקטרום רחב, שכולל גם עיוורים. המוצר שפיתחנו מיועד בראש ובראשונה לכבדי ראייה ששימרו יכולת ראייה מסוימת". מסיבה זו, הפעלת המכשיר נעשית באמצעות הצבעה באוויר: המשתמש מצביע על מרכז השטר שהוא מחזיק, או המוצר שלפניו במכולת, או תפריט המסעדה, והמערכת תזהה עבורו את האובייקט.

"זה לא אומר שעיוורים לא יכולים להשתמש במכשיר", הוא מבהיר, "כ–10 מתוך 100 המזמינים הראשונים הם עיוורים. עם זאת, מעיוורים מלאים, שהצבעה מבחינתם היא פעולה פחות אינטואיטיבית, יידרש כנראה אימון מסוים כדי להפעיל את המכשיר. אני מאמין שההתקן יתן מספיק ערך שיצדיק את המאמץ".

"כבד ראייה רואה משהו, אך הוא מתקשה להתנהל ביומיום", אומר שעשוע. "יכולת הקריאה היא הדבר הראשון שנפגע אצל כבדי ראייה. במקרים רבים כבד הראייה לא יוכל לקרוא, אלא אם כן הוא מציב את הטקסט 2–3 ס"מ ממנו. מבחינתנו, זה היה הדבר הראשון שנדרש ממערכת עזרה לכבדי ראייה: מכשיר שיכול לקרוא טקסטים מכל מקום שבו הם מופיעים - עיתון, ספר, תפריט, מוצר או שלט רחוב. המערכת הזאת צריכה לזהות את הטקסט ולהקריא לי אותו בתוך שבריר שנייה, בין שהטקסט הוא על נייר ובין שעל משטח אחר, בכל טקסטורה ובתנאי תאורה משתנים", אומר שעשוע.

בדרך ליצירת המכשיר פיתח הצוות של אורקם תוכנה לזיהוי טקסט ‏(OCR‏), שאין לה כיום מקבילות בשוק. "התוכנות הקיימות נועדו במקור לעשות דיגיטציה לטקסט ממסמכים שנסרקו ברמה טובה", אומר שעשוע. "טכנולוגיית הליבה שלהן פותחו כבר בשנות ה–80, ומאז הן השתכללו. לעומתן, אנחנו מתמודדים עם שימושים אחרים. הטקסט שאנחנו מדברים עליו מגיע על טקסטורות שונות, למשל על אריזות בסופרמרקט. בתנאים האלה, שיעור השגיאות של התוכנות הקיימות גבוה מאוד. מעבר לכך, המטרה שלנו היתה לאפשר הקראה של הטקסט בזמן קרוב לזמן אמת. לשם כך, התחלנו מאפס - יצרנו מערכת חדשה שמבוססת על למידה חישובית".

אחת התוצאות של הפיתוח החדש היא ייתור השימוש בכתב ברייל עבור משתמשי המערכת. קריאה של כתב ברייל היא מיומנות לא פשוטה, שנרכשת כיום רק על ידי תת־קבוצה קטנה בקרב כבדי הראייה. "השימוש כיום בכתב ברייל הוא לא מבחירה", טוען שעשוע. "מצלמה זעירה שמאפשרת למשתמש לזהות את הטקסט מבטלת את הכורח הזה. יחד עם שאר השכבות של הזיהוי במכשיר שיצרנו, כבדי ראייה מגיעים לחופשיות שלא היתה קיימת בעבר".

פרט לזיהוי טקסט, המערכת מאפשרת זיהוי אובייקטים כמו אוטובוסים, שטרות כסף ומוצרי צריכה. לדברי שעשוע, "המטרה היא להגיד למשתמש מה יש מולו, במה הוא מחזיק, מה יש בכיוון שאליו הוא פונה. כדי לעשות את זה, המערכת צריכה רמת הבנה של החומר המצולם, שתאפשר לה להבין מה המשתמש רוצה לדעת על העולם. למשל, איזה אוטובוס עומד לפניו, או אם האור ברמזור התחלף". כדי לאפשר את רמת הזיהוי הגבוהה, ההתקן כולל בסיס נתונים שמאפשר זיהוי של מאות מותגים מסחריים ודוגמאות של האובייקטים הרלוונטיים במדינות היעד, כמו שטרות וצורות של אמצעי תחבורה ציבוריים.

אמיל סלמן

"המערכת הנוכחית של אורקם היא מימוש החזון של מערכת הראייה הכללית", אומר שעשוע. "המשתמש אמנם מסמן עם האצבע למה הוא רוצה שהמערכת תתייחס, אבל בלי הבנה של מהות האובייקט שהמשתמש מצביע עליו - המערכת לא היתה יכולה לספק את התוצאות הרצויות. יש הבדל בין הצבעה על כותרת של כתבה בעיתון, שפירושה 'קרא לי את הכותרת הזאת', לבין הצבעה על רמזור, שפירושה 'מה מסמן הרמזור?'"

מעבר לזיהוי שמתאפשר מהשילוב של שתי הרמות הראשונות של המערכת, המשתמשים יכולים ללמד את המכשיר לזהות אובייקטים חדשים ולתת להם שם, באמצעות ניעורם מול המצלמה וציון שם האובייקט בדיבור. יונתן וכסלר, מנהל מרכז הפיתוח של החברה, הוסיף דוגמה לאופן שימוש כזה: "אחד הנסיינים סיפר שקשה לו להבחין בין הכרטיסים השונים בארנק - תעודת עיוור, תעודת קופת חולים וכרטיס אשראי. הוא מסדר אותם לפי סדר קבוע בארנק, אבל כשהוא עולה לאוטובוס, שבו הוא נדרש להציג תעודת עיוור, הוא חושש מבלבול ומציג את כולם". בנוסף, לימוד המערכת כולל זיהוי פנים לפי בקשת המשתמש, אם כי רכיב זה לא ייכלל בגרסה הפומבית הראשונה של המכשיר.

לא דומה לגוגל גלאס

יזמי אורקם מורגלים כבר בהשוואה של ההתקן שפיתחו לגוגל גלאס, המשקפיים החכמים מבית גוגל, אך מבהירים כי המרחק בין המכשירים רב. בעוד שהסוללה של גוגל גלאס יכולה להספיק לצילום וידאו של כחצי שעה בלבד, בהתקן של אורקם, שכולל גם יחידת עיבוד וחשמל הנישאת בכיס, מצלמת הווידאו עובדת כל הזמן. מעבר לכך, הפעולה הקבועה של מצלמת הווידאו בהתקן היא רק צד אחד של המשוואה. הצד השני, שנותן למערכת של אורקם את ערכה, הוא ניתוח וידאו, מה שדורש כוח עיבוד שגוגל גלאס אינו יכול לספק כיום, וגם אלגוריתמים שפיתחה אורקם.

ליאת נגרין, המוגדרת באורקם "נסיינית מס' 1", עובדת כיום בחברה כאחראית קשרי לקוחות. יכולת הראייה של נגרין, כבדת ראייה מילדותה, מאפשרת לה לקרוא טקסט בהגדלה גבוהה. "מבחינתי, המכשיר היה תחליף לכל מיני אפליקציות לסמארטפון", היא אומרת. בשונה מההתקן של אורקם, יישומי הסמארטפון שבהם השתמשה נגרין אינם מבוססי וידאו, אלא דורשים מהמשתמש לצלם את האובייקט, פעולה שדורשת ראייה ברמה גבוהה מזו של רבים מכבדי הראייה, והם מפענחים את הטקסט מהצילום באמצעות שליחת המידע למערכות ניתוח בענן, תהליך שאורך כ–30 שניות. שימוש בשירותים אלה מוגבל מטבעו גם בקליטה סלולרית וגם בסוללה של הסמארטפון.

"המכשיר נועד לעזור לאנשים ביומיום", אומר וכסלר. "הוא צריך להיות מכשיר שאני שם על עצמי בבוקר, ואז יכול לצאת החוצה ולעשות מה שאני צריך במשך היום. אני לא צריך לחבר אותו לאינטרנט ולא צריך לחשוש שתיגמר הסוללה".

וכסלר הוא שותף לפיתוח האלגוריתמים שעליהם מבוסס הפיתוח של אורקם. שעשוע היה אחד משני המנחים שלו בעבודת הדוקטורט שכתב בתחום הראייה הממוחשבת באוניברסיטת מרילנד. לדבריו, "יש דברים מובנים מאליהם לאנשים רואים שלכבדי ראייה הם אתגר יומיומי. מכשיר שיכול להקריא להם כל כיתוב סביבם הוא תחליף לפתרונות נקודתיים. פנייה לעזרה, למשל. אף אחד עד היום לא השקיע את המשאבים הנדרשים כדי ליצור מערכת שנותנת מענה אמיתי לכבדי ראייה. לא מדובר פה בגימיק. זהו מכשיר אמיתי שפותר בעיה אמיתית, וזה דבר שלא קל לעשות. במחיר של מכשיר שמיעה, יצרנו פתרון שנותן פונקציונליות גבוהה מאוד".

אמיל סלמן

עד כה נבדקה גרסת הניסוי ‏(בטא‏) של ההתקן על ידי יותר מ–100 כבדי ראייה שמתגוררים בישראל. "אחד הדברים שלמדנו מהנסיינים הוא שחוסר אחידות בשדה הראייה הופך את פעולת ההצבעה למרכז שדה הראייה ללא טריוויאלית עבור חלקם", אומר שעשוע. "כדי לענות על הצורך הזה, שילבנו במכשיר תוכנת אימון, שמסייעת לרכוש את מיומנות ההצבעה, וכן כלים לזיהוי של שימוש לא נכון".

ההתקן של אורקם כולל מצלמת וידאו של חברת STM ברזולוציה של 5 מגה־פיקסל - רזולוציה גבוהה בהרבה מיכולות צילום הווידאו של מרבית הסמראטפונים הקיימים כיום - ויחידת עיבוד וחשמל נשיאה במשקל 170 גרם, הגבוה במעט ממשקלו של סמארטפון.

"יש עוד המון דברים שלא עשינו מבחינת הבנת העולם הוויזואלי שסביב המשתמש, כי הם פשוט דורשים יותר כוח מחשוב ממה שיש כיום בהתקן", מסביר שעשוע. "בדור השני אנחנו מתכננים להגדיל את כוח המחשוב פי שלושה, וזיהינו כבר את מצלמת הווידאו שתשמש אותנו בדור הבא. רזולוציה גבוהה יותר תאפשר לנו הבנת תמונה טובה יותר, וכך יתאפשר לתת יותר עזרה למשתמש. בהמשך הדרך אנחנו מתכוונים לפתח גם טכנולוגיות לבישות המיועדות לאנשים עם ראייה תקינה. למשל, מצלמה שמבינה כל העת מה אתה רואה יכולה לתת למשתמש פלט שימושי".

מובילאיי שווה כבר 1.9 מיליארד דולר

המייסדים של אורקם, פרופ' אמנון שעשוע וזיו אבירם, הם גם מייסדיה של מובילאיי ‏(MobilEye‏), אחת החלוצות העולמיות בפיתוח מערכות סיוע לנהיגה שמבוססות על ראייה ממוחשבת.

המערכות של מובילאיי, שמפתחת כיום גם מערכת נהיגה אוטונומית, מספקות לנהגים התרעות מפני התנגשות בכלי רכב ובהולכי רגל, מודיעות על סטייה לא מתוכננת מהנתיב ועל אי־שמירת מרחק, ואף מזהות תמרורי מהירות.

הכנסותיה השנתיות של החברה, המעסיקה כ–200 עובדים, הן כ–50 מיליון דולר, וב–2012 היא עברה לרווחיות. ביולי השנה דיווחה מובילאיי על חתימה על הסכם למכירת כ–25% ממניותיה תמורת 400 מיליון דולר. ההסכם משקף לחברה שווי של 1.9 מיליארד דולר אחרי ההשקעה - הערכת השווי הגבוהה ביותר כיום של חברת היי־טק פרטית ישראלית.

הערכת השווי הגבוהה ניתנה לחברה הן בשל הדומיננטיות שלה בשוק - לטענתה היא מחזיקה בנתח של 80% משוק מערכות העזר לנהג - והן בשל תקנות רגולוציה באירופה ובארה"ב, שצפויות להרחיב את השימוש במערכות התרעה מבוססות ראייה ממוחשבת גם לכלי רכב זולים באופן יחסי.

שעשוע, פרופסור למדעי המחשב באוניברסיטה העברית, הצטרף לסגל האוניברסיטה ב–1996 לאחר קבלת תואר דוקטור בחישוביות עצבית מ–MIT ב–1993. פרט למובילאיי ואורקם, הקים שעשוע גם את CogniTens, שפיתחה כלי מדידה לתחום התעשייה ונמכרה ב–2007 להקסגון השוודית.



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר TheMarker

סדר את התגובות

כתבות ראשיות באתר

כתבות שאולי פיספסתם

*#