הכירו: Deep Learning - הדבר הכי לוהט בהיי-טק עכשיו - TechNation - TheMarker
תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

הכירו: Deep Learning - הדבר הכי לוהט בהיי-טק עכשיו

את היסודות של למידה עמוקה (Deep Learning), המונח החם ביותר בהיי־טק, אפשר למצוא בכל תחומי החיים ■ האתגר הגדול של החוקרים והמפתחים הוא ללמד את המחשבים לבצע תהליכי לימוד עמוקים, בדומה למוח האנושי

15תגובות
מוח סייבורג

למידה עמוקה, Deep Learning, היא המונח הלוהט בתעשיית ההיי־טק השנה. כמו ביג־דאטה בשנה שעברה, סייבר בשנה שלפני כן, או מובייל לפני שלוש שנים - כיום כמעט כל סטארט־אפ משלב בדרך כלשהי את המונח הזה בחזון, במודל העסקי, או סתם כדי להיראות רלוונטי עבור משקיעים פוטנציאליים. למעשה זה לא קשה, מפני שבאיזו טכנולוגיה שלא נשתמש, אפשר למצוא את היסודות של התחום, שמתמקד ביכולת של מחשבים לחקות תהליכים שמתרחשים במוח האנושי, כמו זיהוי דיבור, פענוח תמונה או ניתוח טקסט.

יסודות של תהליכי למידה עמוקה נמצאים בסמארטפונים, באפליקציות, במחשב, במכונית ובכל מכשיר שמחובר לרשת - והיכולת של מכונות לחקות תהליכים קוגניטיביים אנושיים משתפרת בשנים האחרונות בקצב מסחרר. אמנם כבר עשרות שנים מנסים החוקרים והמדענים לפתח מחשבים ומכונות שיצליחו לחקות תהליכים מורכבים המתרחשים במוח האנושי - ובראשם יכולת המחשב ללמוד וללמד את עצמו - אך רק בשנתיים־שלוש האחרונות הושגו פריצות דרך משמעותיות, שמקרבות את הטכנולוגיה אל הגביע הקדוש - הבינה המלאכותית.

סרטון שמדגים תהליך למידה של מכונית בהשתלבות בכיכר:

Mobileye

לפני כשבועיים קיבלנו הוכחה משמעותית לשיפור ביכולות אלה, כשתוכנת אלפא־גו (AlphaGo), שפיתחו במחלקת המחקר של גוגל, דיפ מיינד (DeepMind), ניצחה במשחק הלוח הסיני גו את יריבה האנושי, לי סדול הקוריאני, בתוצאה 4-1. גו נחשב למשחק מורכב הרבה יותר משחמט, ועצם הניצחון הוא צעד משמעותי נוסף בעולם הבינה המלאכותית (AI), ונקודה נוספת למחשב בתחרות ארוכת השנים בין האדם למכונה. דיפ מיינד, שהתחיל כסטראט-אפ ללא קשר לגוגל, הוא דוגמה לאופן שבו רוכשות ענקיות הטכנולוגיה את הטאלנטים הבולטים בתחום.

למידה עמוקה, היא מודל חישובי המכיל קבוצת אלגוריתמים, ונשען על תשתית של רשתות נוירונים המחקים את תהליך הלמידה במוח האנושי. התחום, שכבש בשנה האחרונה את דמיונם של מדעני המחשב, וחלקים הולכים וגדלים של העולם העסקי, עתיד להפוך לחלק אינטגרלי מתעשיית ההיי-טק העולמית. התחום מצליח לא כי הוא דמיוני, אלא להפך, מכיוון שהוא מייצר פתרונות לבעיות ולתהליכים שגרתיים ויומיומיים: מזיהוי דיבור בסמארטפונים, ועד לשדרוג של חלקים מעולם הרפואה וההתקדמות לעבר תחבורה אוטונומית, תעשייה יעילה וחכמה יותר וכלים פיננסיים.

למידה עמוקה משתלטת על כל תחומי החיים

זיהוי קול - הבנה וניתוח של דיבור - האינטרנט של הדברים, טלקום,
מערכות Personal Assistant
טקסט - למידת שפה - קריאה וכתיבה תרגום, סנטימנט שיח, תקשורת

תמונה - ראייה ממוחשבת - רשתות חברתיות, רפואה רדיולוגיה רכב אוטונומי, רובוטיקה

ניתוח נתונים - עיבוד נתונים - סייבר, פיננסים, ניהול ארגוני, מדעים
מדויקים (גם לרפואה), פרסום

"יש באזז מטורף סביב למידה עמוקה, כולם מדברים על זה ונראה שזה העתיד", מציינים מומחים למדעי המחשב ומתמטיקה מפקולטות שונות בארץ. יו"ר גוגל, אריק שמידט, צוטט השבוע במהלך כנס לטכנולוגיות ענן של החברה בסן פרנסיסקו, כשאמר שהמהפכה הבאה נמצאת בבינה המלאכותית. "אני מתכנת שהתמזל מזלו והגיע לגוגל", אמר שמידט. "אך עולם התכנות משתנה, כי במקום לתכנת מחשב, היום אתה מלמד מחשב ללמוד משהו - והוא עושה מה שאתה רוצה". ואכן, בשנה האחרונה אנו עדים ליותר ויותר סטארט־אפים טכנולוגיים שמצמידים את המונח להגדרת המיזם. לצד גוגל, חברות גדולות נוספות כמו פייסבוק, אפל ואמזון נמצאות במרוץ התחמשות - ורכשו בשנתיים האחרונות חברות ומומחים ממעבדות מחקר אקדמיות במאות מיליוני דולרים.

למידה - לא פשוט 
כמו שחשבנו

"למידה היא משהו בלתי רצוני שאנחנו, בני האדם, עושים כל הזמן. אנחנו משתמשים במידע שאנחנו קולטים כדי לייצר ידע", מסביר פרופ' שי שלו שוורץ, סגן נשיא חטיבת הטכנולוגיה בחברת מובילאיי ומומחה לתחום הלמידה העמוקה מהפקולטה למדעי המחשב באוניברסיטה העברית. "אם נראה לאדם כלשהו תמונה שמוצגת בה מכונית, הוא יידע שיש בה מכונית, אך לא יידע להסביר איך הוא יודע את זה. זה מה שאני, כחוקר, רוצה לגלות וזה מה שמערכות למידה עמוקה עושות - מנסות להבין כללים. אלה כלים אוטומטיים של הסקה מהפרטים אל הכלל".

למידה עמוקה היא למעשה תת־תחום בתוך שדה שנקרא למידת מכונה (Machine Learning) - מושג נוסף שהפך נפוץ באחרונה, הנמצא תחת תחום הגג הגדול של בינה מלאכותית. בפועל, הלמידה העמוקה במחשבים נועדה לחקות כמה שיותר את פעולת הלמידה במוח האנושי, והיא נעשית באמצעות עיבוד של מידע (דאטה) רב ברשתות נוירונים וסינאפסות מלאכותיות בצורה סימולטנית, תוך אימון של המערכת. המטרה של הטכנולוגיה היא לזהות דפוסים חוזרים, חלקם אבסטרקטיים לחלוטין, מתוך כמויות גדולות של דאטה שהוזנו לתוכה.

השימוש העיקרי במודלים של למידה עמוקה במחקר ובתעשייה נועד לפתור בזמן אמת בעיות שבבסיסן כמויות עצומות של דאטה. התחומים העיקריים בהם נעשה שימוש בטכנולוגיה זו הם ראייה ממוחשבת - לפענוח תמונות או קובצי וידאו למשל תוך כדי נהיגה, זיהוי שפה ועיבוד שפה טבעית, כל אותם המרכיבים שכבר הוטמעו בצורות שונות כמעט בכל הסמארטפון, וכבר מספקים מענה בתחומים מורכבים יותר כמו רפואה ותעשיית הרכב, כשבזמן האחרון גם תחומי הסייבר והפיננסים נכנסו לתמונה.

פרופ' שי שלו שוורץ

שלו שוורץ מסביר כי בארגונים רבים בעולם יוצרים אינטליגנציה מלאכותית על ידי למידה. במובילאיי, אליה שייך שלו שוורץ, זיהו את התופעה מוקדם וכיום חלק מהמערכת מבוססת על טכנולוגיה זו. "בראייה ממוחשבת, תוך איסוף של הרבה תופעות של תמונה כלשהי, ניתן להפוך את המושג מכונית נניח - לכלל. הסיבה האמיתית שאנחנו הולכים בדרך הזאת היא כי אנחנו לא מצליחים לבנות את התהליך השלם שיחקה את מה שהמוח עושה", הוא אומר.

"החישוב מתבצע בשכבות של נוירונים מלאכותיים. כל שכבה עושה עוד עיבוד על השכבה שלפני, והכל ביחד מבצע חישוב מורכב. אנחנו מתחילים בשכבה שמסתכלת על הפיקסלים של התמונה. המערכת יודעת למצוא הבדלים בין קווים וצבעים, ולאחר מכן היא עוברת למושגים אבסטרקטיים יותר - זיהוי של חלון, כביש או לוחית זיהוי, ואז עוברת לעוד שכבה. זהו מודל הבנוי על סדרה של פעולות כשבסוף הוא מזהה את המכלול כרכב", אומר שלו שוורץ. למעשה, ככל שמעמיקים עוד בשכבות, יכולת הזיהוי של אובייקטים שונים גבוהה יותר, כך שבקצה של המערכת היא כבר תדע לומר אם מדובר בכלב, אדם או רכב".

תחזית המכירות: 43 מיליארד דולר עד 2024

בדו"ח התחזיות השנתי שפירסמה פירמת הייעוץ דלויט, הוקדש פרק שלם לתחום הלמידה העמוקה. בדלויט ציינו כי 80 מתוך 100 חברות התוכנה הגדולות בעולם יאמצו בשנה הקרובה מערכות תוכנה חכמות המבוססות על בינה מלאכותית וטכנולוגיות קוגניטיביות - עלייה של 25% לעומת השנה שעברה. התחומים שיהוו את השימוש העיקרי עבור חברות אלה, לפי דלויט, הם עיבוד שפה טבעית וזיהוי דיבור. תחזית המכירות בתחום הבינה המלאכותית, לפי המחקר, יגיעו ל-43 מילארד דולר עד 2024.

Alexa של אמזון
אי־פי

ואולם למרות הפופולריות הגוברת של התחום בשנתיים האחרונות, הלמידה העמוקה ומודלים של רשתות נוירוניות מלאכותיות נמצאות במחקר כבר עשרות שנים. התחום איבד לא פעם את ההובלה לטובת מודלים שטוחים של ניתוח דאטה. אחת מאבני הדרך המשמעותיות היו כשהחוקר יאן לקון בנה רשת לזיהוי של כתב יד ב-1989, ששימשה לקריאת צ'קים. מאוחר יותר שקע התחום שוב בתרדמת. בדצמבר 2013 מונה פרופ' לקון לאחראי על מעבדת הבינה המלאכותית של פייסבוק.

מאמצע שנות ה-2000, התחילו לראות תוצאות והתחום קיבל פופולריות מחדש. לדברי שלו שוורץ, עיקר התנופה התחילה ב-2012, לאחר שמאמר של שלושה חוקרים מובילים בתחום מאוניברסיטת טורונטו, ג'פרי הינטון, אלכס קריז'בסקי ואיליה סוצקבר, הציג קפיצה בתוצאות של היכולת להבין תמונות במערכת מבוססת רשתות נוירונים. "בעקבות מאמר זה הקהילה האקדמית והעסקית הבינו שלמידה עמוקה היא משהו חזק מאוד", טוען שלו שוורץ. מאוחר יותר, מצאו את עצמם השלושה מובילים את המעבדה בגוגל.

סיבה מרכזית נוספת לנסיקה בשימוש ברשתות נוירונים באחרונה, קשורה בכמויות הדאטה האדירות שנגישות, הודות לשימוש בענן, ומוזנות בקלות למערכות. מערכות אלו מצוידות כיום ביכולות עיבוד גבוהות, כאשר מהלכי הלימוד מתבצעים בעזרת מעבדים גרפיים (GPU) המסוגלים לעבד כמויות של דאטה במקביל במספר ערוצים, כביכול בדומה למוח, ויכולים להגיע לתוצאות בצורה מהירה הרבה יותר ממעבדים רגילים (CPU).

אדן שוחט, שותף בקרן ההון סיכון אלף, ומי שרשום על אחת ההצלחות הישראליות הבולטות בתחום הראייה הממוחשבת עם מכירת face.com לפייסבוק ב-2012, מסכים שמדובר במהפיכה. "התוצרים שנובעים מהטכנולוגיות האלה, כמו היכולת להבין אדם שמדבר, הם משמעותיים", הוא אומר, אך מדגיש כי על מנת שנוכל ליהנות מפירותיה של הטכנולוגיה, יש צורך בהמון דאטה איכותי ומתויג.

אדן שוחט
אייל טואג

"לקופת חולים כללית למשל יש דאטה בתחום הרדיולוגיה, ואם הממשלה היתה משחררת מידע על רפואה זה היה משמש לשיפור החיים שלנו, אבל אין מישהו שמרכז את זה מטעם המדינה", טוען שוחט. שוחט מסביר כי המחקרים ממשיכים כל הזמן ולכן התחום מתפתח יחסית מהר ויש אווירה שבה כולם מנצחים, אך מוסיף כי חשוב לייצר עוד ועוד מרכזי ידע בתחום. במבט על סצנת הסטראט-אפים המקומיים, מעיד שוחט כי ישנו שימוש הולך וגובר במונח הלמידה העמוקה, וההבדל העיקרי בין מי שאכן עושה משהו אמיתי למי שסתם משתמש במונח - הוא במקור של הדאטה.

תחום נוסף שמוזכר רבות בעת האחרונה ויכול לקבל חיזוק משמעותי מטכנולוגיה זו, הוא סייבר. אחת החברות הישראליות שמיתגו את עצמן ככאלה שיכולות לתת פתרון כולל, עם אחוזי זיהוי גבוהים של תקיפות מסוגים שונים, היא דיפ אינסטניקט (Deep Instinct). החברה, ששהתה עד לפני כמה חודשים מתחת לרדאר, משמשת זרוע לאבטחת מידע בקבוצת החברות, שהראשונה בהן היא המימד החמישי, שהתפרסמה עם גיוסו של הרמטכ"ל לשעבר בני גנץ לתפקיד היו"ר.

המימד החמישי ודיפ אינסטניקט מותגו כחברות המשתמשות בטכנולוגיות המבוססות על למידה עמוקה, כבסיס למתן פתרונות שונים. דיפ אינסטינקט פועלת בתחום הסייבר, והמימד החמישי פועלת במטרה לנתח כמויות גדולות של נתונים ממקורות שונים כדי לאתר איומים ביטחוניים בזמן אמת. בראש שתי החברות עומד גיא כספי, לשעבר מנכ"ל טמרס. דיפ אינסטינקט גייסה על פי מאגר הנתונים של חברת IVC סכום של כ-35 מיליון דולר, בעיקר מקרן ההשקעות דייויד בלומברג.

סמנכ"ל הטכנולוגיה בדיפ אינסטינקט הוא ד"ר אלי דוד, מרצה בפקולטה למדעי המחשב באוניברסיטת בר־אילן. לדבריו, במבחנים שערכה החברה, היא הצליחה לאתר 20% יותר נוזקות מאשר תוכנות האנטי-וירוס הקיימות, בדומה להצלחות של המודל בזיהוי תמונה או דיבור. "יש מיליון קבצים פוגעניים חדשים שנוצרים כל יום, והמספר גדל כל הזמן. אותנו מעניין לזהות קבצים חדשים", הסביר.

אריק שמידט
רויטרס

בעזרת השימוש באלגוריתמים של למידה עמוקה, מסביר דוד, מאמנים צוותי החברה את "המוח" - מערכת של רשתות נוירוניות המורכבת מכמה מעבדי GPU - לזהות מהו קובץ זדוני ומה איננו. "לצורך אימון המערכת אנחנו משתמשים בעשרות מיליונים של קבצים פוגעניים ולא פוגעניים. המוח המלאכותי לומד את המאפיינים בתהליך שאורך כ-48 שעות, שלאחריו תהליך הבדיקה הוא מיידי".

דיפ אינסטינקט, כמו גם המימד החמישי, לא מפרסמת רשימת לקוחות, אך רומזת כי היא נמצאת במגעים עם חברת טלקום גדולה וכמה מוסדות פיננסיים. כמו כן, בכירים בעולם הסייבר והלמידה העמוקה טוענים כי כיום ישנן מספר חברות גדולות בתחום הסייבר והפיננסים שמפתחות כלים לזיהוי אנומליות והונאה ברשת, פועלים על פי מודלים מבוססי למידה.

בונים דור חדש של יישומים חכמים

בעולם ממשיכות החברות הגדולות להוביל את המחקר והעשייה בתחום. לצד גוגל שהציגה יכולות מרשימות עם ניצחון מערכת דיפ מיינד במשחק הגו, ידוע כי גם החברות מיקרוסופט, באידו, יבמ, ופייסבוק משקיעות הון רב בתחום. אלא שבצורה שאינה אופיינית לשוק תחרותי, בתחום הבינה המלאכותית, מפרסמות החברות את הגישה בקוד פתוח, בשל הקושי להגיע לכל המומחים וכדי לעודד את הפיתוח בתחום.

זיהוי פנים

גוגל פירסמה השבוע כי היא מאיצה את תהליך פיתוח היישומים בתחום למידת המכונה (Machine Learning). בכנס פלטפורמת הענן GCP NEXT בסן פרנסיסקו, הציגה גוגל את Cloud Machine Learning - פלטפורמה חדשה למפתחים, שתאפשר להנגיש את התחום הלוהט בתעשייה לשכבות רבות יותר, ותעניק למומחי ביג-דאטה ומפתחים אפשרות לבנות דור חדש של יישומים חכמים.

בפייסבוק לא מחכים ומעבים כל הזמן את מערך אנשי הבינה המלאכותית בארגון, תחת ידיו של הגורו יאן לקון. מעט לפני הפרסומים של גוגל על הישגים מרשימים במשחק הלוח הסיני, פירסם האתר טק־טיימס, ידיעה על כך שפייסבוק מפתחת יכולות בינה מלאכותית שיביסו כל אדם במשחק גו. מעניין יהיה לראות אם הרשת החברתית תבצע מהלך דומה לזה של גוגל, ותתחרה באלוף האנושי.

וכמובן שישנם גם חסרונות. בהרצאה מסכמת במהלך כנס הראייה הממוחשבת IMVC לפני כשבועיים, הקדיש שלו שוורץ כמה דקות כדי להבהיר שעדיין לא מדובר בגביע הקדוש. "המודלים בנויים על מנת לפתור בעיות מסובכות, אך לעתים נופלים בבעיות די בסיסיות. זו לא התרופה לכל דבר", אמר. חוקרים אחרים בתחום מסבירים כי אף שהתוצאות בהרבה תחומים אכן מדהימות, עדיין קשה להוכיח למה זה עובד, ככל הנראה כמו במוח האנושי.

בנוגע לחשש הלגיטימי מפני עליית יכולותיהם של המחשבים ושימושם לרעה נגד האנושות - בהרצאה קצרה על תחום הלמידה העמוקה שהציג בשבוע שעבר פרופ' ליאור וולף, מומחה לתחום מאוניברסיטת תל אביב, בכנס הסייבר באוניברסיטה, הוא ציין כי אכן יש מהפכה סביבנו וקפיצה אדירה, אך הוסיף כי "מספיק שמחשב יוכל לתכנן התקפה על מחשבים, והסכנה אמיתית".

מכונית אוטונומית של גוגל
אי־פי

מולו, שלו שוורץ שמבין את הדאגה, נשמע אופטימי יותר. "יש דבש ויש עוקץ, ועולה השאלה איך אנחנו כמדענים נכוון את המחקר כדי שיהיה בטוח". שלו ציטט את פרופ' אנדרו NG, שמוביל כיום את התחום בחברת באידו: "לדון בזה כיום, זה כמו לדון בהתפוצצות אוכלוסין של האנושות על מאדים".

הירשמו עכשיו: סיכום דו שבועי בנושאי טכנולוגיה והייטק ישירות למייל
נא להזין כתובת מייל חוקית
ברצוני לקבל ניוזלטרים, מידע שיווקי והטבות


תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות

כתבות ראשיות באתר

כתבות שאולי פיספסתם