שביל הזהב - שילוב אדם ומכונה

למידת מכונה היא מונח קסם לכל מי שרוצה לשווק מערכת "חדשנית". האם היא תמיד עדיפה על הידע האנושי? מותר המכונה על האדם – חלק ב'

ד"ר יעקב רימר
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
רובוטית דמוית אדם בסרט "אקס מכינה"צילום: ללא קרדיט
ד"ר יעקב רימר

בפוסט הקודם התחלתי לעסוק באחת המחלוקות הקשות בעולם הביג-דאטה: האם למידת מכונה עדיפה על מערכות חוקים?

נזכיר כי מערכת חוקים, או מערכת מומחה, מורכבת מאוסף של כללים וחוקי היסק שאמורים לקבל החלטות בדומה למומחה אנושי. אולם קשה לבנות מערכות כאלו וציינתי שהתוצאה לעיתים קרובות היא מערכת מסורבלת שקשה מאוד לכוונן אותה. בהקשר הזה יש ללמידת מכונה יתרון. עבור אדם שאינו מיומן, קל הרבה יותר לאסוף דוגמות ולתת למכונה "ללמוד לבד", מאשר לתחזק מערכת חוקים מסורבלת. אבל כפי שכתבתי בפוסט הקודם, לפעמים איסוף הדוגמות הוא ענין לא פשוט עד בלתי אפשרי. במקרים כאלו בעייתי להפעיל שיטות של למידת מכונה.

אחת הדרישות המרכזיות שהיתה ועודנה ממערכת מומחה היא שתיתן הסברים הגיוניים למסקנותיה והיא אכן עושה זאת. זה הזמן לציין ששיטות רבות של למידת מכונה הן בחזקת "קופסה שחורה". אין שום יכולת להבין את הסיבות להחלטות של השיטה. למרות שאין בכך להעיד דבר על תוצאות השיטה, אנשים רבים מתקשים להשלים עם כך ולכן לא יקבלו מסקנות של שיטות למידה כאלו, אפילו כשהן עובדות מצוין. אבל רגע, נזכיר שוב שאותם אנשים לא יודעים להסביר לעצמם איך הם עצמם מבדילים בין כלבים וחתולים. ובכל זאת, הם מסכימים כשיש חתול או כלב לפניהם. אז מה קורה פה? אנשים הם דבר מורכב.

חלק משיטות למידת המכונה מסוגלות ללמוד ולזהות לבד מאפיינים (או תכונות) שיעזרו ללמידה, שאדם מתקשה למצוא אותן. בכך בחלק מהמקרים יש להן יתרון משמעותי על מערכות חוקים. הדוגמות המובהקות הן בתחום זיהוי תמונות (למשל, כלבים וחתולים), זיהוי שמע וכדומה. אבל כמובן שיש גם מקרים אחרים בהם אין מנוס מהנדסת תכונות אנושית, כפי שכבר ציינתי בעבר.

למערכות מומחה יש יתרון מובהק כשהדברים ברורים מאליהם. לדוגמה, אם את רואה שניסו להיכנס למחשב שלך 100 פעמים באמצעות ניחוש של סיסמות שונות, כנראה שתביני שמישהו מנסה לפרוץ למחשב שלך בשיטה של ניחוש הסיסמה (מוכרת גם כ-Brute Force). האם באמת צריך לחכות ולאסוף דוגמות לניסיונות פריצה רבים, לאמן מודל ולכוונן אותו, כדי להבין את זה? לא פשוט יותר לכתוב חוק "אם בוצעו יותר מעשרה ניסיונות לניחוש הסיסמה, אז יש ניסיון פריצה למחשב"?

צילום: שלומי מזרחי

לסיכום, ללמידת מכונה יש יתרונות רבים. כאשר אין קושי לאסוף דוגמות, היא תשיג תוצאות מצוינות. היא תוכל להשתפר עם הזמן ככל שיתקבלו עוד דוגמות (או בשיטות משוב אחרות שלא יפורטו כאן). במקרים רבים קל יותר לאמן מכונה מאשר לבנות מערכת מומחה. אבל יש מקרים בהם מערכות חוקים עדיפות. הן מעשיות כשאין דוגמות לאימון, או כאשר יותר פשוט לבטא ידע קיים במקום ללמוד הכול מההתחלה. הן אינן מהוות "קופסא שחורה", ותמיד אפשר להסביר את השיקולים שהובילו להחלטה מסוימת. ויש יתרון נוסף - ניתן להגדיר גם חוקי פסילה, שיעזרו להיפטר בקלות מתוצאות לא רצויות. אם נחזור לרגע ליכולת לחזות האם לקוח בנק מסוגל להחזיר הלוואה, קל באמצעות חוק פסילה להימנע מלהלוות לאנשים שכבר מוכרים כרמאים. זו משימה קשה יותר עבור למידת מכונה.

אז מה השורה התחתונה? למצוא את שביל הזהב. יש יתרונות וחסרונות בכל שיטה, ולפעמים הפתרון האופטימלי עשוי להיות בשילוב של שתי השיטות יחד. יש דרכים שונות לכך, ופתרונות כאלו מוכיחים את עצמם בתחומים רבים. בפוסט בו עסקתי במדידת איכות של מודל, המחשתי מדוע מודל של למידת מכונה מתקשה לאבחן חולים במחלה נדירה בתוך אוכלוסיות גדולות.

ציינתי שהפתרון הוא להפחית דרמטית את המדד של יחס החולים אל מול הבריאים באוכלוסייה הנבדקת. עושים זאת באמצעות הפעלת המודל רק על אנשים שכבר מגלים סימפטומים מתאימים או נמצאים בקבוצות סיכון. כלומר, מפעילים תחילה מערכת חוקים רזה ונשלטת שנועדה לזהות סימפטומים וגורמי סיכון למחלה המדוברת. מיד אחרי הסינון הראשוני שלה, נפעיל למידת מכונה רק על אנשים שעברו את המסננת של מערכת החוקים. בכך נקבל בדרך כלל תוצאות טובות יותר. זה המקום לציין שיש הצלחות יפות לשיטות ביג-דאטה שונות בתחום הרפואה, אולי אכתוב עליהן בעתיד.

ובינתיים, שרק נהיה בריאים.

לחצו על הפעמון לעדכונים בנושא:

ד"ר יעקב רימר | מיסטר ביג ומר דאטה

יועץ בכיר ומרצה בנושאי סייבר, ביג דאטה ומדעים, בעל דוקטורט ממכון ויצמן למדע. עוסק בעשור האחרון במחקר מדעי במקביל לייעוץ לחברות היי-טק ומשרדי ממשלה. בעבר שימש בתפקידים בכירים בהיי-טק ובמשרד ראש הממשלה. מרצה משופשף ומנוסה, שמתמחה בהמחשת נושאי מדע וטכנולוגיה "קשים לעיכול" בגובה העיניים. משלב בכתיבתו והרצאותיו את הניסיון ארוך השנים בתעשיית ההיי-טק ובאקדמיה, יחד עם העברת מסרים ברורה והומור.

הבלוג ינסה להמחיש לקורא המתעניין (וגם הלא-מקצועי) מה כוחם האמיתי של ניתוח נתונים, למידת מכונה או ביג דאטה. מה אפשר (או אי אפשר) לעשות באמצעות שיטות אלו ואיך כל זה נוגע לפרטיות שלנו.

LinkedIn 

Home Page

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker