איך נטפליקס יודעים מה הסדרה הבאה שתאהבו - והאם בזכות מהפכת המידע תימצא תרופה לסרטן?

ד"ר אורי שליט מהמרכז לחישוביות עצבית באונ' העברית, ובעל פוסט דוקטורט מ-NYU בתחום למידת מכונה, מספר על האתגרים העומדים בפני היישום של machine learning בענף הרפואה - וביניהם הרצון לזהות מהו הקשר הסיבתי בין ארועים שונים, כמו נטילת תרופה מסוימת והחמרה או שיפור במצב רפואי

שתפו כתבה במיילשתפו כתבה במייל
שתפו כתבה במיילשתפו כתבה במייל
נטפליקס
צילום: צילום מסך

מהפכת המידע לא פסחה על תחום הרפואה והבריאות. בשנים האחרונות בתי חולים, קופות החולים וחברות הביטוח אוספות מידע דיגיטלי על החולים והמבוטחים ועולה השאלה איך אפשר להשתמש במידע הזה כדי לשפר את הטיפול בחולים וגם את היעילות הכלכלית של חברות הביטוח ובתי החולים.

קרדיט: Unsupervised Podcast

בפרק השלישי של הפודקאסט דיברנו עם אורי שליט, מרצה בכיר בטכניון, בעל דוקטורט מהמרכז לחישוביות עצבית באוניברסיטה העברית ופוסט דוקטורט מ-NYU. במהלך הפרק ניסינו להבין איך מיישמים machine learning בתחום של Health care ואיך מתגברים על האתגרים בתחום.

סוגי הבעיות בתחום ה-Health care הוא מגוון ורחב ונע החל מדיאגנוזות, ניתוח בדיקות מעבדה, זיהוי אנומליות בצילומי רנטגן ועד הערכת סיכונים, ניתוח מדדים שונים לאורך זמן והתאמת טיפול לחולים.

אחת הבעיות המעניינות בכל מחקר, ובמיוחד בתחום הבריאות, היא זיהוי קשרים סיבתיים. כלומר - מה גרם לתוצאה מסוימת. לדוגמה, כאשר בודקים יעילות טיפול חדש לחולי סרטן במצב סופני, יכולה להתקבל תוצאה שהחולים שקיבלו את הטיפול דווקא נטו למות יותר בהשוואה לחולים שלא קיבלו את הטיפול. האם במצב כזה נוכל להסיק שהתרופה מחמירה את מצב החולים? כנראה שלא. סביר יותר שהחולים שקיבלו את הטיפול היו במצב קשה יותר מאלה שלא קיבלו אותו ולכן שיעור התמותה שלהם היה גבוה יותר.

דרך אחת להתמודד עם הבעיה היא להגדיר את אוכלוסיית המדגם בצורה נכונה, תוך התחשבות בכל הגורמים שיכולים להשפיע על התוצאה (הישרדות החולה). לדוגמא, לבנות מדגם כך שקבוצת האנשים שקיבלו את הטיפול תהיה דומה בחומרת מצבה לקבוצת האנשים שלא קיבלו את הטיפול.

דרך נוספת היא לתקן את ההטיה ידנית על ידי נתינת משקלים שונים לאנשים שונים לפי חומרת מצבם וסיכוים לקבל את התרופה.

הבעיה הזו אינה ייחודית לתחום הרפואה. היא יכולה להיווצר בכל סיטואציה בה נרצה להבין מהם הגורמים לתוצאה מסוימת, או במונחים סטטיסטיים - מהו הקשר הסיבתי (causal inference). הטיה דומה ניתן למצוא כאשר מנסים לבנות מודל המלצות על סרטים, כמו לדוגמה בנטפליקס. במקרה זה, המדגם סובל מהטיה מובנית בגלל שיש לנו מידע רק על הסרטים שאנשים בחרו לדרג ואין לנו כל ידע על סרטים שאנשים לא דרגו. ניסינו להבין עם אורי איך בעיות אלו באות לידי ביטוי בתחומים שונים של machine learning וכיצד ניתן לתקן אותן.

לבסוף, אורי סיפר לנו על מחקר שעשה במהלך הדוקטורט בו השתמש בשיטות חישוביות כדי לזהות השפעות מוזיקליות של אמנים.

לחצו על הפעמון לעדכונים בנושא:

כתבות מומלצות

שיעור באוניברסיטה. באקדמיה מצופה מהסטודנטים להתמודד עם בעיות שלא ראו קודם

הסטודנטים באקדמיה נדרשים לראשונה לחשיבה מעמיקה - והתוצאות עגומות

דירה בהנחה

6,269 משקי בית זכו בהגרלה. אבל האם בכלל כדאי לקנות דירה בהנחה?

לחוסכים הסולידיים יש אלטרנטיבה

שעתו היפה של החוסך הסולידי: יש חלופה טובה יותר לפיקדון בבנק

טסלה, מודל S. המחיר למי שיזמין את המודל היום ייקבע בהמשך

אחרי כמעט שנתיים: הדגמים הגדולים של טסלה מגיעים לישראל

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker

כתבות שאולי פספסתם

אלעד כהן (מימין), ניצן רנגיני בוצר ודניאל בוצר

ממשכורת של 30 שקל בשעה – לווילה בת שלוש קומות במושב מבוסס בשרון

מסיבה בבריכה, אילוסטרציה

בעל הבית מרוויח 15 אלף שקל ללילה - החיים של השכנים נהפכו לסיוט