Unsupervised

אלגוריתמים הוגנים: כיצד מלמדים בינה מלאכותית לפעול ללא הטיות?

אלגוריתמי זיהוי פנים הגיעו לרמה מתקדמת מאוד ומיושמים במוצרים רבים, מחקר אקדמי הראה כי אחוזי הדיוק שלהם בגברים לבנים גבוהים ב-40% מאחוזי הדיוק שלהם בנשים שחורות ■ זו דוגמה אחת מני רבות להטיה מובנית באלגוריתם שניתן לצפות אותה ולבטלה דרך שורות קוד

בשנים האחרונות אלגוריתמים של בינה מלאכותית תופסים מקום ניכר בכל תחומי החיים שלנו - הם מסייעים לקבל החלטות בנוגע למתן הלוואות, קבלה לאוניברסיטה ואפילו שחרור אסירים. איך נדע אם ההחלטות האלו הוגנות? איך בכלל האלגוריתמים מקבלים את ההחלטות משנות החיים האלו?

לחצו על הנגן כדי להאזין לפרק

תכנות. סוכניות הנסיעות מעסיקות יותר מתכנתים מאשר סוכני נסיעות
PRImageFactory / Getty Images IL
להמשך הפוסט

קו התפר בין בינה מלאכותית ליצירתיות: ד"ר שחף בודקת האם למחשבים יש רצון חופשי

תארו לעצמכם תוכנת מחשב שאפשר לשאול אותה שאלות ולקבל תמונת מצב ויזואלית של האינפורמציה סביב נושא מסוים בעל מורכבויות ורבדים רבים ■ זה רק אחד מני מחקרים מרתקים שמבצעת ד"ר שחף במסגרת מחקריה באקדמיה

"האם מחשבים יכולים לחשוב?"

ב-1950 שאל אלן טיורינג את השאלה הזו והציע מבחן כדי לקבוע האם מחשב יכול לחשוב: מחשב ואדם מסתתרים מאחורי מסך ואדם נוסף צריך לחקור כל אחד מהם ולהחליט מי הוא המחשב ומי הוא האדם. אם האדם החוקר לא יבחין בין המחשב לאדם, ניתן יהיה להסיק שהאינטיליגנציה שהמחשב מציג שקולה לזו של בן אדם.

אי־פי
להמשך הפוסט

מחוקר בסטנפורד לסטארט-אפיסט: הארוע שהסיט את המסלול של דוד גולן

אנשים שעוברים שבץ מוחי ויקיריהם יודעים כי "כל דקה שמפחיתים מזמן הטיפול בחולה שעבר אירוע מוחי מעניקה שבוע של חיים בריאים" ולכן הקים גולן את Viz.ai, שמשלבת טכנולוגיית למידה עמוקה בעיבוד תמונות רפואיות ■ הניתוח האוטומטי לא יחליף את הרדיולוגים, אומר גולן, "אנחנו רוצים לזהות את החולים שצריכים טיפול דחוף ולהציף אותם כמה שיותר מהר"

דוד גולן היה בעיצומו של פוסט דוקטורט בסטטיסטיקה בסטנפורד, במסלול ברור להיות חוקר באקדמיה. עד שאירוע מוחי שעבר גרם לו לשנות מסלול.

"יום אחד קמתי בבוקר, שיחקתי עם הבן שלי ופתאום עברתי אירוע מוחי. לא יכולתי להזיז יד או רגל. באיזשהו שלב גם לא יכולתי לדבר. אני זוכר חוויה מאוד חזקה של חוסר אונים, כאילו שכחו אותי בחדר מיון. שהתאוששתי ראיתי איך רופאים מסתכלים על הסריקות שלי והיה ברור שמשהו לא עובד כמו שצריך".

Toronto Star via Getty Images
להמשך הפוסט

איך מפיקים תובנות מתנועת הספינות בים - ומהי השיטה היעילה לניהול פרויקט דאטא סיינס?

יאיר מזור, ראש תחום הדאטא סיינס בווינדוורד, מספר על הקריירה שלו בתחום מדע הנתונים, כיצד הוא ניגש לבעיה אותה צריך לפתור, מאילו תפקידים מורכב צוות מדעני נתונים ואיך נבנה תהליך העבודה

עבודתו של מדען נתונים משלבת כישורים בתחומים כמו סטטיטיקה ולמידת מכונה; כישורי תכנות; ומומחיות בתחום הרלוונטי (domain knowledge) - יכולת להבין את הבעיה העסקית ולבנות פתרון בהתאם.

מדעני נתונים רבים מתמקצעים בשיטות מסוימות ועוברים במהלך הקריירה בין חברות המתמחות בתחומים שונים. המעברים האלה מצריכים מהם להיכנס בכל פעם לעולם בעיות חדש, להבין את האילוצים העסקיים בו, מה מאפיין את המידע בו ולהשתמש בידע הזה כדי לפתור בעיות.

משט ספינות מסורתי ביום החג של אוסטרליה, ב-2011
אי־אף־פי
להמשך הפוסט

איך חוקרים את התקשורת בין אנשים לאינטליגנציה מלאכותית - ולמה זה חשוב?

במהלך לימודי הדוקטורט במדעי המחשב בהרווארד פיתחה עפרה מערכת לעריכת מסמך משותף על ידי מספר אנשים. כחלק מהפרויקט פותח אלגוריתם שמראה לכל עורך את השינויים הרלוונטיים ביותר לו, ונמצאו דרכים למדוד את ביצועי המערכת ■ מחקרים נוספים של ד"ר עמיר עוסקים בדרכים להסביר לבני אדם החלטות של סוכנים חכמים, ישות שמקבלת החלטות באופן אוטומטי כמו למשל מכונית אוטונומית

שיטות בינה מלאכותית מתבגרות ומתפשטות במהירות, ולאפליקציות שלהן יש השפעה מכרעת על חיינו ביום יום. כבר היום מערכות המלצה משפיעות על מה שאנחנו קוראים וצופים, רכבים אוטונומיים חולקים את הכביש עם נהגים אנושיים ומערכות מבוססות AI לוקחות חלק בהחלטות רפואיות.

בעוד מאמץ רב מושקע בשיפור הדיוק ויכולת ההכללה של אלגוריתמי בינה מלאכותית, אנחנו מתעלמים מחלק חשוב במערכות הללו - האינטראקציה שלהן עם אנשים.

עפרה אמיר
ללא
להמשך הפוסט

מה ההבדל בין למידת מכונה לדאטה סיינס? ראש צוות Core Data Science בפייסבוק מסביר

נמרוד פריאל מפתח כלים שעוזרים לכל מדעני הנתונים בפייסבוק לשפר את המוצרים השונים של החברה ■ בפרק 5, דיברנו עם פריאל על התוצרים השונים של מערכת אוטומטית שמקבלת החלטות בזמן אמת ולמה כל מדען נתונים הוא גם מנהל מוצר

בפרק החמישי של הפודקסט דיברנו עם נמרוד פריאל, ראש צוות בקבוצת Core Data Science של פייסבוק, המפתחת מתודולוגיות וכלים שעוזרים לכל מדעני הנתונים בפייסבוק לשפר את המוצרים השונים של החברה באמצעות ניתוח מידע.

דיברנו עם נמרוד על דאטה סיינס, למידת מכונה (Machine Learning) וההבדל ביניהם. למידת מכונה היא תחום במדעי המחשב המאפשר למחשבים ללמוד מנתונים היסטוריים ולייצר מסקנות, או תחזיות, עתידיות עבור נתונים חדשים באופן אוטומטי. התחום, שקיים כבר מספר עשורים, צבר פופולריות כל כך רבה שלעתים אנשים חושבים שכל מה שמדעני נתונים עושים הוא לפתח אלגוריתמי למידה כאלו.

נמרוד פריאל
להמשך הפוסט

רב סרן ספי כהן שיחק קצת עם אלגוריתמים במסד הנתונים הענק של מערכת התקשוב - והקים את מדור הדאטה-סיינס הראשון בצה"ל

בעולם שלפני חמש שנים תחום למידת המכונה ודאטה-סיינס היו הרבה פחות נפוצים ומוכרים, ולמעט האנשים שעסקו בו דאז, מרבית הקהילה הטכנולוגית לא ידעה מה הם בכלל ■ כיום, מדובר בתחומים הלוהטים בהיי-טק, ואלו שמתמחים בהם הם מהעובדים המבוקשים בתעשייה ■ רב סרן כהן הקים את היחידה הראשונה בצה"ל בתחום - מדור מחקרי המידע המבצעי בחיל התקשוב

לפני כחמש שנים רב סרן ספי כהן, אז מהנדס מערכות מידע באגף התקשוב בצה"ל, נחשף לתחום חדש שלא הכיר עד אז - למידת מכונה. מרותק, הוא החל לקרוא עוד ועוד על אלגוריתמי למידה שונים ובמהרה החל לשאול את עצמו כיצד האלגוריתמים הלומדים הללו יוכלו לעזור לו להפיק תובנות מהמידע הרב שהוא חשוף אליו במסגרת תפקידו.

הוא ניגש למפקדיו וביקש מהם בקשה קטנה בזמנו, אך משמעותית מאוד בדיעבד - תנו לי קצת זמן לשבת ולשחק עם המידע באמצעות השיטות האלו. המפקדים הסכימו ואט אט הוא החל לקבל תחומי אחריות חדשים, אנשים תחת פיקודו וכך קם מדור מחקרי המידע המבצעי בחיל התקשוב.

חיילים עם סימולטורים
בלומברג
להמשך הפוסט

איך נטפליקס יודעים מה הסדרה הבאה שתאהבו - והאם בזכות מהפכת המידע תימצא תרופה לסרטן?

ד"ר אורי שליט מהמרכז לחישוביות עצבית באונ' העברית, ובעל פוסט דוקטורט מ-NYU בתחום למידת מכונה, מספר על האתגרים העומדים בפני היישום של machine learning בענף הרפואה - וביניהם הרצון לזהות מהו הקשר הסיבתי בין ארועים שונים, כמו נטילת תרופה מסוימת והחמרה או שיפור במצב רפואי

מהפכת המידע לא פסחה על תחום הרפואה והבריאות. בשנים האחרונות בתי חולים, קופות החולים וחברות הביטוח אוספות מידע דיגיטלי על החולים והמבוטחים ועולה השאלה איך אפשר להשתמש במידע הזה כדי לשפר את הטיפול בחולים וגם את היעילות הכלכלית של חברות הביטוח ובתי החולים.

בפרק השלישי של הפודקאסט דיברנו עם אורי שליט, מרצה בכיר בטכניון, בעל דוקטורט מהמרכז לחישוביות עצבית באוניברסיטה העברית ופוסט דוקטורט מ-NYU. במהלך הפרק ניסינו להבין איך מיישמים machine learning בתחום של Health care ואיך מתגברים על האתגרים בתחום.

נטפליקס
צילום מסך
להמשך הפוסט

דאטה סיינס זה לא משחק ילדים

גלית ברי וייסברג על הדרך שעשתה מתפקיד של דאטה סיינטיסט בסטארט-אפ שמפתח משחקי חשבון אינטראקטיביים לילדים לחברת מובילאיי

מאז שפרצה לתודעה מהפכת ה-Big Data, חלק מחברות ההיי-טק מוצאות את עצמן במקום שבו ללא צוות דאטה סיינס הן כמעט לא רלוונטיות. חברות רבות וותיקות תוהות איך יוכלו לנצל את הנתונים שהן גם ככה שומרות לאורך שנים של פעילות, וחברות צעירות מקדישות תשומת לב רבה לנושא כבר מתחילת הקמתן.

אז מה נדרש מחברה על מנת שתוכל לנצל את הנתונים שלה בצורה חכמה? ואיך מקימים צוות דאטה סיינס מאפס? ברור שצריך אנשי דאטה סיינס, וצריך דאטה, אך מה עוד חשוב לעשות בדרך למימוש אלגוריתמים לומדים במוצר?

מערכת מובילאיי
Carlos Osorio/אי־פי
להמשך הפוסט

איך מחשב לומד שפה

שיחה עם יואב גולדברג על עיבוד שפה ותרגום באמצעות רשתות נוירונים עמוקות

בפרק הראשון והפותח של הפודקסט ריאיינו את יואב גולדברג, חוקר מוערך, בעל שם עולמי ומרצה בכיר באוניברסיטת בר אילן בתחום עיבוד השפה הטבעית Natural lagnuage processing - NLP.

עיבוד שפה טבעית הוא תת תחום של מדעי המחשב שמנסה להבין את השפה באמצעות כלי חישוביים. בעידן שבו כמויות אדירות של מידע טקסטואלי זמין ברשת, הבנת שפה הפכה להיות אחד מהאתגרים המסקרנים ובעלי החשיבות הגבוהה ביותר בקרב ענקיות הטכנולוגיה כגון פייסבוק, גוגל ואמאזון והן משקיעות משאבים רבים בתחום. בשנים האחרונות חלה קפיצת מדרגה אדירה בתחום עיבוד השפה בזכות הטכנולוגיה שנקראת deep learning - רשתות נוירונים מלאכותיות עמוקות שמנסות למדל תהליכים מורכבים באמצעות פונקציות מתמטיות מסובכות שנבנו בהשראת מודל הנוירונים במוח. השיטות האלו הביאו לפריצות דרך בתחומים רבים בבינה מלאכותית - ביכולת לזהות תמונות, להבין דיבור וגם, כאמור, ביכולת להבין שפה.

רשת נוירונים
להמשך הפוסט

Usupervised, פודקאסט על המשרה הסקסית ביותר של המאה - דאטה סיינס

ב-2012 הגדיר ה-Harvard Business Review את Data Science בתוך "המשרה סקסית ביותר של המאה ה-21". בחמש השנים שחלפו מאז נראה שהבאזז סביב התחום רק גדל. יותר ויותר חברות מתהדרות בכך שהן מפתחות פתרונות מבוססי דאטה ורבות מדווחות על לחץ מצד המשקיעים להציג פתרונות כאלו. אבל מה זה בכלל Data Science, מאיפה צמח התחום ומדוע הוא זוכה לפופולריות גדולה כל כך דווקא עכשיו?

Data Science, או מדע הנתונים, הוא תחום העוסק בעיבוד וניתוח נתונים בשביל להסיק מהם מסקנות שונות. נהוג לייחס את טביעת המושג לדי ג'יי פאטיל ולג'ף המרבקר, ראשי קבוצות עיבוד נתונים בפייסבוק ובלינקדין, בשנת 2008. אך אזכורים מוקדמים שלו ניתן למצוא כמה עשורים מוקדם יותר. הראשון שהשתמש במושג הוא ככל הנראה פיטר נואר, מדען מחשב דני זוכה פרס טיורינג, בספר שכתב על עיבוד נתונים בראשית שנות השבעים.

תומר אפלבאום
להמשך הפוסט