ההתקדמות הטכנולוגית שחלה בשנים האחרונות בתחום עיבוד שפה טבעית, מאפשרת לבנות מערכות ש"מבינות" את הטקסטים יותר לעומק, עם פחות מאמץ מצד מי שבונה ומאמן את המערכת, ומסוגלות להתמודד גם עם טקסטים מגוונים יותר ושאלות מגוונות יותר. עדיין ישנם אתגרים רבים בתחום, במיוחד כשדורשים ממערכת כזו להתמודד עם טקסטים ושאלות בתחומים מאוד ספציפיים לתחום מסוים או תעשייה מסוימת, שבהם יש אוצר מילים ייחודי או צורת התבטאות שונה (למשל, שפה משפטית). אך גם הטיפול בבעיות מסוג זה נעשה יותר קל בזכות התקדמות הטכנולוגיה ומודלי השפה המתקדמים שיש ברשותנו היום.
"הנושא של מענה לשאלות על חומר כתוב שהמערכת לומדת, הוא נושא מחקר ותיק שקבוצות מחקר רבות ב-IBM עובדות עליו לאורך שנים רבות. גם מערכת ווטסון שבנינו במעבדות המחקר שלנו ושהשתתפה וניצחה בתחרות ג'פרדי ב-2011 הייתה מערכת כזו", אומרת שילה אופק-קויפמן, דירקטורית טכנולוגיות עיבוד שפה טבעית במעבדת המחקר של IBM בחיפה.
"השנה הכנסנו יכולת של מציאת תשובות לשאלות על מסמכים עסקיים למוצר ווטסון דיסקברי, שמסוגל להתמודד עם הבעיות והאתגרים בתחום ולספק תשובה מדויקת לשאלה, במקום להחזיר פסקה או מסמך שבו מופיעה התשובה", היא מוסיפה. "בימים אלו אנחנו שוקדים על פתרונות שיחברו למידה עמוקה ומערכות בינה מלאכותית שמשתמשות בידע והן בעלות יכולות הסקה (reasoning). יכולות אלה יאפשרו לענות על שאלות שדורשות ידע על העולם ולא מבוססות רק על טקסטים כתובים".
מהם השימושים שיש לטכנולוגיה כזו?
"יכולת כזו חשובה מאוד בארגונים ויכולה לחסוך זמן רב שאנשים משקיעים בחיפוש תשובות לשאלות, בין אם אלה עובדי הארגון שמחפשים תשובה לשאלות בנושאי משאבי אנוש, או מחפשים פיסת מידע בדו"ח עסקי, ובין אם אלה לקוחות שמחפשים מענה לשאלה באתר של החברה.
"שימוש חשוב נוסף לטכנולוגיה כזו הוא השילוב שלה בתוך מנועי שיחה, צ'אט בוטים. מנוע השיחה מאומן לענות על מספר שאלות מוגבל שהוא תוכנן לטפל בהן, אך תמיד יש שאלות נדירות יותר שהוא לא מכסה. במקרה כזה, מערכת שמסוגלת לענות על שאלות מעל תוכן ארגוני, יכולה להיכנס לפעולה ולתת מענה קצר ומדויק לשאלות שהצ'אט בוט יחזיר ללקוח".
הבנה מלאה של מסמכים על כל מרכיביהם
לדברי אופק-קויפמן, הצעד הבא שאליו הם רוצים להתקדם ועליו הם עובדים במעבדות, הוא להיות מסוגלים לנהל שיחה של ממש מעל מסמכים ותוכן ארגוני ולחסוך לגמרי את הצורך ב'תכנות' הצ'אט-בוט. "תארו לעצמכם שקיים אתר של חברה, שבו למעשה נמצא חלק ניכר של התוכן שעליו הלקוחות של האתר שואלים שאלות, ויש צ'אט בוט שיודע לענות על שאלות ולנהל צ'אטים מעל התוכן באתר שלך, ללא שום מאמץ ידני בבנייתו", היא מדגימה. "טכנולוגיה כזו יכולה לחסוך עלויות ניכרות שהארגונים משקיעים היום בבניית בוטים ובתחזוקתם. בעזרתה, גם כשתוכן האתר שלך משתנה ומתעדכן, הבוט יהיה מעודכן גם הוא באפס מאמץ".
האם מערכות יכולות להתמודד רק עם טקסט, או שיש טכנולוגיה שתאפשר להם להתמודד עם אלמנטים ויזואליים, גרפיים למשל?
"במסמכים עסקיים, יש שילוב של טקסט ואלמנטים ויזואליים שחשובים לא פחות מהטקסט. ההבנה של מרכיבים אלה, כדי שנוכל להשתמש בהם להבנת המסמך כולו, צריכה להיות עמוקה יותר מעצם הזיהוי שהם קיימים ודורשת הבנה של התוכן שלהם. אנחנו עובדים כיום על הבנה עמוקה של אלמנטים ויזואליים, כגון הבנה של טבלאות מסוגים מגוונים, כולל המבנה של הטבלה והבנה של כל תא ותא בטבלה וההקשר שלו בתוכה. כמו כן, אנחנו מסתכלים גם על גרפים מסוגים שונים ומפענחים את הנתונים המוצגים בגרף, כך שניתן יהיה לספק מענה על מרכיביו השונים והערכים שהוא מציג. יכולת זו תאפשר לנו הבנה מלאה של מסמכים על כל מרכיביהם ותשפר גם את היכולת לשאול שאלות על כל מרכיבי המסמך ולשלב אלמנטים אלה, או מרכיבים מהם, בתשובות. למשל, נוכל להחזיר תא בטבלה שבמסמך כתשובה לשאלה שלקוח שואל, או להביא נתון מסוים מגרף".


כיצד זה שונה מ-OCR?
"OCR עוסק בזיהוי והבנת הטקסט והאלמנטים המופיעים במסמך סרוק, אך ללא עיבוד נוסף של האלמנטים הוויזואליים. כלומר, הוא יודע לזהות את התווים ולשחזר מהם טקסט דיגיטלי. הבנה עמוקה של מסמך היא השלב הבא למעשה, אחרי שהבנת שיש אלמנט ויזואלי של טבלה, דיאגרמה או גרף. להבין מה יש בו ומה הנתונים שהוא מציג, בדומה למה שאדם מסוגל לעשות כשהוא מתבונן באלמנטים האלה במסמך שהוא קורא".
אנליזה של נתונים עסקיים
אופק-קויפמן מרחיבה לגבי אפליקציות נוספות בתחום ה-NLP עליהם עובדים במעבדות, שמתאפשרות היום בזכות ההתקדמות הטכנולוגית של השנים האחרונות: "תחום נוסף שמתפתח במהירות בזכות ההתקדמות במודלי שפה ושימושיהם, הוא תחום ה-NLG, Natural Language Generation.
"כלומר, 'יצירת' שפה. המודלים הללו מאפשרים לייצר טקסטים שנשמעים טבעיים, דבר שהיה קשה למדי עד לפני מספר שנים, ועבד בעיקר עם תבניות שיצרו טקסטים, מה שדרש עבודה רבה והיה מוגבל יחסית. התקדמות זו מאפשרת לייצר ממשקים בשפה טבעית למערכות שונות ביתר קלות. דוגמא כזו, שאנחנו עובדים עליה, היא יצירת טקסטים בשפה טבעית שמתארים תהליך ותוצאות של אנליזה של נתונים עסקיים. יכולת כזו מנגישה נתונים, שלא כל בעלי התפקידים בארגון יכולים לצרוך בקלות כאשר הם מופיעים במאגרי מידע ומערכות BI בצורה של טבלאות וגרפים.
"אך כאשר המערכת תפיק תיאור מילולי שמתאר את הנתונים המוצגים, וגם את תוצאות הניתוח שנעשה עליהם, ובנוסף - מהם הדברים שכדאי ללמוד ולשים אליהם לב בניתוח - פתאום יש לך יכולת לצרוך נתונים ותובנות בצורה זריזה ומהירה, ולהשתמש בהם ביתר קלות בתהליכי קבלת החלטות עסקיות".
לעזור לנציג האנושי לתת שירות טוב יותר
IBM מציינת כי לטכנולוגיות בינה מלאכותית יש את הפוטנציאל לתמוך בפעילת של מוקדי שירות - צ'אט-בוטים חכמים הפונים ללקוחות, או במערכות מתקדמות שמסייעות לאנשי הצוות. אני מבקש מאופק-קויפמן לתת דוגמאות לטכנולוגיות כאלה ולהעריך כיצד הן ישפיעו על תחום שירות הלקוחות בשנים הבאות. "כבר היום יש במרכזי השירות טכנולוגיות של בינה מלאכותית. למשל, במנועי השיחה (הצ'אט-בוט) ובמנועי החיפוש שמשמשים את הנציגים. כפי שציינתי, אנחנו עובדים כל הזמן כדי לשפר ולייעל גם את בניית המערכות האלה, וגם את איכות השירות והמענה שהן יכולות לתת עם פחות מאמץ וצורך בתכנות", היא משיבה.
"בנוסף לדברים שכבר דיברנו עליהם, אנחנו עובדים גם על טכנולוגיות שמסייעות לנציג האנושי בשיחות עם הלקוחות בהם הוא מטפל. אנחנו עובדים על מספר שירותים, שלומדים ישירות מהדאטה של הלקוח, ומבוססים על הטכנולוגיות הכי מתקדמות בעולם ה-Language models.
"מטרת הטכנולוגיות הללו היא לעזור לנציג האנושי לתת שירות טוב יותר, מהר יותר ובאופן שמותאם יותר למדיניות החברה ולתסריטי השירות שלה. באופן עקיף, שירותים אלה גם עוזרים להעלות את רמת שביעות הרצון של העובד עצמו, לא רק של הלקוח, ומסייעים למרכז השירות לתת שירות אחיד ללקוח, שאינו מושפע מרמת הניסיון של הנציג הספציפי שענה לשיחה. כמובן שכל השיפורים הללו יעזרו למתן שירות טוב יותר ומהיר יותר שיעלה את איכות השירות שהלקוח מקבל".






