דמיינו לעצמכם כימאים או פיזיקאים שעורכים ניסויים. בדמיונכם אתם רואים, מן הסתם, מדען או מדענית בחלוק לבן עם מבחנות, חומרים ומבערים, ריחות ואדים, ובמקרה של פיזיקאי - אולי לייזרים ומראות ומכשירי מדידה מדויקים.
הדימוי הזה עדיין נכון עבור חלק מהמדענים הניסויים (בניגוד לתיאורטיקנים), אבל החלק הזה הולך וקטן בהתמדה, ולא בגלל חוסר תקציבים או ירידה בצורך בניסויים כאלה. הסיבה האמיתית לכך היא שכיום, חלק גדול מהמחקר הניסויי נעשה במחשב. חוקרים במדעי הטבע יכולים להיעזר בתוכנות מתוחכמות (או לפתח תוכנות כאלה) אשר מוטמע בהן מודל של הטבע בתחום המחקר, המבוסס על מחקרי עבר. מה שנשאר למדען לעשות הוא לשאול את השאלות הנכונות ולדעת איך להפעיל את התוכנה כדי לקבל תשובות מדויקות תוך זמן סביר.
ואם זה נשמע פשוט - זה לא. זה ממש לא פשוט וגם לא זול.
אסטרטגיית הקירוב
בלימודי הפיזיקה בתיכון למדנו לחשב את המיקום, המהירות והתאוצה של אובייקט ברגע נתון, לאחר שמופעל עליו כוח מוגדר. אולם חלק גדול מאוד מתופעות הטבע - בין אם ברמה התת-אטומית ובין אם ברמה האסטרונומית - אינן ניתנות לחישוב ישיר על ידי נוסחאות, או שהחישוב הנדרש מסובך מדי. "בעיית שלושת הגופים" (three-body problem), לדוגמה, היא בעיה מוכרת בפיזיקה. חישבו על שלושה כוכבי לכת מספיק קרובים כדי שתהיה להם השפעה כבידתית הדדית. לכל אחד מהם יש מהירות התחלתית נתונה. האם תוכלו לחשב היכן יהיו הגופים לאחר פרק זמן נתון?
בעיה זאת העסיקה מדענים רבים במשך שנים רבות ולא נמצא דרך לפתור אותה באופן אנליטי (כלומר, על ידי חישוב נוסחאות) אלא רק עבור מקרים ספציפיים.
מה כן ניתן לעשות? לדמות את התהליך במחשב. למשל, ניתן ליצור מודל של השפעת הכבידה של שני גופים על גוף בודד ברגע נתון. המיקום של שלושת הגופים מאפשר לנו לחשב את הכוח המופעל עליו ולכן גם את התאוצה שלו. אם נפעיל מודל כזה עבור כל אחד משלושת הגופים בנפרד, נוכל לחשב קירוב של המיקום שלהם בכל זמן בעתיד. כיצד? נתחיל מהמצב ההתחלתי ונחשב את המיקום שלהם בצעדים בדידים (למשל, כל צעד מייצג שנייה בעולם הפיזיקלי). נחשב עבור כל אחד מהגופים את המיקום שלו אחרי צעד אחד בהנחה ששני הגופים האחרים נמצאים במקום ולא זזים. עכשיו יהיה לנו קירוב של המיקום החדש של שלושת הגופים. על התהליך הזה ניתן לחזור כמה פעמים שרק רוצים ולחשב בקירוב את המיקום של הגופים גם אחרי זמן רב.
למרות שהמודל הזה הוא פשטני יחסית למה שעושים בפועל, הוא ממחיש את אסטרטגיית הקירוב על ידי חישוב מקורב בצעדים בדידים, אשר ניתן לבצע אותו באופן מקבילי.
חישוב מקבילי מסיבי
ואכן, כאן נכנס לתמונה הצורך בחישוב מקבילי מסיבי. את הדוגמה לעיל ניתן לחשב באופן סדרתי על מחשב אחד, או מהר יותר על ידי הרצה במקביל של המודל שלוש פעמים - פעם אחת לכל גוף, כל הרצה על "ליבת מחשב" משלה, אשר מעבירה וקולטת הודעות מהליבות האחרות. ליבה - core - היא ה"מוח" של המחשב, החלק האחראי על החישובים. מחשבים בחוות מחשבים (אשר נקראים "שרתים") מכילים על פי רוב כמה עשרות או מאות ליבות, שיכולות לעבוד במקביל (חוות המחשבים הראשית של הטכניון, למשל, מכילה מעל 11,000 ליבות על בסיס מספר רב של שרתים המחוברים ביניהם בתקשורת מהירה, ויש חוות מחשבים נוספות בחלק מהפקולטות). עד עכשיו דיברנו על שלושה גופים, אבל מה לגבי הדמיה של 1,000 גופים? במקרה כזה נדרשות 1,000 ליבות שיעבדו במקביל ויתקשרו ביניהן.
אפשר לדמות חוות מחשבים גדולות לטלסקופ - הגודל שלו מאפשר לראות רחוק יותר, ולכן התחרותיות של אוניברסיטה דוגמת הטכניון תלויה במידה רבה במשאבי המחשוב שלה.
יתרון לחוקרים עם משאבי מחשוב רבים יותר
בנקודה זאת כדאי להזכיר את מהפכת ה-AI. לטכניון יש מקום בולט בעולם בתחום זה (הטכניון דורג לאחרונה כראשון באירופה על ידי מדד CS—RAnkings בתחום ה-AI על סמך פעילותו ב-20 שנה האחרונות). מהפכה זו משפיעה כמעט על כולנו, אבל לא כולם מודעים לעלויות הכרוכות בפיתוח שלה. ה-AI המודרני מבוסס על אימון של "רשתות נוירונים" - מודל מתמטי שמאפשר "למידת מכונה" (Machine Learning) על סמך דוגמאות רבות (למשל, ניתן ללמד את המחשב לזהות עצמים בתמונה על ידי חשיפה שלו לאלפי דוגמאות - בין אם אלה הולכי רגל עבור נהיגה אוטונומית או סוג פרח עבור מדריך פרחים).
החישובים האופייניים לתהליך כזה נעשים בצורה הרבה יותר מהירה על גבי מעבדים מיוחדים הנקראים Graphical Processing Units (GPUs). הם שונים במבנה שלהם מהמעבדים הרגילים (CPUs) שיש לכולנו במחשב. בלי להיכנס להבדלים הטכניים בין שני סוגי המעבדים האלה, נזכיר רק ששוק ה- GPU נמצא בשליטה כמעט מוחלטת של אנבידיה (Nvidia), מה שמסביר את העלייה המטאורית בשווי השוק שלה בשנים האחרונות. עלות של מעבד מהדור החדש שלהם (אשר מכיל בעצמו מספר כרטיסי GPU) עוברת את הרבע מיליון דולר. יתרה מכך, גם אם הסכום כבר בידך תיאלץ להיכנס לרשימת המתנה ארוכה כדי לרכוש מעבדים כאלה (זמן אספקה של מעל לחצי שנה) בגלל הדרישה העולמית המסיבית שקצב הייצור אינו יכול לספק. לטכניון יש פחות מ-100 ליבות GPU למטרות מחקר.
המחסור כל כך משמעותי, עד שאפילו ניסיון לרכוש שעות מחשוב בחוות המחשוב העצומות של הספקים הגדולים, כגון אמזון ומיקרוסופט, נתקל לא פעם בקשיים מרובים ובעלויות גבוהות עקב המחסור העולמי בהיצע של חומרה מתאימה. כתוצאה מהעלויות והמחסור, גם כאן יש יתרון רב לחוקרים שיש להם גישה למשאבי מחשוב רבים יותר, וזו אחת התשובות לשאלה מדוע הטכניון משקיע סכומי עתק בהגדלת היצע הליבות שלו.
לסיכום, המדע הניסויי של המאה ה-21 אינו מתרחש רק במעבדה הרטובה או מול מכשירי מדידה, אלא יותר ויותר בעזרת חוות מחשבים עצומות ובמעבדי GPU מתקדמים. היכולת לענות על שאלות מדעיות מורכבות ולבצע למידת מכונה על בסיס רשתות נוירונים תלויה כיום בעוצמת החישוב הזמינה לחוקרים. אלא שמשאבים אלה יקרים והגישה אליהם הופכת לגורם מכריע ביכולתן של אוניברסיטאות ומדינות להוביל מחקר וחדשנות. בעולם שבו חישוב מקבילי מסיבי הוא הטלסקופ החדש של המדע, עוצמת המחשוב אינה רק תשתית טכנית - היא תנאי יסודי למצוינות אקדמית ולהובלה מדעית.
הכותב הוא חבר סגל בפקולטה למדעי הנתונים וההחלטות בטכניון ועד לאחרונה סגן המשנה לנשיא למערכות מידע ומחשוב






