עולם מחשוב העל נכנס לעידן חדש

המסע להאצת ביצועי המחשב נמשך עם ההבנה כי התזוזה בהשגת ביצועים עוברת כעת מהחומרה אל התוכנה. מרכז המצוינות החדש של Intel oneAPI בטכניון יסייע בהכשרת הדור הבא של חוקרי ומפתחי מחשוב עתיר-ביצועים, באמצעות הרחבת השימוש בתכנות חוצה-ארכיטקטורות בהוראה, מחקר ופיתוח

ד"ר גל אורן
תוכן שיווקי
שתפו כתבה במיילשתפו כתבה במייל
מחשב אורורה
מחשב אורורהצילום: אינטל
ד"ר גל אורן
תוכן שיווקי

ביוני 2022, ולאחר ציפייה של יותר מעשור, עולם מחשוב העל (Supercomputing) נכנס לעידן חדש: מחשב "פרונטיר" (Frontier) שנחנך במעבדה הלאומית אוק רידג' בארה"ב צלח את מבחן פתרונות המשוואות הסבוך HPL ונכנס לצמרת רשימת המחשבים החזקים בעולם (TOP500), עם עוצמת חישוב מצרפית אחודה של 1.102 אקסה (10 בחזקת 18, או 1,000,000,000,000,000,000) פעולות עשרוניות המבוצעות תוך שנייה בודדת. המחשב משמש לפריצות דרך מדעיות ולפיתוח טכנולוגיות חדישות בכל תחום כמעט שבו מחשב יכול לעזור - מהבנת מנגנוני אנרגיה נקייה, דרך גילוי תרופות ועד הנדסת חומרים חדשניים. המחשב הבא שעתיד להיחנך בסקאלה דומה יהיה מחשב "אורורה" (Aurora) במעבדה הלאומית ארגון בארה"ב, עם עוצמה משוערת של פי-שניים ויותר מ"פרונטיר". האמונה המבוססת היטב היא שגם לסינים יש כבר מחשבים שכאלו.

ד"ר גל אורןצילום: חן ברזל

התמקדות בארכיטקטורות חומרה חדשות
הדרך לפסגה זו, הבלתי ניתנת לתפישה, הושגה בעמל רב. להבדיל ממחשבי העל מהדורות הקודמים, במהלך 25 השנים הראשונות של עידן המחשוב עתיר-הביצועים

(High-Performance Computing) צמיחת כוח החישוב הושגה כמעט אך ורק על סמך העלייה המעריכית בכמות הפעולות שמעבד יחיד מסוגל לבצע, ומהתגשמותן של התחזיות הטכנולוגיות המכונות חוק מור (Moore) - הידוע מאוד - וחוק דנארד (Dennard), המוכר פחות. דנארד ניבא ב-1974 כי ככל שהטרנזיסטורים הולכים וקטנים, צפיפות ההספק שלהם תיוותר קבועה. כתוצאה, ניתן אף יהיה להגדיל את תדרי השעון, להזין עוד ועוד פקודות לביצוע, והביצועים יעלו ברציפות. בנוסף, ב-1994 נוצרה יכולת נוספת לעלייה בביצועים כאשר ניתן היה, באופן פשוט יחסית, להשתמש בכוח המצרפי של מעבדים אלו על-ידי ממשקי הודעות ביניהם. כך, לדוגמה, אם על מעבד יחיד, עם כמות זיכרון מסויימת, ניתן היה לאכלס חישוב אקלימי ברזולוציה גסה, או רק עבור שטח מסומלץ קטן יחסית, באמצעות מעבדים רבים המסוגלים לדבר ביניהם ניתן היה לבצע את אותו החישוב (וכמעט באותו הזמן יחסית) ברזולוציה עדינה יותר, או עבור שטח מסומלץ גדול בהרבה.

עם זאת, "חוק דנארד" חדל מלהתקיים בשנת 2005 משיקולים פיזיקליים והביא למצב בו למרות ש"חוק מור" אינו נעצר (כל מספר שנים כמות הטרנזיסטורים מכפילה את עצמה) הביצועים לא עולים באותה המידה, וצמיחת האנרגיה אינה בת-קיימה במעבד יחיד. בהתאם, וכדי לשמר את העלייה הכוללת בביצועים, תעשיית השבבים התמקדה בארכיטקטורות חומרה חדשות, תוך שיפור סכמות התוכנות כדי שיתאימו לאותן חומרות ייעודיות, שהפכו כמובן מורכבות יותר ויותר. אחד השינויים החשובים בהקשר זה היה המעבר לריבוי-ליבות (Multi-core) במעבד יחיד. תוך שנים ספורות התעשייה אף הציגה חומרות חדשות בעלות מספר רב (מאות ואף אלפים, Many-core) של ליבות בעלות תדר נמוך יותר מליבת חישוב "רגילה", כאשר המטרה הייתה להרוויח את הביצועים מהמקביליות.

כך נולד עידן המאיצים והמעבדים הגרפיים לצורכי עיבוד כלליים (GPGPUs), שרשם פריצות דרך מדהימות עבור עולם הבינה המלאכותית בכלל והלמידה העמוקה בפרט. כלל התקדמויות אלו יצרו עידן חדש בו המחשוב ההטרוגני - שילוב של מספר ארכיטקטורות חומרה במחשב אחד - הינו הדרך המרכזית להמשך העלאת הביצועים. אולם, כדי לנצל את מלא הפוטנציאל של הארכיטקטורה, נדרשים מעתה שינויים גדולים ומהותיים בחישובים עצמם ובדרך קידודם. "תם עידן ארוחות הצהריים בחינם", ככותרת המאמר רב ההשפעה מ-2005.

ביצועים חסרי פשרות עבור מחשוב מואץ
ההבנה כי התזוזה בהשגת ביצועים עוברת כעת מהחומרה אל התוכנה חלחל לכל התעשייה, ולאחרונה אינטל הגדילה לעשות ושחררה בקוד פתוח את כלל התשתיות הנדרשות על מנת לעבוד על חומרה הטרוגנית שכזו, בין אם מתוצרתה ובין אם מתוצרת חברה אחרת. תשתית זו נקראת oneAPI. oneAPI הוא מודל תכנות פתוח, מאוחד, חוצה ארכיטקטורות עבור CPUs וארכיטקטורות מאיצים (GPGPUs, FPGAs ואחרים). מבוסס תקנית, מודל התכנות מפשט את פיתוח התוכנה ומספק ביצועים חסרי פשרות עבור מחשוב מואץ ללא נעילה קניינית, תוך מתן אפשרות לשילוב של קוד קיים. עם oneAPI, מפתחים יכולים לבחור את הארכיטקטורה הטובה ביותר לבעיה הספציפית שהם מנסים לפתור, בלי צורך לשכתב את התוכנה לארכיטקטורה ולפלטפורמה הבאה.

יחד עם שני מומחים ישראלים מובילים עולמית במחשוב מקבילי ומבוזר - פרופ' חגית עטיה, מהמחלקה למדעי המחשב בטכניון, ופרופ' דני הנדלר, מהמחלקה למדעי המחשב באוניברסיטת בן-גוריון בנגב - ובשיתוף עם חברת אינטל ודירקטור oneAPI בישראל, גיא תמיר, שמחנו להכריז לאחרונה על הקמת מרכז המצוינות של oneAPI בטכניון כדי לאפשר לימודים ומחקרים במחשוב מדעי עכשווי, תוך שימוש בכוחם של מעבדים ומאיצים מסוגים שונים עם oneAPI כתכנות חוצה ארכיטקטורה.

הזדמנויות חדשות לשיפור ביצועים
כדי לפתח את הדור הבא של חוקרי ומפתחי מחשוב עתיר-ביצועים (HPC) אנו משתמשים בטכניון בתכנות חוצה ארכיטקטורות באמצעות oneAPI, תוך שימוש בענן המפתחים oneAPI של אינטל (Intel DevCloud). המרכז מתרחב אף לאוניברסיטאות מובילות אחרות (כדוגמת תל-אביב ובן-גוריון) באמצעות קורס מקיף וחדש שפיתחנו (יחד עם הדוקטורנט יהונתן פרידמן, שגריר-סטודנט של oneAPI), המכסה את האפשרויות הבסיסיות והמתקדמות של שימוש ב-oneAPI ו-OpenMP עבור מקבול משתף זיכרון, במיוחד עם מאיצים.

מרכז המצוינות אף חוקר הזדמנויות חדשות לשיפור ביצועים באמצעות חומרות חדשות התומכות בארכיטקטורת זיכרון משותף בין מעבדים ומאיצים. לימודים אלו הם הרחבה טבעית להובלה ארוכת השנים של הטכניון במחשוב מקבילי. המרכז מקדם גם פרויקטי קוד (שניים כבר בקוד פתוח), מזהה ומקדם יישומי HPC/AI בקוד פתוח דרך oneAPI באמצעות OpenMP, ומייעל את ביצועיהם. בנוסף להרחבת בסיס הקוד התומך ב-oneAPI, גישה זו מכינה את הסטודנטים שלנו לעתיד (שהוא כבר הווה) של מחשוב הטרוגני.

הכותב הוא מדען אורח בפקולטה

למדעי המחשב ע"ש טאוב בטכניון