תיק מניות

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

לרשימת הקריאה המלאה לחצו כאן

דוקטור, השרתים הבריאו

תשתית הניטור (SCOM System Center Operations Manager 2012) של חברת מיקרוסופט הותקנה באלפי שרתי שירותי בריאות כללית. אבל עוד לפני ש'הדש-בורדים' הראשונים החלו לספק נתונים, חלק מהבעיות הטכניות במערכות נפתרו. סיפור על הטמעת תשתית בארגון יוצא דופן.

על המוניטור במשרדו של משה בלקר, מנהל תחום Systemו-DBA בשירותי בריאות כללית מרצדים קווים צבעוניים. חלקם מזנקים בחדות מעלה, אחרים צונחים בחדות מטה. בלקר, 38, קשוב לקווים הללו כמו קרדיולוג הבוחן את לבו של פציינט: הקווים הללו, למשל, מנטרים את היקף השימוש במשאב הזיכרון בשרתי הארגון, והם חלק ממידע הזורם באופן קבוע למשרדו ברחוב ארלוזורוב בתל אביב, מידע המייצג את ליבה הפועם של מערכת התשתיות האדירה של שירותי בריאות כללית. אם משהו יתקלקל שם ולא יטופל במהירות אלפי אנשי צוות רפואי במאות מתקני הקופה ברחבי הארץ, מדן ועד אילת, יהיו חסרי אונים בנגישות למערכות המידע המשמשות אותם.

המידע המנוטר על המחשב של בלקר ובמחשבים נוספים ביחידה אותה הוא מנהל הוא פרי עבודה מאומצת שהתבצעה בשנה החולפת להטמעת תשתית הניטור SCOM של חברת מיקרוסופט (ראשי תיבות של: System Center Operations Manager) בגרסת 2012. "יזמתי ונטלתי חלק נכבד בהובלה של הפרויקט שהחל באפריל 2012 ונמשך למעלה משנה" מספר בלקר. "היוזמה לפרויקט נבעה מכך שהיקף התשתיות בשלוש - ארבע השנים האחרונות גדל בקצב מהיר ביחס ישיר לדרישות העסקיות של הארגון. אגף מערכות המידע שלנו מתפעל מערך מחשוב מורכב ועתיר טכנולוגיות במטרה לספק את שירותי הארגון למיליוני לקוחות ברמת השירות הגבוהה ביותר .החשיבות של זמינות השירותים התעצמה ולכן נדרשנו לשפר את מוטת הניהול והשליטה במשאבי המחשוב ולקבל תמונת מצב עדכנית ומהימנה של השירותים העסקיים – "דופק תשתיתי בזמן אמת".

המלים גדול או אדיר לא מתחילות בכלל לתאר את היקף השירותים שהתשתית נדרשה לנטר. שירותי בריאות כללית הוא ארגון הבריאות הגדול והמתקדם בישראל המספק שירותים רפואיים ליותר מ־4 מיליון לקוחות. על הגודל והעוצמה של הכללית, שעיצבה את רפואת המשפחה בקהילה במשך 100 שנות פעילותה כארגון הבריאות המוביל בישראל אפשר ללמוד מהיקף השירותים ופריסתם ברחבי הארץ: יותר מ־1,300 מרפאות ו- 14 בתי חולים שמקיימים קשר מקצועי רצוף עם מיטב המומחים בקהילה, כ־420 בתי מרקחת, שמעניקים שירותי בלעדי ללקוחות הכללית, מאות מכונים ומעבדות וצוות מיומן ומקצועי הכולל אלפי רופאים, אחיות, רוקחים, עובדים פרא־רפואיים ועובדי מינהל.

לפני שנתיים זיהה בלקר כי מערך השליטה ובקרה הקיים כבר לא מספק מענה לדרישות העסקיות: "הניטור התבסס על ידע פנימי של אנשי תשתיות והיה חלקי. כך למשל היו תשתיות ליבה החיוניות לארגון שלא היו מנוטרות בכלי השליטה והבקרה הקיימים. תשתית יציבה הינה חיונית לתמיכה בצרכים המשתנים של ארגון ולהבטחת רמת זמינות גבוהה של מערכות המידע, מכך נובעת החשיבות העצומה בהקמת מערכת שליטה ובקרה אמינה, מרכזית, קלה לתפעול ומתן מענה ברמה העיסקית.

מערכות הכללית הן מערכות שכמעט כולנו נתקלים בהם במהלך חיינו: התיק הרפואי, מערכת המעבדות, מערכת זימון תורים או מערכת חדרי הניתוח. מאחר והקופה עוסקת בבריאות של בני אדם מרווח הטעות קטן מאוד. בלקר מספר על דוגמה בה קריסה של אחת המערכות עלול ליצור אי נעימות רבה : " מערכת המעבדות שלנו משרתת מדי יום אלפי לקוחות שמגיעים לבצע בדיקות, ביניהם לקוחות שדחו סידורים ועבודה. רבים מהם מבצעים בדיקות דם והם אחרי צום, ניתן רק לתאר מה ההשלכות כאשר מערכת קריטית כזו אינה זמינה בשבע בבוקר. כיום בעזרת תשתית SCOM אנו מזהים בעיה כזו בלילה, הכוננים יקבלו את ההתראה ויטפלו בה עוד לפני שמגיעים אלפי הלקוחות בבוקר".

בכללית החליטו איפוא להחליף את מערכת הניטור הקודמת ולהתקדם ל SCOM: " הארגון הולך לתפיסה של ניטור תהליכים עסקיים מקצה לקצה, ו-SCOM מהווה אבן יסוד מרכזית בתפיסה הזו . רצינו להשיג יכולות ניטור גמישות בהתאם לצרכי הניטור שמגיעים מהשטח, דו"חות היסטוריים על זמינות של שירותים ותשתית אחת לניטור כל הסביבות עד רמת השירותים העסקיים. בחרנו במיקרוסופט כי הארגון שלנו פועל בסביבה הטרוגנית , גם אם הוא בעיקר מבוסס מיקרוסופט, והפתרון של מיקרוסופט אכן תומך בסביבה זו. לכן חיפשנו מצד אחד - פתרון מבוסס חבילות ניטור שמותאמות על ידי ספקים אחרים, ומצד שני – פתרון שיאפשר גם לנו בכוחות עצמנו לפתח חבילות ניטור באופן פשוט ואינטואיטיבי למען הצוותים בשטח".

התנעת הפרויקט

במערכות כה מורכבות נהוג לבצע פיילוט לפני שמקבלים החלטה על בחירה ויציאה לדרך. בלקר מסביר כי במהלך הפיילוט הוא ביקש לוודא שהתשתית תתאים לאתגרים שהציב לה: "צוות השליטה והבקרה הוא יחסית קטן בעוד שמערך המחשוב ענק. האתגר שלי כמנהל היה להגדיל את יכולת השליטה והבקרה מבלי להגדיל את הוצאות התקורה השוטפות. זה היה אחד המדדים המרכזיים שבחנו בפיילוט שביצענו עם מיקרוסופט, וזה הוכיח את עצמו: אם בעבר עבור הוספת יכולת ניטור למערכת קיימת נדרשו מספר ימים, בעזרת SCOM זה קורה בתוך מספר שעות".

לאחר שהתקבלה ההחלטה לצאת לדרך, המשימה הוטלה על בלקר, שצוותו המונה ארבעים עובדים גויס כולו למשימה. שניים מתוכם צבי אורצקי, ראש צוות שליטה ובקרה ומשה עובדיה עבדו בהטמעה על בסיס יומי. לדברי צבי אורצקי: "במהלך הפרויקט הצלחנו להתגבר על האתגרים בזכות הגיבוי מהנהלה ושיתוף הפעולה של כלל צוותי הסיסטם ברחבי הארץ"

לצדו פעל קובי לוי, יועץ בחטיבת ה-Services של חברת מיקרוסופט. הוא מצביע על הייחודיות של הפרויקט: " בארגונים רבים קיימות מספר חוות שרתים נפרדות כשלכל אחת ניטור משל עצמה. בכללית בחרנו לעבוד במודל שיאפשר ניהול מרכזי של חוות שרתים אחת גדולה מאוד הכוללת אלפי שרתים וסביבות שונות באמצעות תשתית אחת מבוזרת של Operations Manager. גרסת 2012 של Operations Manager מביאה איתה חידושים רבים בניטור מערכות שאינן מבוססות Windows. תשתית הניטור בכללית תוכננה על מנת לאפשר לכללית להתמודד עם סוגים שונים של כשלים והתאוששות מאסון (Disaster recovery). הפרויקט הוביל את הארגון להבנה שתהליכי ניטור מתחילים עוד לפני שקיימת בכלל תשתית ניטור: הרעיון הוא שקיים שיח עם המפתחים וקבוצות הניהול של האפליקציה שמוביל להבנת התהליך העסקי וכיצד ניתן לנטר אותו".


גורם נוסף שלקח חלק בפרויקט הענק הוא חברת NESS. לדברי עידן יונה, מוביל פעילות System Center בחברה, העבודה שלהם על הפרויקט החלה לפני למעלה מ-6 חודשים. הוא מפרט את צורת העבודה: "בשלב ראשון הוקמה בשרתים המרכזיים תשתית שכללה מערכת ניהול (Operations Manager). למערכת זו נבנתה יכולת התאוששות מקריסה (ובעגה המקצועית: Disaster Recovery) הכוללת גרסה זהה, המותקנת באתר גיבוי. המשמעות היא שאם האתר המרכזי ששולט במערך הניטור נופל נשמרת יכולות הניטור והמשך עבודה באתר הגיבוי".

"בשלב לאחר מכן התחלנו בהתקנת התוכנות (הסוכנים או ה-Agents) על שרתי הכללית. שלב זה כלל תהליכים של תיקון וקיטלוג של שרתי הכללית וכלל טיפול בבעיות שזוהו בעזרת מערכות הניטור. צוות הכללית טיפל בהן. החלק המרתק הוא שברגע שמתקינים מערך ניטור צפות בעיות שלא היו מודעים להן כגון עדכונים חסרים, תוכנות אנטי-וירוס לא מעודכנות וכו'".

מי אחראי פה?

יונה מדגיש כי אחד האתגרים היה התמודדות עם שיוך המערכות: "התשתית
לא יכלה להתחמק מהתמודדות עם השאלה מי בעצם אחראי לכל שרת, לכל שירות, ומה רמת הדחיפות לכל פעולה כזו. למעשה התקנת תשתית הניטור הפעילה תהליך קטלוג מקיף בתוך הכללית שסיווג שרתים לקטגוריות של פיתוח, בדיקה וייצור, וקבע מי הצוות האחראי לכל שרת ושרת".

כדי לעמוד במשימה הלא פשוטה והסיזיפית הזו הם נקטו ביצירתיות רבה: " עבדנו מול צוותי הסיסטם השונים ברחבי הארץ והייתה התגייסות מאוד יפה שלהם לסייע בתהליך. בשלב הראשון נעזרנו ברשימת הקטלוג של השרתים שהייתה כבר קיימת. בשלב השני בדקנו את השרתים שלא קוטלגו ופנינו לצוותים בשטח שיעזרו לנו לקטלג אותם. לפני כניסת תשתית הניטור הקטלוג לא היה מוסדר כיוון שלא הייתה לכך משמעות אמיתית בחיי היום יום ולכן לא לכל השרתים הוגדרה 'רמת קריטיות' רלוונטית (,SLA או: Service Level Agreement) כך שלא הצוותים בשטח ולא אנחנו ידענו מה מידת הדחיפות לטפל במקרה של תקלה. עד כמה מהר צריך ללכת ולטפל. מערכת הניטור היא זו שהעניקה משמעות למונח 'רמת קריטיות לשרת'. הם למעשה עברו על השרתים שהם יודעים שהם אחראים עליהם וסימנו מה שלהם".

לרשותו של בלקר נמצאים לוחות מכוונים שמאפשרים לראות איזה רכיב נפגע בשירות העסקי מבין סבך של שרתים, בסיסי נתונים ומערכים שונים: "אנחנו מקבלים הרבה מאוד התראות. מה עושים בסיטואציות כאלו? מה אתה רוצה לראות ומה לא? גם בהיבט הזה נעשתה הרבה עבודה. לשם המחשה, כדי להטמיע חבילת ניטור SCOM בשירותי הדואר יש לערב את מערך בסיסי הנתונים, את אנשי הדואר האלקטרוני".


חלק נוסף בתהליך שעומד בפני סיום הוא הטמעת מערכת ניטור נפרדת בכל בית חולים עצמו. המטרה שבמצב של שבר, במקרה שבית חולים מתנתק מתקשורת מול מערכת הניטור המרכזית , שירותי התפעול הפנימיים בבתי החולים עדיין יהיו מנוטרים.

השלמת התהליך

לדברי לוי, בשבועות האחרונים הם עובדים על השלב הבא של הפרויקט: אפיון סוגי ה'דשבורדים' (Dashboards), שיציגו את האינפורמציה המדויקת לשירות מסוים ולאדם מסוים: "יש כאלו שמעניין אותם האם היחידה מקבלת את השירות, ופחות חשוב מה עובד ומה לא עובד. התצוגות יכולות להיות יותר טכניות ופחות טכניות. מנהל יקבל מידע מגובה עשרת אלפים רגל, ואילו אנשי ה-IT מגובה אפס, ויתמקדו במה הבעיה וכיצד לפתור אותה".

לקראת השלמת התהליך לוי גם לא שוכח להחמיא לכללית: " התהליך בכללית בוצע בצורה מרשימה תוך התגייסות של כל המעורבים, הפרויקט החל בבניית מסמך המגדיר את צרכי כללית והיעדים אליהם אנחנו אמורים להגיע, לכל שלב הוגדרו אבני דרך ודרכי מימוש דבר שהוביל למימוש מוצלח של הפרויקט, כחלק מתפקידנו חשפנו את כללית לאתגרים והתמודדויות של ארגונים אחרים בארץ ובעולם בפרויקטים מסוג זה.".

אל לוי מצטרפת חגית ליבוביץ, מנהלת הלקוח במיקרוסופט: "בשירותי בריאות כללית – בריאות מערכות המידע קריטית והכרחית עבור בריאות המטופלים והשירותים הנתמכים. מערך הניטור החדש מבוסס מיקרוסופט, מצטרף לשורה ארוכה של תשתיות מיקרוסופט בארגון, אשר מספקות פלטפורמה הוליסטית עבור מערכות רובסטיות וקריטיות בסביבת עבודה מאתגרת, דינאמית וחיונית כבשל כללית.
מימוש הפרויקט יד ביד, ייצר מחויבות, שקיפות ושיתוף פעולה מצד כל המעורבים, והיווה בסיס יציב להצלחת הפעילות".

גם בלקר מתפנה לסכם את האתגרים עמם התמודדו: "אתגר אחד הוא יישום ניטור של מערך ה ERP מבוסס SAP. זו אחת מהסביבות הגדולות של ERP בארץ, ועשינו את זה עם מוצר משלים של חברת OZSOFT. אתגר שני הוא המימוש של פריסה וניטור אלפי שרתים בכללית, מדן ועד אילת, באתרים מסוגים שונים ממוקדי שירות ועד בתי חולים. האתגר השלישי הוא לעשות את כל זה תוך מיזעור זמן ההשבתה של המערכות.

מערכת השליטה והבקרה החדשה תשפר באורח משמעותי את השירות למשתמשים וכן את השירות לקהל לקוחות שירותי בריאות כללית.


 

כתבות ראשיות באתר

כתבות שאולי פיספסתם

*#