גל שני של קורונה, או: פרשנות יתר של נתונים בעייתיים

הכותרות על גל שני של קורונה מתבססות על עלייה ניכרת במספר המאובחנים החל בשבוע האחרון של מאי. הבעיה היא שמשרד הבריאות לא מפרסם באופן מסודר את מדיניות הבדיקות, ומה הפילוח של הסיבות לביצוען. בלי המידע הזה אין אפשרות אמיתית לפענח מה נתוני הקורונה בישראל אומרים

דרור פייטלסון
דרור פייטלסון
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
דרור פייטלסון
דרור פייטלסון

כבר חודשיים שלא הסתכלתי על נתוני קורונה בישראל. הנתונים שמשרד הבריאות הואיל לפרסם על מגפת הקורונה היו כל כך בעייתיים, אז החלטתי שלנסות לנתח אותם יהיה בזבוז של זמן. למרות זאת, הכותרות בנוגע לגל שני של קורונה חייבו אותי לבדוק אותם בכל זאת. הרי חודשיים מהווים תקופה מספיק ארוכה לשפר את המצב, אז אולי כעת אפשר להסתמך על הנתונים ולהגיע למסקנות מבוססות. התשובה היא שעושה רושם שלא.

הנה הנתונים המעודכנים לתקופה שהחלה במארס והסתיימה אתמול (ב'). זה גרף אחד שמשווה את מספר הבדיקות שבוצעו בכל יום, מספר החולים החדשים שאובחנו בכל יום, מספר החולים קשה בכל יום (לא רק החדשים), מספר החולים המונשמים בכל יום (לא רק החדשים) ומספר הנפטרים בכל יום.

כיוון שמספר הבדיקות גדול ממספר המתים, צריך להשתמש בסקלה לוגריתמית כדי להראות את הנתונים יחד. תזכורת: בסקלה כזו כל עליית מדרגה מייצגת הכפלה של פי עשרה. כך שבקצה העליון שינויים שנראים קטנים הם בעצם ענקיים. בהמשך נשתמש גם בסקלה לינארית רגילה.

בדיקות ומקרי קורונה

הכותרות על גל שני של קורונה מתבססות על עלייה ניכרת במספר המאובחנים החל בשבוע האחרון של מאי: מרמה של 10 מאובחנים עד 30 מאובחנים ליום לפני כן, לרמה של 100 מאובחנים ביום בתחילת יוני ואפילו 300 מאובחנים ביום באחרונה. השאלה הגדולה היא מה העלייה הזו אומרת? אפשרות אחת היא שיש עלייה במספר הבדיקות או במיקוד שלהן. אפשרות שנייה היא שיש גל שני של תחלואה.

הבעיה היא שקשה מאוד להפריד בין שתי האפשרויות האלה. העלייה באבחונים בחודש מארס היתה מתואמת לגמרי עם העלייה במספר הבדיקות. לכן היה סביר לטעון שאי אפשר להסיק ממנה שיש עלייה בתחלואה. אבל שבוע מאוחר יותר התחילה עלייה גם במספר החולים קשה ובמספר המונשמים, ושבועיים אחרי זה התחילה עלייה במספר המתים. כך שבדיעבד אנחנו יודעים שאכן היה גל של תחלואה בקורונה (אם כי הרבה פחות משמעותי ממה שהיה צפוי לפי התחזיות המפחידות שפורסמו מוקדם יותר). אבל מה שקורה בחודש האחרון שונה ממה שקרה במארס.

החלק המדאיג הוא שנראה שמספר האבחונים גדול יותר ממספר הבדיקות. נתחיל עם הבדיקות. הגרף הבא מראה את מספר הבדיקות בסקלה לינארית רגילה. כפי שאפשר לראות, מספר הבדיקות במאי ירד והלך. דבר זה יכול אולי להסביר את הירידה במספר האבחונים. אפשר גם לראות שמבצעים הרבה פחות בדיקות בסופי שבוע, ובהתאם יש גם פחות אבחונים. בתחילת יוני מספר הבדיקות זינק (שוב, חוץ מבסופי שבוע).

השאלה היא האם זה מסביר את העלייה באבחונים? כדי לקבל תמונה יותר טובה, כדאי להסתכל על אחוז הבדיקות החיוביות, כלומר על היחס בין מספר האבחונים לבין מספר הבדיקות. אם היחס הזה קבוע, נסיק שיכול להיות שמספר האבחונים הגדל נובע רק מעלייה במספר הבדיקות. אבל אם היחס גדל, כלומר מספר האבחונים גדל מהר יותר ממספר הבדיקות, זה כבר חשוד. הנה הנתונים.

בדיקות חיוביות באחוזים

אז אכן בשבועות האחרונים מספר האבחונים גדל מהר יותר, ובנוסף יש שיא של אבחונים בסוף מאי - עוד לפני העלייה הגדולה בבדיקות. הנתונים האלה הם הבסיס להתראות על הגל השני, אבל הגידול באבחונים הרבה יותר קטן ממה שהיה במארס ואפריל.

יש גם נתונים אחרים, שסותרים את החשש הזה. נחזור לגרף הראשון. כפי שראינו בנתוני מארס, שבוע אחרי העלייה באבחונים היתה עלייה במספר החולים הקשים ובמונשמים. שבועיים אחרי זה היתה עלייה במספר המתים. בחודש האחרון, לעומת זאת, כמעט שאין שינוי במספר החולים קשה ומספר המתים. אז יש לנו עלייה באבחונים, אבל אין לה (לפחות בינתיים) השפעה על התחלואה המשמעותית.

אז מה כל זה אומר? כאן אנחנו חוזרים לבעייתיות של הנתונים. עלייה במספר האבחונים בלי עלייה אמיתית בתחלואה יכולה לקרות משתי סיבות: או שמבצעים יותר בדיקות, או שהבדיקות נעשות בצורה ממוקדת יותר במוקדי תחלואה קיימים. זה כנראה מה שקורה, למשל, עם הבדיקות שנעשו באוכלוסיות הקשורות לבתי ספר שבהם היו התפרצויות של המחלה.

הבעיה היא שמשרד הבריאות לא מפרסם באופן מסודר את מדיניות הבדיקות, ומה הפילוח של הסיבות לביצוען. בלי המידע הזה אין אפשרות אמיתית לפענח מה הנתונים אומרים. מהבחינה הזו אנחנו באותו מקום שהיינו בו לפני חודשיים.

דרור פייטלסון

דרור פייטלסון | אטלס למאה ה-21

פרופסור למדעי המחשב באוניברסיטה העברית. אספן של כל מיני דברים, ובפרט של נתונים ומספרים. אוהב לנסות להסביר דברים בצורה שקל להבין אותם, ובמיוחד אוהב כשזה מצליח ומישהו פתאום מבין משהו חדש. הבלוג הזה משלב את שני הדברים, ויתמקד בהצגה גרפית של נתונים כדי לחשוף מה אפשר להבין מהם. שואף להקשות על כל מי שמנסה לרדד ולהטות את השיח הציבורי על ידי טענות בלתי מבוססות והפצת פייק ניוז. מאמין גדול בכך שיכול להיות כאן הרבה יותר טוב.

חלק מהטורים מבוססים על הספר "עידן הימין: ישראל 2018-1977 בראי הנתונים", שפורסם בתחילת 2019. בספר יש גם הפניה למקורות הנתונים.

תגובות