אנחנו לא יודעים כמה חולים יש, וזה רע מאוד

מנתוני משרד הבריאות עולה כי יש מתאם מצוין בין מספר המאובחנים לבין מספר הבדיקות שהמשרד מבצע. כלומר, מספר המקרים תלוי בכמות הבדיקות ולא משקף בהכרח את המצב ■ לכך יש השלכות חמורות על הסקת המסקנות וההתמודדות עם המשבר המתמשך

דרור פייטלסון
דרור פייטלסון
שתפו בפייסבוק
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקיםכתוב תגובה
איש צוות רפואי עוזר למטופל בשיחת וידאו בבית חולים בברגמו, איטליה
איש צוות רפואי עוזר למטופל בשיחת וידאו בבית חולים בברגמו, איטליהצילום: AFP

נהוג להזהיר שיש הבדל בין מתאם לבין סיבתיות: גם אם שני גדלים שמתנהגים בצורה דומה, זה לא אומר שאחד גורם לשני. הנתונים של משרד הבריאות על מספר החולים המאובחנים בקורונה מספקים טוויסט על זה - יש מתאם מצוין בין מספר המאובחנים לבין מספר הבדיקות שהמשרד עושה.

אבל במקרה הזה עושה רושם שדווקא כן מדובר בסיבתיות. במלים אחרות, מספר המקרים תלוי בכמות הבדיקות, ולא משקף את המצב בכללותו. ההשלכות חמורות, הן על תמונת המצב, הן על הערכת ההשפעה של צעדי הסגר והריחוק החברתי, הן על הערכת המצב היחסי בערים שונות והן על ההערכה מתי נוכל לצאת מכל זה.

נתחיל בגרף פשוט של מספר הבדיקות כל יום, ומתוכן מספר הבדיקות החיוביות והשליליות (יש גם קטגוריה קטנה של "אחר", שכוללת מקרים שבהם אין עדיין תוצאה או שהיא לא ברורה). הנתונים רק עד 5 באפריל, כי זה מה שמשרד הבריאות פירסם.

TESTS

אז רואים איך מספר הבדיקות עלה בערך עד 26 במארס, ואיך מאז הוא מתנדנד, למרות ההצהרות שמתכוונים להגיע ל-10 אלף בדיקות ואפילו פרסום על כך שראש הממשלה החליט שיהיו 30 אלף. אז החליט.

מה שפחות בולט אבל ניתן לראות הוא שבמספר הבדיקות החיוביות יש מעין גל, והוא די מתאים לגל של מספר הבדיקות הכולל. זה קצת חשוד.

בדקתי מה שיעור הבדיקות החיוביות מתוך כלל הבדיקות כל יום. זה לא לגמרי קבוע, ויש כמה חריגות (בעיקר ימים שבהם היה שיעור גבוה יחסית של תוצאות חיוביות), אבל בגדול זה בטווח של 9%-6% לאורך התקופה. במלים אחרות, לא משנה כמה בודקים, מוצאים בערך אותו שיעור של חיוביים. כמו בדגימה אקראית. מה שמרמז שאם היו בודקים עוד היו מוצאים עוד.

TESTS POS

המשכתי ובדקתי גם את הקשר בין מספר הבדיקות לבין ההודעות על מספר המקרים המאובחנים שמתפרסמות בערוץ הטלגרם של משרד הבריאות. הגרף הבא מראה את המתאם (קורלציה) בין מספר הבדיקות כל יום לבין מספר המקרים החדשים (מחושב כסך המקרים ביום פחות סך המקרים ביום הקודם).

זה גרף פיזור, וכל נקודה מייצגת יום. המיקום האופקי של הנקודה משקף את מספר הבדיקות באותו יום, והמיקום האנכי את מספר המקרים המאובחנים החדשים שדווחו באותו היום.

TESTS CASES

יש מתאם ברור וחזק בין מספר הבדיקות לבין מספר המקרים החדשים. מקדם המתאם הוא 0.97, המשקף מתאם כמעט מושלם (הערך המקסימלי של מקדם המתאם הוא 1, וזה מתקבל כשכל הנקודות מתיישבות על קו ישר). זאת על אף שיש לעתים עיכוב של יום או יותר בין תאריך בדיקה לקבלת התוצאה.

אז ראינו את הקשר בין מספר הבדיקות למספר האבחונים. אבל האם זה באמת מסביר את המסקנות על התקדמות המחלה? אחד האפיונים העיקריים של התפתחות מגפת הקורונה היה שמספר החולים גדל בצורה אקספוננציאלית, ושב-26 במארס היה שינוי פאזה: לפני זה מספר החולים הכפיל את עצמו כל שלושה ימים, ואחרי זה רק כל חמישה ימים. רואים את זה כשמציגים את המספרים בסקלה לוגריתמית (כפי שהוסבר והודגם בטורים קודמים), אז ראוי להציג גם את מספר הבדיקות באותה צורה.

TESTS LOG

כמו בגרף הראשון, רואים בהתחלה עלייה רצופה, ובזכות הסקלה הלוגריתמית היא נראית די ישרה. ואז יש "ברך" שאחריה יש תנודות קלות בלי מגמה ברורה. הברך היא בדיוק ב-26 במארס, אותו יום שבו היה שינוי פאזה במספר החולים המאובחנים. אבל עכשיו נראה שזה לא בגלל ההצלחה של צעדי הבידוד החברתי. זה בגלל הפסקת העלייה במספר הבדיקות. הניתוח הקודם שעשיתי על התקדמות המחלה היה מוטעה.

ההשלכות של המסקנה הזו הן מרחיקות לכת. אם מספר החולים המאובחנים תלוי יותר מכל דבר אחר במספר הבדיקות שבוצעו, אין לנו בסיס לרוב הפעולות שאנחנו מבצעים למיגור המגפה:

קודם כל, אנחנו בכלל לא יודעים מה הדינמיקה של התפשטות המגפה. האם מספר המקרים באמת עולה באופן אקספוננציאלי? ואם כן, באיזה קצב?
כתוצאה מכך, אנחנו גם לא יודעים אם הקצב השתנה עם הזמן – ולכן אנחנו גם לא יודעים אם לצעדי הסגר וההרחקה החברתית היתה השפעה. חיזוק למסקנה הזו אפשר לקבל מהשוואות עם נתונים ממדינות אחרות. ברוב המדינות קצב הגידול של מספר המקרים יורד האופן הדרגתי כבר שבועיים או יותר: הגרף שלהן בסקלה לוגריתמית לא נראה כמו קו ישר עם ברך, אלא כמו קו עקום בשיפוע שהולך ומתמתן. זה כנראה משקף את ההשפעה האמיתית של צעדי בידוד. הנתונים אצלנו לא נראים כך, והברך לא משקפת שיפור אלא הפסקה בהגדלת קצב הבדיקות.

אם אנחנו לא יודעים אם ועד כמה צעדי הבידוד והסגר עובדים, איך אפשר להחליט מתי להקל בהם? בנוסף, אם מספר המקרים באמת משקף את מספר הבדיקות, איך אפשר לדעת מה ההבדל בין ערים שונות? אולי הוא נובע ממספר הבדיקות שבוצעו בכל עיר?

בדיקה לגילוי נגיף הקורונה בטירה
בדיקה לגילוי נגיף הקורונה בטירהצילום: אייל טואג

כל מערך ההתמודדות עם מגפה כמו הקורונה צריך להיות מבוסס על נתונים אמינים. רק כך ניתן לתכנן פעולות ולוודא שהן מובילות לתוצאות הרצויות. אבל עושה רושם שהנתון הבסיסי ביותר, של מספר החולים המאובחנים, משקף את רמת הפעילות של משרד הבריאות יותר מאשר את רמת ההדבקה במחלה. זה לא בסיס שניתן לבנות עליו.

ההמלצה הנוכחית שלי: תתעלמו מדיווחים על מספר המקרים המאובחנים. הם חסרי משמעות, וכנראה משקפים הערכת חסר משמעותית לעומת מה שקורה באמת. והם גם לא מאוד חשובים, כי הרבה מהנדבקים מקבלים את המחלה בצורה קלה.

לזכותו של משרד הבריאות ייאמר כי היום הודיעו שמתכוונים לבצע בדיקות למדגם אקראי של תושבים בבני ברק. זה יכול לתת נתונים משמעותיים יותר. אבל למה ישוו את הנתונים האלה?

אפשרות טובה יותר היא להתמקד רק במקרים הקשים, במונשמים ובמתים. אלה נתונים שמשקפים בצורה המובהקת ביותר את המכה כתוצאה ממגפת הקורונה. אבל גם כאן צריך לעשות זאת בזהירות ובחוכמה. למשל, 11 הנפטרים בבית האבות משען בבאר שבע הם לא אינדיקציה לכך שיש מכה קשה במיוחד בעיר כולה. כך צריך הבחין בין מקרים שהגיעו מחו"ל, מקרים כתוצאה מהדבקה בבית (כולל בתי אבות), ומקרים כתוצאה מהדבקה במרחב הציבורי. רק האחרונים משמעותיים להחלטות על מדיניות ולהערכה של ההשפעה של צעדי מנע.

דרור פייטלסון

דרור פייטלסון | |אטלס למאה ה-21

פרופסור למדעי המחשב באוניברסיטה העברית. אספן של כל מיני דברים, ובפרט של נתונים ומספרים. אוהב לנסות להסביר דברים בצורה שקל להבין אותם, ובמיוחד אוהב כשזה מצליח ומישהו פתאום מבין משהו חדש. הבלוג הזה משלב את שני הדברים, ויתמקד בהצגה גרפית של נתונים כדי לחשוף מה אפשר להבין מהם. שואף להקשות על כל מי שמנסה לרדד ולהטות את השיח הציבורי על ידי טענות בלתי מבוססות והפצת פייק ניוז. מאמין גדול בכך שיכול להיות כאן הרבה יותר טוב.

חלק מהטורים מבוססים על הספר "עידן הימין: ישראל 2018-1977 בראי הנתונים", שפורסם בתחילת 2019. בספר יש גם הפניה למקורות הנתונים.

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker