נתונים, נתונים בכל מקום: אבל איך לקרוא אותם?

הרבה מדברים בשנים האחרונות על כך שמערכת החינוך לא צריכה להעביר ידע, אלא ללמד איך ללמוד. אז השנה הקרובה יכולה להיות מוקדשת לנושא אוריינות הנתונים. זה חשוב, זה מעניין, וזה קשור באופן ישיר לחיים של כולנו

שתפו כתבה במיילשתפו כתבה במייל
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
גרפיםקרדיט: Gorodenkoff / Shutterstock.com

שנת הלימודים מתחילה עוד כמה שבועות. אבל לא בטוח איך בדיוק, בגלל ההתגברות של הגל הרביעי של הקורונה. נכנסים לזה כל הוויכוחים הרגילים: יש מי שטוענים שאין בעיה כי ילדים ונוער בכלל לא חולים באופן משמעותי, ויש שטוענים שהם בכל זאת עלולים להידבק ולהדביק בני משפחה אחרים. אחרים מפנים את תשומת הלב לחיסונים: מצד אחד יש מי שחושבים שהם פתרו את הבעיה, אבל מצד שני יש מי שאומרים שהם עצמם בעיה חדשה לא פחות חמורה. ואז יש גם את אלה שמחזיקים בתיאוריות קונספירציה לפיהן כל עניין הקורונה הוא בדיה. והמערכת הפוליטית והתקשורתית נסחפת בבליל הדעות הזה, ולפעמים מוסיפה לבלבול.

אבל יש כאן גם הזדמנות. הרי כולם טוענים שהם מתבססים על נתונים, או לפחות שואפים לכך. אז אפשר לנצל את המצב כדי לחדד את השאלות שהיינו רוצים לקבל תשובות מבוססות עליהן, ואז לחקור את הנתונים ולנסות לראות איזה מסקנות ניתן להסיק. מדברים רבות בשנים האחרונות על כך שמערכת החינוך לא צריכה להעביר ידע, אלא ללמד איך ללמוד. אז השנה הקרובה יכולה להיות מוקדשת לנושא אוריינות הנתונים: איך לאסוף נתונים, איך להסתכל על נתונים, איך להסיק מסקנות מנתונים, ואיך להציג נתונים בגרפים, הכל בהקשר של מגפת הקורונה. זה חשוב, זה מעניין, וזה קשור באופן ישיר לחיים של כולנו.

כדי שזה לא ישאר לגמרי באוויר, אני רוצה להציע כמה רעיונות קונקרטיים למערכי שיעור אפשריים.

אני הייתי מציע להתחיל ממיפוי של השאלות הגדולות. מה היינו רוצים לדעת על הקורונה. מה הכי חשוב לדעת כדי לתכנן מדיניות. להעלות שאלות, ואז לחשוב איזה נתונים צריך כדי שאפשר יהיה לענות עליהן (אבל עדיין בלי לחפש את הנתונים והתשובות בפועל - זה יבוא בהמשך). תחשבו על הדיון שיכול להתפתח בכיתה סביב זה.

זה יכול ללכת לכיוונים שונים, וזה בסדר. אבל הנה כמה שאלות בסיסיות שנראה לי שכדאי לדאוג שיכללו בדיון:

1. עד כמה הקורונה היא מגפה חמורה? זו השאלה הבסיסית ביותר. הרי יש את מכחישי הקורונה שטוענים שהכל בדיה או סתם היסטריה תקשורתית, ואפילו שאין בכלל מחלה כזו. מעבר לחשיבות העקרונית של ביסוס כל הדיון על הקורונה על עובדות, השאלה הזו יכולה גם לשמש פתח לדיון בתיאוריות קונספירציה באופן כללי, ומשם לחשיבות של נתונים ואוריינות נתונים.

2. איך מגפת הקורונה מתפשטת? השנה האחרונה הכניסה כל מיני מונחים לשיח הציבורי, כמו למשל "מקדם הדבקה". מה זה בדיוק? איך מודדים אותו? ואיך זה קשור לפעולות מנע כמו חבישת מסכות וסגרים? מעבר לכך, איך בעצם מגדירים "מגפה" ומה ההבדל בין מגפה לסתם מחלה?

3. במי המגפה פוגעת? אומרים שילדים לא חולים, אבל הם עלולים להדביק קרובי משפחה זקנים. האם זה אכן כך? ועד כמה המחלה יותר מסוכנת לזקנים מאשר לצעירים?

4. עד כמה החיסונים פותרים את הבעיה? זו השאלה החמה ביותר בדיון הציבורי כרגע, ויש לה השלכות דרמטיות על אמצעי מדיניות שהממשלה נוקטת בהם ועל המשך מהלך המגפה. זו גם שאלה שפותחת פתח לדיון על סיבתיות: איך אנחנו יכולים לדעת שדבר אחד גורם לדבר אחר? אולי זה סתם מקרה שהם קרו ביחד? בהקשר של החיסונים השאלה הזו עובדת בשני הכיוונים: מצד אחד, האם החיסונים באמת מקטינים את התחלואה? או אולי רק את חומרת המחלה? מצד שני יש מי שחוששים מתופעות לוואי, והיו כל מיני דיווחים על אנשים שקיבלו חיסון ואז סבלו מבעיה רפואית. אבל איך נדע האם החיסון הוא זה שגרם לבעיה?

5. מה ההשלכות של המגפה ושל הפעולות נגד המגפה? האם צריך להסתכל על המגפה אך ורק מהפן הבריאותי? הסגרים גרמו להרבה אנשים לאבד את עבודתם או את מפעל חייהם. כמה חשיבות צריך לייחס להיבט הכלכלי ולהיבט החברתי?

אם אתם מחנכים, שיעורי הבית שלכם הם לחשוב על איך להרחיב את המתווה הזה ואיך לנהל דיון על הנושאים האלה. בטור הבא בסדרה אני אציע צורות מחשבה ונתונים שיכולים לעזור לענות על השאלה הראשונה. בהמשך אטפל גם בחלק מהשאלות האחרות.

איך להסתכל על נתונים?

בתור קדימון (וכד שלא יצא טור בלי אף גרף), הנה דוגמה אחת לחשיבות של לדעת להסתכל נכון על נתונים. הדוגמה שבחרתי נוגעת לשאלת ההשפעה של החיסונים. אחת מהטענות של אלה שמטילים ספק ביעילות החיסונים היא שאם מסתכלים על החולים הקשים, ובעיקר על הקשישים שביניהם, רואים שיש יותר חולים קשה מחוסנים מאשר חולים קשה לא מחוסנים. אלה הנתונים. והמסקנה המתבקשת לכאורה היא שהחיסון לא עובד ואולי בעצם אפילו מזיק.

אבל האם זו הצורה הנכונה להסתכל על הנתונים האלה? איזו עוד אפשרות יש? ומה יותר נכון לעשות? (על זה, כמובן, אפשר לנהל דיון - להעלות רעיונות ולנסות להבין מה השיקולים) התשובה היא שיש עוד צורה להסתכל על אותם הנתונים. במקום להסתכל על הנתונים הגולמיים (כמה חולים קשה יש בקבוצת המחוסנים וכמה בקבוצת הלא מחוסנים), אפשר להסתכל על נתונים יחסיים: איזה שיעור מהמחוסנים חלו, ולעומתם איזה שיעור מהלא מחוסנים חלו. אם הקבוצות הן מראש בערך באותו הגודל, זה לא משנה. אבל אם זה לא המצב, זה מאוד משנה. ומסתבר שמבצע החיסונים זכה להצלחה כבירה בין הקשישים, ורובם מיהרו להתחסן. כתוצאה יש הרבה יותר קשישים מחוסנים מאשר קשישים לא מחוסנים. כשלוקחים את זה בחשבון הנתונים נראים לגמרי אחרת.

למה הדבר דומה? תחשבו על בית ספר שעושה יום כיף בים לכל שכבת כיתות י'. זה בית ספר גדול, אז בשכבה הזו לומדים 250 תלמידים, שמתוכם 7 הם ג'ינג'ים. למחרת מסתבר ש-20 תלמידים לא באו לבית הספר, כי הם סובלים מכוויות שמש: 5 מהג'ינג'ים ועוד 15 לא ג'ינג'ים. וכעת השאלה: האם ג'ינג'ים יותר רגישים לשמש או לא? לכאורה התשובה היא לא, כי הרי רק 5 ג'ינג'ים נשרפו, ובין הלא ג'ינג'ים היו לא פחות מ-15 נשרפו - פי 3 יותר. אבל זה כמובן לא נכון. אם מסתכלים על כל קבוצה בנפרד, רואים שאם אתה ג'ינג'י היה לך סיכוי גבוה מאוד להישרף (5 מתוך 7, שזה 71.4%), ולעומת זאת אם אתה לא ג'ינג'י הסכנה נמוכה ביותר (15 מתוך 243, שזה רק 6.2%). מסקנה: כשמדובר על קבוצות מאוד לא שוות, אסור להסתכל על מספרים אבסולוטיים, וצריך להסתכל על אחוזים. במקרה של הקורונה, הרוב המכריע של הקשישים מחוסנים, אז המחוסנים הם קבוצה הרבה יותר גדולה, ולכן לא מפתיע אם יש יותר חולים קשה שהם מחוסנים. אבל באחוז מתוך הקבוצה, השיעור שלהם נמוך בהרבה משיעור החולים קשה מתוך הלא מחוסנים.

אז המסקנה הנכונה היא שהחיסון בהחלט כן עובד. אמנם לא מושלם, אבל משפר את המצב באופן משמעותי ביותר.

דרור פייטלסון | אטלס למאה ה-21

פרופסור למדעי המחשב באוניברסיטה העברית. אספן של כל מיני דברים, ובפרט של נתונים ומספרים. אוהב לנסות להסביר דברים בצורה שקל להבין אותם, ובמיוחד אוהב כשזה מצליח ומישהו פתאום מבין משהו חדש. הבלוג הזה משלב את שני הדברים, ויתמקד בהצגה גרפית של נתונים כדי לחשוף מה אפשר להבין מהם. שואף להקשות על כל מי שמנסה לרדד ולהטות את השיח הציבורי על ידי טענות בלתי מבוססות והפצת פייק ניוז. מאמין גדול בכך שיכול להיות כאן הרבה יותר טוב.

חלק מהטורים מבוססים על הספר "עידן הימין: ישראל 2018-1977 בראי הנתונים", שפורסם בתחילת 2019. בספר יש גם הפניה למקורות הנתונים.

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker