המפץ הגדול של המידע הדיגיטלי: עמוס יותר, נגיש פחות

המידע הזמין למין האנושי מתרבה בקצב מסחרר, אך הופך לבלתי נגיש עבור רוב האנשים. בתחומים השונים מפתחים דרכים לנצל את השפע הגדול. ואולם התפוצצות המידע היתה אחד הניצוצות שהציתו את המשבר הפיננסי האחרון

אקונומיסט
שתפו כתבה במיילשתפו כתבה במייל
שתפו כתבה במיילשתפו כתבה במייל
אקונומיסט

כאשר פרויקט סקר השמים הדיגיטלי של סלואן (SDSS) החל לעבוד ב-2000, הטלסקופ שלו בניו מקסיקו אסף בשבועות הראשונים יותר מידע משנצבר בהיסטוריה של האסטרונומיה כולה. כיום, עשור לאחר מכן, הארכיון של הפרויקט מכיל כמות אדירה של 140 טרה בייט של מידע. פרויקט ההמשך, טלסקופ הסיקור הסינופטי הגדול (LSST), שצפוי להתחיל לעבוד בצ'ילה ב-2016, יצבור כמות נתונים דומה מדי חמש שנים.

אפשר למצוא כמויות מידע אסטרונומיות כאלה גם קרוב יותר לכדור הארץ. ענקית הקמעונות וול מארט מטפלת ביותר ממיליון עסקות של לקוחות מדי שעה, הנכנסות למסד נתונים שמוערך ביותר מ-2.5 פטה בייט (10 בחזקת 15 בייטים) - פי 167 מכמות המידע בספריית הקונגרס האמריקאי. אתר הרשת החברתית פייסבוק מאחסן 40 מיליארד תמונות; ובפיענוח הגנום האנושי נבחנו 3 מיליארד זוגות בסיסים (bp) מטלה שדרשה 10 שנים בפעם הראשונה שנעשתה, אך כיום אפשר להשלימה בתוך שבוע. כל הדוגמאות הללו מספרות אותו סיפור: העולם מכיל כמות עצומה מעל ומעבר לכל דמיון של מידע דיגיטלי, שגדלה במהירות מסחררת. הדבר מאפשר דברים רבים שלא היו אפשריים בעבר: זיהוי מגמות עסקיות, מניעת מחלות, מלחמה בפשע וכן הלאה. המידע, כשהוא מנוהל היטב, עשוי לשמש לזיהוי מקורות חדשים של ערך כלכלי, לספק תובנות חדשות למדע ולסייע לפעילות הממשלות.

ואולם כמות המידע האדירה יוצרת גם בעיות חדשות. למרות שפע הכלים לתעד, לעבד ולחלוק את כל המידע באמצעות חיישנים, מחשבים, טלפונים סלולריים וכדומה - כמות המידע עולה על מרחב האחסון הקיים (ראו תרשים). יתרה מזאת, אבטחת המידע והגנה על הפרטיות הופכות למשימה קשה יותר ויותר עם הצטברות המידע. אלכס סזלאי, אסטרופיזיקאי באוניברסיטת ג'ונס הופקינס, מציין כי כמויות המידע האדירות הופכות חלק גדול מהמידע לבלתי נגיש. "איך אפשר לפענח את כל המידע הזה? אנשים צריכים לחשוב איך אנחנו מכשירים את הדור הבא, לא רק של מדענים, אלא גם של אנשים בתחום הממשל והתעשייה", הוא אומר.

"אנחנו נמצאים בתקופה שונה בגלל כל המידע הזה", אומר ג'יימס קורטדה מיבמ, שכתב עשרות ספרים על ההיסטוריה של המידע בחברה. ג'ו הלרסטיין, מדען מחשב באוניברסיטת קליפורניה בברקלי, מכנה זאת "המהפכה התעשייתית של המידע". השפעותיה מורגשות בכל מקום, החל בעסקים ועד למדעים, מממשל ואומנויות. המדענים ומהנדסי המחשב טבעו מונח חדש לתופעה: "ביג דאטה".

פירורי זהב בערימות המידע

מבחינה אפיסטמולוגית (תורת הידע), מידע מורכב מאוסף נתונים, ולעומתו ידע מורכב משרשראות נפרדות של מידע. אולם ההבדלים בין השניים מיטשטשים והולכים. עם מספיק נתונים גולמיים, אלגוריתמים עדכניים ומחשבים חזקים אפשר לחשוף תובנות חדשות שקודם לכן נותרו סמויות מן העין. עסקי ניהול המידע - סיוע לארגונים להשתמש בכמויות המידע האדירות - גדלים בקצב מסחרר. בשנים האחרונות אורקל, יבמ, מיקרוסופט וסאפ הוציאו יחד יותר מ-15 מיליארד דולר לרכישת חברות תוכנה שמתמחות בניהול וניתוח מידע. תעשייה זאת מוערכת בשווי של יותר מ-100 מיליארד דולר וצומחת בקצב של כ-10% בשנה - כמעט כפליים לעומת תעשיית התוכנה בכללותה.

יותר ויותר ארגונים ממנים סמנכ"לי מידע (CIO), ונוצר מקצוע חדש, מדען מידע, שמשלב בין מיומנויות של מתכנת מחשבים, סטטיסטיקאי ואמן-מספר סיפורים, כדי לחלץ את פירורי הזהב מתוך ערימות המידע. ואל הריאן, הכלכלן הראשי של גוגל, צופה כי תפקיד הסטטיסטיקאי יהפוך לסקסי ביותר בסביבה. נתונים, הוא מסביר, זמינים כמעט לכל דורש; היכולת להפיק מהם חוכמה היא נדירה.

יש סיבות רבות לזינוק האדיר בכמות המידע. הברורה בהן היא התקדמות הטכנולוגיה. עם השיפור ביכולות המכשור הדיגיטלי והירידה במחירים, החיישנים והגאדג'טים מזרימים מידע רב שלא היה זמין קודם לכן, ולאנשים רבים יותר יש גישה לכלים חזקים בהרבה. למשל, יש 4.6 מיליארד מנויי סלולר בעולם ו-1-2 מיליארד איש משתמשים באינטרנט. יתרה מזאת, הרבה יותר אנשים כיום מבצעים אינטראקציה עם המידע. בין 1990 ל-2005 יותר ממיליארד איש ברחבי העולם הצטרפו למעמד הבינוני. בעוד שהם מתעשרים הם גם נהפכים למשכילים יותר, מה שמזין את צמיחת המידע, מציין קורטדה. התוצאות ניכרות גם בתחומי הפוליטיקה, הכלכלה והמשפטים. "מהפיכות במדע התרחשו פעמים רבות לאחר מהפיכות בכלי המדידה", אומר סינאן אראל, מרצה למנהל עסקים באוניברסיטת ניו יורק. בדיוק כפי שהמיקרוסקופ שינה את תחום הביולוגיה בכך שחשף חיידקים, נתונים אלה הופכים את מדעי החברה על פיהם, הוא מסביר. חוקרים כיום מסוגלים להבין את ההתנהגות האנושית ברמת האוכלוסייה ולא רק ברמת האינדיבידואל.

העקבות הווירטואליות הופכות לעמוד תווך

כמות המידע הדיגיטלי מכפילה עצמה פי עשרה בכל חמש שנים. החוק של מור, שנחשב כמובן מאליו בתעשיית המחשבים, קובע כי כוחות העיבוד ויכולות האחסון של שבבי מחשב מוכפלים או שמחירם נחתך במחצית כל 18 חודשים בקירוב. גם תוכנות המחשב משתכללות. אדוארד פלטן, מדען מחשב באוניברסיטת פרינסטון, טוען כי לשיפור באלגוריתמים המניעים את יישומי המחשב היה תפקיד מרכזי בחוק מור בעשרות השנים האחרונות. כמות גדולה של מידע מופצת בקנה מידה רחב. עד 2013 תגיע כמות המידע העוברת באינטרנט ל-667 אקסה בייטים (10 בחזקת 18, או מיליארד ג'יגה-בייט), לפי סיסקו, יצרנית ציוד תקשורת; וכמות המידע ממשיכה לצמוח מהר יותר מיכולת הרשת לשאת אותה.

זה זמן רב שאנשים מלינים כי הם מוצפים במידע. ב-1917 התלונן מנהל חברת ייצור בקונטיקט על השפעות הטלפון: "הזמן אובד, הבלבול גובר והכסף מתבזבז". ואולם מה שקורה עכשיו הוא הרבה יותר מגידול כמותי. השינויים הכמותיים החלו ליצור הבדל איכותי. "שובל הפליטה של המידע" - העקבות הווירטואליות שהקלקות משתמשי האינטרנט מותירות מאחוריהם ומהן אפשר להפיק ערך - הופך לעמוד תווך בכלכלת האינטרנט. אחת הדוגמאות היא מנוע החיפוש של גוגל, שמונחה בחלקו ממספר הקליקים על פריט כדי לסייע לקבוע את מידת הרלוונטיות שלו לשאילתות החיפוש. אם התוצאה השמינית בחיפוש אחר מונח מסוים זוכה למספר הגדול ביותר של הקלקות, האלגוריתם מקדם אותה מעלה בתוצאות.

בעוד שעולם נעשה דיגיטלי, איסוף וניתוח מידע צפוי להניב תועלות משמעותיות גם בתחומים אחרים. למשל, קרייג מונדי, ראש מחלקת מחקר ואסטרטגיה במיקרוסופט, ומנכ"ל גוגל אריק שמידט הצטרפו לכוח משימה מיוחד לרפורמה במערכת הבריאות האמריקאית. "מוקדם בתהליך אריק ואני אמרנו 'אם אתם באמת רוצים רפורמה במערכת הבריאות, צריך לבנות מעין כלכלת שירותי בריאות סביב המידע שחשוב לאנשים'", מסביר מונדי. "אי אפשר לחשוב על נתונים רק בתור תוצר לוואי של השירותים הרפואיים; הנתונים נהפכים לנכס מרכזי בניסיון למצוא דרכים לשיפור כל היבט של שירותי הבריאות. יש פה מעין היפוך כיוון".

רישומים דיגיטליים אמורים להקל על חייהם של רופאים, להפחית עלויות לספקים של שירותי בריאות וחולים ולשפר את איכות הטיפול. ואולם במצטבר, המידע עשוי לשמש לזיהוי שימוש צולב לא רצוי בתרופות, לזהות את הטיפולים האפקטיביים ביותר ולחזות התפרצות מחלה לפני הופעת התסמינים. מחשבים כבר מנסים לעשות ניתוחים כאלה, אך נדרש תכנות ייעודי לצורך כך. בעולם התפוצצות המידע המיתאמים צצים כבר מעצמם. לעתים המידע חושף יותר ממה שרצוי. למשל, עיריית אוקלנד בקליפורניה מפרסמת מידע על מיקומם ועיתויים של מעצרים, והוא מתפרסם באתר האינטרנט הפרטי Oakland Crimespotting. באתר זה היה אפשר לגלות כי המשטרה פושטת על זונות ברחוב הומה מסוים מדי ערב, מלבד ימי רביעי. טקטיקה זו לא היתה אמורה להיוודע לציבור.

התפוצצות המידע עשויה להיות בעלת השלכות רציניות בהרבה מכך. במהלך המשבר הפיננסי התחוור כי הבנקים וסוכנויות דירוג האשראי הסתמכו על מודלים, שלמרות כמויות מידע עצומות שהוזנו אליהם, נכשלו בניסיון לשקף את הסיכון הפיננסי בעולם האמיתי. זה היה המשבר הראשון שהוצת על ידי התפוצצות המידע - ויהיו יותר. האופן שבו מנוהל המידע משפיע על כל תחומי החיים. זמינות המידע מאפשרת לחברות לתת שירותים לשוקי נישה קטנים בכל מקום בעולם. התפוקה הכלכלית בעבר התבססה על ייצור, ומנהלי הייצור דאגו לשפר את יעילותם של כל מכונה ושל כל תהליך. כיום הסטטיסטיקאים נוברים בכמויות המידע שנצברות בעסק כדי למצוא רעיונות חדשים. "הכלכלה מבוססת הידע נמצאת בחיתוליה", מודה מונדי. "אפשר לראות את התווים הכלליים, אבל את ההשלכות הטכניות, המבניות ואפילו העסקיות עדיין איננו מבינים". דו"ח מיוחד זה מצביע על המקומות שבהם השינויים מתחילים להתרחש.

כתבות מומלצות

מ-2008 ועד היום: איך הגענו לאינפלציה הנוכחית

יוני ומיכל רכשו דירה במחיר דמיוני. כך הם איבדו שליטה על המשכנתא אחרי פחות משנה

ריחאניה. "מרגישים אירופה"

"יש שני יישובים בישראל שבהם הכל נקי, הולכים ברחובות ומרגישים אירופה"

גיף הסכם ממון 2

״הייתי בהלם, עורך הדין אמר לי: ׳חתמת על הסכם של כלה מאוקראינה׳"

עבודות על הרכבת הקלה בכיכר רבין, ביולי. "הולכי הרגל, ובמיוחד ילדים או אנשים מבוגרים, נתונים בסיכון יומיומי, סכנת חיים בעיר"

"אני מפחדת על חיי כשאני יוצאת לרחוב": המלחמה של תושבי תל אביב

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר TheMarker

כתבות שאולי פספסתם

קשישים בגינה ירושלים

20 אלף שקל בחודש: תתחילו לחסוך עבור מטפל זר בבית

ג'ורג'ה מלוני בנאפולי, שלשום

סערה נדירה: צירוף הגורמים שמאיים להיות חמור יותר ממשבר 2008