ההערכות העדכניות מדברות על כך שבכל יום מיוצרים, או מתווספים, כמעט 2.5 קווינטיליון בייטים (Quintillion bytes) של מידע לרשת. קווינטיליון זה 1 עם 18 אפסים - מספר כל כך גדול שקשה למח האנושי לדמיין מה זה אומר בפועל. לשם השוואה, אפשר לנסות לדמיין ערימה של 600 מיליון תקליטורי DVD,אבל בעצם, גם את זה קשה לדמיין. והקצב הולך וגובר.
למידע זה ערך רב מאוד. בשנת 2023 כולנו חווינו ונדהמנו מהפכת ה-AI, שרק החלה. מספיק נכתב על התחום ועל הערך של הטכנולוגיה המתקדמת הזאת לעולם (כמו גם על הסכנות הפוטנציאליות שהיא נושאת בחובה). הסוגייה שכעת עולה לקדמת הבמה היא: מהיכן משיגים את כל הדאטה שנדרש כדי לאמן את המודלים המתקדמים? בין אם הם מודלים כללים או ספציפיים לסקטורים מסוימים, כמו בריאות או פיננסים. התשובה המתבקשת היא ברורה- האינטרנט. אותם 2.5 קווינטליון בייטים שעולים לרשת האינטרנט בכל יום, רובם באופן פומבי, זמינים לכל דורש, אם רק יודעים היכן לחפש.
אין כזה דבר מספיק
כמויות אדירות של מידע נאספות מהרשת בכל רגע. כשענקיות הטכנולוגיה נכנסו למרוץ החימוש הזה - כדי לספק את מוצר ה- AI המתקדם ביותר - איסוף המידע העלה הילוך בצורה משמעותית. אלפי חברות AI חדשות נוסדו בשנת 2023, זאת בנוסף לחברות הענק הוותיקות, והן גייסו סכום מצרפי של כ-50 מיליארד דולר בשנה אחת. לאחר תשלום המשכורות למהנדסים המומחים, אותן חברות ישקיעו את מרבית כספי הגיוס באיסוף ואחסון המידע עליו הם הולכים לאמן את המודלים המתקדמים. מבחינתן, אין כזה דבר "יותר מידי מידע".
נכון לרבעון הראשון של שנת 2024, קצב גיוס הכספים של חברות חדשות ירד משמעותית. יותר כסף זורם ל"סוסים המנצחים" שרק מחפשים לגייס עוד מימון, כדי לרכוש עוד מהנדסים, עוד דאטה ועוד שטחי אחסון דיגיטליים.
אין הרבה חלופות לאחסון המידע שנאסף ונדרש לשימוש. הפתרון הוא בענן. האמת שלא רק בענן אחד, מכיוון ש-80% מהחברות שעובדות עם שירותי ענן, עובדות עם יותר משירות אחד, בדרך כלל לצרכי יתירות ולעיתים גם לצרכי משא ומתן ושיפור התנאים המסחריים.
שוק הענן עתיד לחצות את שני טריליון הדולר בשנה בשנת 2032, מה שיהווה צמיחה שנתית ממוצעת של מעל ל-16% ביחס ל-2024. אין הרבה תחומים שצומחים בקצבים כאלו ובמספרים כאלה, לאורך כל כך הרבה זמן. עם זאת, יש הצופים שקצב הצמיחה יגדל אף יותר, מאחר ומרבית ההערכות המוקדמות על התפתחות ה-AI טעו בגדול וצפו קצב צמיחה איטי יותר בצורה משמעותית לבינה המלאכותית, לעומת מה שקרה בפועל בשנה האחרונה. מדהים לחשוב שהתחלנו להשתמש ב-ChatGPT בצורה יום-יומית רק לפני כשנה.
הדאטה הפך למטבע
אז אם כמות המידע לא מפסיקה לצמוח, הצורך במידע לא מפסיק לגדול והאחסון של המידע נהיה הכרחי - לסטארט-אפ בן יומו, כמו גם לענקית טכנולוגיה בת 20 - למה זה הופך את חברות הענן בהם מאחסנים את המידע? לדעתי, זה הופך את חברות הענן לבנק. לא סתם בנק. בנק לא מפוקח שמחזיק במטבע שממשלה לא יכולה להדפיס עוד ממנו, מטבע מבוזר שנוצר על ידי האנושות בקצב הולך וגובר. AWS, Microsoft Azure, Google Cloud, Oracle, Snowflake וגם שחקניות ענן קטנות יותר אך משמעותיות, כגון Digital Ocean, Vultr ואחרות, שומרות על הנכס הזה עבור לקוחותיהן, כמו בנק שווייצרי ששומר על זהבם של עשירי העולם.
היום השימושים הם טכנולוגיים, כלומר, ניגשים ל"בנק" כדי להוציא חלק מהמידע שנאסף כדי לבצע פעולה טכנולוגית, כדוגמת אימון מודל בינה מלאכותית. בעתיד הקרוב השימושים יהפכו להיות ממש פיננסיים, מכיוון שהדאטה כבר מתחיל לשמש כמטבע אמיתי איתו אפשר לבצע סחר חליפין. דוגמה עדכנית היא עסקת הענק בין רדיט, פלטפורמת הפורומים המובילה בעולם שמתכוונת להנפיק בנאסד"ק בחודשים הקרובים, לבין גוגל. רדיט, או יותר נכון המשתמשים של רדיט, הם מייצרני הדאטה האיכותיים ביותר באינטרנט ואת הדאטה הזה גוגל רוצים לרכוש במחיר התחלתי של כ-60 מיליון דולר בשנה. הנה, הדאטה הפך למטבע.
בניגוד לזהב מעומק אדמת קליפורניה, המוגבל בכמות ובגישה, מידע לעולם ייווצר ולכן לעולם ייאסף. לאט אך יציב ניתן לראות רגולטורים, מחוקקים ושופטים מסבים את תשומת ליבם לנושא ומנסים להתחיל לעצב את הסטנדרטים סביב תחום איסוף המידע הפומבי, כולל הגדרות תקדימיות בנוגע למה בכלל נחשב מידע פומבי ומה לא.
משאב בלתי נדלה
רובנו חווינו את דרך החתחתים הכרוכה בניסיון לסגור חשבון בנק כדי לעבור לבנק מתחרה. אני מעריך שזה מה שצפוי לנו עם חברות הענן הגדולות בעתיד הנראה לעין בכל הקשור להעברת המידע שנאסף מספק ענן אחד למשנהו (עד שהרגולטור האירופי והאמריקאי יתערבו). בניגוד לבנקים המסורתיים, שיכולים להקשות על התהליך בעיקר באמצעות בירוקרטיה בלתי נסבלת, חברות הענן הגדולות יעשו זאת באמצעות הערמת קשיים טכנולוגיים שלא יאפשרו מיגרציה פשוטה לשירות אחר, תופעה שכבר זכתה למינוח Cloud lock-in.
מעט מאוד פעמים בהיסטוריה ניתן לחזות בזמן אמת בהיווצרותו של מטבע חדש. אנו חווים זאת כיום ויתרונותיו של המטבע החדש הם אדירים. מכיוון שכולנו היצרנים והצרכנים של המטבע הזה, מגיע לכולנו ליהנות ממנו וצריך לוודא שייווצרו הזדמנויות לחדשנות בשוק העתידי, לא רק לגופי הענק עתירי המשאבים. במחשבה שנייה, אולי דאטה הוא לא הזהב החדש, אלא משאב בלתי נדלה שאנחנו יכולים לייצר אין-סוף ממנו, כי הוא מבוסס על הדמיון האנושי.
הכותב הוא מנכ"ל חברת ברייט דאטה (Bright Data) הישראלית, מובילה עולמית בתחום איסוף מידע פומבי ברשת




