DIMES: ישראלים ממפים את האינטרנט, ואתם יכולים לעזור
צוות חוקרים מאוניברסיטת ת"א נעזר במחשבי הגולשים כדי לשרטט את גבולות המרחב הדיגיטלי ולעקוב מקרוב אחר התפתחות הרשת בשנים הקרובות
האינטרנט גדל במהירות כה רבה בשנים האחרונות עד כי קשה לאמוד את גודלו. בעולם נעשים ניסיונות רבים במטרה למפות את רשת המחשבים המבוזרת, הסבוכה ואדירת המימדים שצמחה נגד עינינו. לעיתים נראה כאילו מדובר במשימה בלתי אפשרית ממש, כמעט כמו הניסיון למפות את החלל.
על אף שבארה"ב ובאירופה עוסקים במשימה זו גופים גדולים ומכובדים, אשר לרשותם תקציבי ענק, דווקא DIMES (ראשי תיבות של Distributed Internet MEasurements & Simulations), פרויקט ישראלי קטן וצעיר, שפעיל כשנה בלבד, הצליח למפות ולנתח את השימוש באינטרנט בצורה ייחודית ומוצלחת, על פי יזמיו.
DIMES מפותח על ידי צוות של סטודנטים לתואר ראשון ושלישי מאוניברסיטת תל אביב, שבראשו עומד ד"ר יובל שביט, חוקר רשתות מחשבים בעל ניסיון וותק. הפרויקט מבוסס על גולשים-מתנדבים שמריצים במחשב שלהם תוכנה קטנה, שמתקשרת למערכת ניהול באוניברסיטת תל אביב, מקבלים מטלות מדידה ושולחים את התוצאות למרכז הנתונים בתל אביב.
למעלה מ-40 מיליון מדידות ביום
"הרעיון לפרויקט התגלגל כתוצאה משיחות עם חוקרים באוניברסיטה העברית ועם תלמיד המחקר שלי, ערן שיר (מנהל הפרויקט, המשמש כעבודת הדוקטורט שלו - ר.ש.)", סיפר ל-ynet ד"ר שביט, שעבד בעבר במעבדות בל בניו ג'רזי וכיום מועסק בפקולטה להנדסה באוניברסיטת תל אביב.
התוכנה מאפשרת לנתח את הפעילות ברשת בדיוק מירבי, הן מבחינה גיאוגרפית והן מבחינת לוח הזמנים. המטרה: לשמש ככלי עבור מהנדסים ואנשי מקצוע, שיוכלו להנדס בעזרתה את האינטרנט באופן טוב יותר ולבנות מודלים לחיזוי התפתחותה.
מאז הופצה הגירסה הראשונה היא הותקנה בכ-4,000 מחשבים של כ-2,500 מתנדבים מכ-76 מדינות ו-400 רשתות, לרבות מדינות אירופה, ארה"ב וקנדה, מדינות רבות באסיה, דרום אמריקה, אפריקה ואוקיאניה ומדינות במזרח התיכון כמצרים, כווית ואחוד האמירויות, וכמובן גם ישראל. ביחד מספקים המתנדבים למעלה מ-40 מיליון מדידות ביום.
הפרויקט, שנמצא בפיתוח מזה כשנתיים, עלה לרשת לפני שנה, ונראה שהתקציב המצומצם לא רק שלא עמד בעוכריו, אלא אף סייע לו להציג כמה חידושים מהפכניים בשטח.
הודות לפתיחות המחשבתית של אנשי הצוות, ולעובדה שהיו מרוחקים ממוקדי המחקר העיקריים בתחום, הממוקמים בארה"ב, והרשו לעצמם "לחשוב מחוץ לקופסה", כפי שמתאר ד"ר שביט, הצליח DIMES לעקוף פרויקטים דומים בעולם ולאגור מסד נתונים בהיקף גדול.
תוכנה שפועלת ברקע
החידוש העיקרי של החוקרים התל אביבים הוא הבחירה בכיוון קהילתי, המערב את הגולשים. בדומה לפרויקט SETI@HOME, שעוסק באיתור סימני חיים מהחלל החיצון באמצעות תוכנה המותקנת על מיליוני מחשבים בעולם, וכך חוסכת בעלויות ומשאבים אדירים, גם DIMES, מציע לכל גולש בעולם להוריד למחשבו תוכנה קטנה, שפועלת ברקע ומאפשרת לחוקרים לקבל מידע לגבי מבנה הרשת העולמית.
"כדי למפות את האינטרנט, יש למדוד את הרשת בנקודות רבות", אומר ד"ר שביט, "כדי לעשות זאת, שולחים חבילות מידע (Packets) באמצעות פקודות כמו Trace Route וממתינים לתשובות. זה דומה למיפוי שטח על ידי משלוח מכוניות לכבישים באיזור, ולבקש מהנהגים לדווח מה ראו בדרך. כל אחד מהם תמיד יראה רק חלק מסוים".
"לרוב, מדידות אלה מבוצעות על ידי מחשבים חזקים מאוד ב-10-20 מקומות לאורך הרשת. עם זאת, עלות התפעול של השרתים גבוהה מאוד. בכל הפרויקטים הדומים המתבצעים בעולם לא נעשה שימוש ביותר מ-30-40 מחשבים, וקורות המון תקלות. זו הסיבה שעד עכשיו חסרו מאוד מפות של האינטרנט, עקב מחסור בכלי מדידה".
בדיוק בנקודה זו בא לידי ביטוי כוחה של הרשת כאמצעי שיתופי-חברתי, המבוסס על רצונם של הגולשים לתרום למטרות חברתיות.
10 גיגהבייט ביום
המימון לפרויקט מגיע ממספר גופים, העיקרי שבהם הוא האיחוד האירופי, שהקצה ל-DIMES כחצי מיליון יורו בשנתיים וחצי האחרונות. זאת, כחלק מפרויקט גדול של האיחוד האירופי, EverGrow, שעוסק בחיזוי מראה הרשת בעוד 20 שנים. סכום נוסף, של כ-40,000 דולרים הגיע ממענק של הקרן למענקי מחקר באיגוד האינטרנט הישראלי, כאשר גם האקדמיה הישראלית למדעים מספקת מימון נוסף.
הסכומים הללו מאפשרים להחזיק כוח אדם, המונה בין השאר שני מתכנתים, סטודנטים לתואר ראשון ואחרים, אולם הוא אינו מספיק למימון מערכת אחסון גדולה דיה. "בשלב זה אנחנו אוספים 10 גיגהבייט ביום, שיעור של יותר משלושה טרהבייט לשנה, וכמות הנתונים גדלה בהתמדה. יש לנו בעיה של אחסון כל המידע. אנחנו מתכוונים לרכוש מערכת אחסון מקצועית של 15-30 טרהבייט, שתספיק בינתיים".
כל העולם כולו, רשת צרה מאוד
ד"ר שביט: "מכיוון שהרשת משתנה כל הזמן, בכל שבוע אנו מקבלים מפה חדשה, אנחנו רוצים לאסוף מספיק נתונים כדי לבנות מודלים של גידול הרשת.
"גילינו כמה דברים מאוד מעניינים, והמפות שלנו שברו את כל ההערכות לגבי גודלה של הרשת. לא מדובר רק במפה אחת. יש מפת רשתות, שמראה איך נטוויז'ן וברק למשל, מחוברות זו לו ולרשתות באירופה.
אפשר לראות שהרשת הפלסטינית מחוברת לרשתות ישראליות.
מצאנו גם רשת ירדנית שמחוברת לישראל, אבל לא מצאנו רשת מצרית שמחוברת לישראל. זה מעיד על היחסים שיש בין המדינות, אפשר ללמוד מזה הרבה, ואנחנו רוצים להרחיב את המחקר גם להיבט הפוליטי והתרבותי", מתלהב ד"ר שביט.
"גילינו למשל שלאינטרנט יש ליבה של כ-80 רשתות, שמחזיקה את כולה. לא היה ידוע שהיא כל כך גדולה. יש לנו גם מפה של מיליון ורבע נתבים, הכי גדולה שקיימת היום", ציין.
נתונים נוספים שהוכיח הפרויקט, הם הקשר ההדוק בין רמת ההכנסה לבין מספר החיבורים, עליו מעידה גם העובדה שבעולם השלישי, במדינות אפריקה השונות, כמעט ואין רשתות וחיבורים.
"אנחנו מאמינים שהאינטרנט היא מפה של העולם. יש לנו מפה ייחודית, שמראה איך ערים מחוברות זו לזו. בארה"ב למשל, ככל שהמסחר בעיר מסוימת יותר מפותח, כך קישוריות האינטרנט שלה לערים אחרות יותר הדוקה".
באפריקה לעומת זאת, המצב שונה. "יש לנו משתמשים בנמיביה ובגינאה אמנם, אבל הרשתות שם קטנות ויש מעט מאוד משתמשים. החיבוריות שם מינמלית והרשת שבירה. בניגוד לישראל, שבה רואים עשרות ואפילו מאות חיבורים ישירים לרשתות בעולם, שם אין כסף, ולכן אין חיבורים", הסביר.
המטרה: חיזוי גידול הרשת ביחס לצמיחה הכלכלית
אחד המודלים שהצוות מעוניין לבנות הוא מדידה של מספר התושבים בעיר כפול התל"ג (תוצר גולמי לנפש), וכיצד הוא משליך על מספר חיבורי האינטרנט באותה עיר. "מצאנו שיש קשר הדוק בין התל"ג לבין מספר החיבורים. זה לא מפתיע, אבל אנחנו מנסים לכמת את הנתונים הללו כדי לבנות מודל מתאים. בישראל למשל אמרו, שיהיה גידול של 4% בתל"ג, ולכן מספר קישוריות האינטרנט מישראל יגדל ב-2.5%".
"הכוונה שלנו היא לייצר מפות יותר מגוונות. אנחנו שואפים לאתר את הקישורים בין האינטרנט לעולם האמיתי. אנחנו רוצים להתמקד גם בהיבטים פוליטיים, כלכליים ותרבותיים, שקשורים זה בזה. אנחנו רוצים לעקוב אחרי ההתפתחויות במדינות שעוברות שינוי פוליטי, כמו עירק וסין.
לא רוצים לעשות כסף
DIMES מבוסס על קוד פתוח, וד"ר שביט מצהיר כי אין בכוונתו להסב אותו לפרויקט מסחרי. "אנחנו לא רוצים לעשות כסף", הוא אומר. "אנחנו מהאוניברסיטה. תמיד יש את הסיכוי שמישהו ירצה להרוויח מהנתונים שלנו כסף, אבל אני נוטה שלא להסכים. מקסימום למכור חולצות באתר", הוא מתבדח.
"אנחנו מתבססים על מתנדבים, אנשים שרוצים לתרום למשהו ולא להרגיש פראיירים, כאילו מישהו מרוויח כסף על גבם. אנחנו נאבד את הקהילה הנפלאה שלנו אם נעשה משהו כזה. יש לנו קהילה חזקה של משתמשים נאמנים, למעלה מ-1,000 איש.
"יש באתר פורום, שבו הם מציעים הצעות, מעירים, מתריעים על באגים בתוכנה, מבקשים תכונות מסוימות. אנחנו גם מספקים להם כל מיני מאפיינים נחמדים. אפשר לראות בתוכנה את המפה האישית של כל גולש, יש תחרות בין קבוצות, לגבי מי ימדוד הכי הרבה, ואפשר להיעזר בסטטיסטיקה שבאתר, כדי לראות מי מוביל. אנחנו משתדלים להציע להם חידושים".
ד"ר שביט קורא לגולשים נוספים להתנדב לפרויקט. "התוכנה כמעט ולא צורכת משאבים", הוא מדגיש, "היא צורכת קרוב ל-0% ממשאבי המעבד ומבחינת רוחב פס אנחנו זקוקים ל-2% בערך. אנחנו לא אוספים מידע אישי ואין לנו צורך לדעת דבר מלבד המיקום של המשתמש. תוכנה המבצעת שתי מדידות בדקה אינה משמעותית עבור המחשב האישי אך עבורנו כל מחשב המצטרף תורם לפרויקט באופן משמעותי".