מחממים מנועים: איזה מנוע חיפוש הכי טוב?

גוגל, יאהו, לייב, Ask או שמא קול? ראנד פישקינג, מייסד אתר SEOmoz, בדק בצורה מקיפה את השאלה הגדולה מכולן: מיהו מנוע החיפוש הטוב ביותר באינטרנט; האם קול, המתחרה החדש בזירה, עומד בציפיות? התוצאות מפתיעות

  • פורסם לראשונה: 16:46
  • 01.08.2008
  • עודכן ב: 19:31
  • 01.08.2008
  • מאת: ראנד פישקין
  • הוסף תגובה

השבוע האחרון עמד ללא ספק בסימן כניסתו לזירה של מנוע החיפוש קול (Cuil). בתור חובב ותיק של טכנולוגיות חיפוש בכלל והאופן בו פועלים מנועי חיפוש בפרט, ביליתי בימים האחרונים זמן רב עם השירות החדש בניסיון לבדוק כיצד הוא עומד בהשוואה למובילי התעשייה - גוגל, יאהו, לייב (Live), ו-Ask.

כאשר אני ניגש להעריך את הביצועים של מנועי החיפוש המרכזיים, ישנם מספר גורמים הנתפסים בעיני כקריטיים. הגורמים הללו הם (לפי הסדר): רלוונטיות התוצאות, כיסוי, רעננות, גיוון, וחוויית משתמש. תחילה, בואו נעיף מבט מהיר על הציון הכולל של חמשת המנועים, ואז נצלול עמוק יותר לכל אחד מהקריטריונים.

כמה אבחנות בנוגע לממצאים:

• אני לא ממש מופתע למצוא את יאהו במקום הראשון. למרות חולשה מסוימת בשאילתות על נושאים אזוטריים, כאשר מסתכלים על התמונה הכללית יאהו נמצאת בפסגה לצד גוגל. זו גם ככל הנראה הסיבה שאנשים לא עברו לחלוטין לגוגל למרות המותג החזק יותר אותו בנתה החברה בתחום החיפוש.

• גוגל טובה בכל הפרמטרים - שוב, לא הפתעה גדולה. מנוע החיפוש של גוגל הוא העקבי ביותר ומקבל תוצאות מרשימות כמעט בכל מבחן. לטעמי, למרות שיאהו קיבל את הציון הסופי הגבוה ביותר, גוגל הוא עדיין המוביל בין מנועי החיפוש, ואליו צריכים שאר המתחרים לשאת את עיניהם.

• למנוע החיפוש של Ask יש לא מעט יתרונות בכל מה שקשור לגיוון וחוויית משתמש, זאת תודות לממשק התלת-ממדי שלו אשר לדעתי מספק תוצאות באמת מצוינות, במיוחד בנושאי חיפוש הזוכים לפופולריות רבה.

• בכל מה שקשור לגודל האינדקס, נראה כי יאהו הוא המנצח, אולם אני מעריך כי ייתכן שהבדיקה אותה עשיתי מעט מטעה. למרות שיאהו מחזיק באופן ברור יותר דפים על רבים מהמתחמים (domains), אני חושד שגוגל הוא למעשה גם המהיר יותר וגם הרחב יותר, אבל פשוט מחזיק פחות מידע באינדקס המרכזי (מה שאולי אפילו מסייע לרלוונטיות של התוצאות). בנוסף, גוגל עושה עבודה מצוינת בביטול כפילויות, תחום בו יאהו ושאר המנועים לוקים בחסר.

• ההפתעה הגדולה ביותר מבחינתי? לייב של מיקרוסופט. אני המום מכך שהאיכות והרלוונטיות של לייב כל כך גבוהים יחסית. לא עשיתי מחקר מסוג זה מאז 2006, אולם כמה עשרות החיפושים אותם הרצתי בלייב כל חודש תמיד השיגו תוצאות גרועות בהשוואה למה שקיבלתי הפעם. אין ספק כי הוא משתפר, והופך לשחקן רציני בתחום. בעייתו הגדולה ביותר היא עדיין ספאם וקישורים שתולים (אותם אלגוריתם הניתוח שלו לא מצליח לאתר ולמחוק). אם האנשים במיקרוסופט יצליחו לתקן את זה, אני חושב שהם בדרכם להיות מנוע חיפוש מוביל.

• קול לא תומך בחלק גדול מהאפשרויות הסטנדרטיות של חיפוש מתקדם כגון שלילת מילות מפתח, חיפוש בכותרות בלבד (intitle:) וכדומה, מה שמקשה מאוד למדוד אותו בכל מה שקשור לגודל האינדקס (למרות שמצבים בהם החזיר אפס התאמות לשאילתות בהן מנועי החיפוש האחרים החזירו מאות ואלפי תוצאות מדברים בעד עצמם).

• האנשים בקול עשו שטות בכך שיצאו בהשקה דווקא עכשיו. בהתחשב בבאז שהיה סביבם והפוטנציאל לכבוש נתח שוק (אפילו שבריר אחוז שווה מיליונים), הם היו צריכים להעסיק הרבה אנשים כמוני שיבצעו הרבה מבחנים כמו זה, ויראו להם באיזה פיגור הם נמצאים בהשוואה לשאר מנועי החיפוש הגדולים. אתם מקבלים רק צ'אנס אחד לעשות רושם ראשוני, והרושם שלהם נהרס. אני לא מתכוון לנבא עדיין את כישלונם, אבל אני בהחלט צופה שייקח עוד זמן רב עד שמייקל ארינגטון (מייסד TechCrunch) או כל אדם אחר בתעשיית ההיי-טק או בתקשורת יאמין פעם נוספת להבטחות שלהם ללא הוכחות חותכות. האינדקס של קול, ממה שהצלחתי לבדוק, קטן יותר מכל אחד מהמנועים האחרים, והרלוונטיות שלו נמוכה יותר באופן עקבי. באופן אישי, אני מרגיש ממש רע עבורם - היו לי תקוות רבות שמישהו יקרא סוף סוף תיגר על גוגל ויהפוך את שוק החיפוש למעניין יותר. נו טוב, אולי בפעם הבאה (בהנחה שקרנות הון סיכון תהיינה מוכנות להמשיך לזרוק למעלה מ-30 מיליון דולר על מיזמים מסוג זה).

כמה מילים על מתודולוגיה:

בכל אחד ממנועי החיפוש הרצתי מספר חיפושים השונים זה מזה מבחינת סוג מחרוזת השאילתה. זהו המקום בו הבנה כיצד עובדת עקומת הדרישה של מנועי חיפוש חיונית לקביעת הביצועים. יש מנועים שמצטיינים בהחזרת תוצאות מעולות עבור השאילתות הפופולריות ביותר, אולם לוקים בחסר בשאילתות אזוטריות השייכות ל"זנב" של עקומת הדרישה. על מנת להיות מנוע חיפוש טוב באמת, עליך להיות מסוגל להתמודד היטב עם שני המצבים.

במרבית המקרים, עשיתי שימוש במונחי חיפוש וביטויים שמייצגים נקודות שונות על פני עקומת הדרישה, החל מהשאילתות הפופולריות ביותר (כגון "Barack Obama" ו-"Photography") וכלה בשאילתות אזוטריות (כגון "pacific islands polytheistic cultures" ו-"chemical compounds formed with baking soda"). תוכלו לראות רשימה מלאה של השאילתות בהן השתמשתי מתחת לכל סעיף. במהלך הבדיקה, עשיתי שימוש בסולם הציונים הבא על מנת לדרג את איכותם של מנועי החיפוש:


כעת בואו נצלול אל תהליך איסוף המידע

רלוונטיות:

רלוונטיות מוגדרת על ידי האיכות הבסיסית של התוצאות - ככל שהן יותר נוגעות לנושא ובעלות ערך עבור המשתמש, כך רמת הרלוונטיות גבוהה יותר. מדידה של איכות היא תמיד דבר סובייקטיבי אולם מניסיוני, אפילו מספר נמוך של שאילתות יכול לספק תובנות לגבי איכות התוצאות של מנוע חיפוש. על מנת לקבוע רמת רלוונטיות, פשוט הערכתי את המידה בה התוצאות ענו על צרכי השאילתה, ונתתי ציון טוב ככל שהתוצאות המתאימות הופיעו יותר גבוה במעלה הרשימה.

להלן השאילתות בהן עשיתי שימוש על מנת לבחון את ביצועי מנועי החיפוש

עבור שאילתות "סופר-פופולריות": gas prices, iphone, facebook, dark knight, barack obama

עבור שאילתות פופולריות: laptops, photography, rental cars, scholarship, house plans

עבור שאילתות בעלות רמת פופולריות בינונית: fire prevention, calendar software, snow tires, economic stimulus payment, nintendo wii games

עבור שאילתות אזוטריות: pacific islands polytheistic cultures, chemical compounds formed with baking soda, genuine buddy 50 scooter reviews, google toolbar pagerank formula, getting a novel published

עבור שאילתות בנושאים טכניים: metalworking inurl:blog, cricket -site:.co.uk -site:.com.au, dark crystal site:imdb.com, top * ways, definition sycophant


כיסוי:

כיסוי (Coverage) מלמד בעצם על גודל האינדקס של מנוע החיפוש ומהירותו של תהליך הקיטלוג - ככל שהאינדקס גדול והתהליך מהיר יותר, כך מספר הדפים הרלוונטיים אותם יכול המנוע להחזיר גדול יותר. על מנת למדוד אספקט זה, התמקדתי בכיסוי של אתרים ספציפיים (גדולים וקטנים), וכן הרצתי שאילתות השייכות לזנב של עקומת הדרישה.

השאילתות בהן עשיתי שימוש

עבור אתרים גדולים: site:government.hp.com, site:research.ibm.com/leem, welsh rugby site:bbc.co.uk, search engine optimization site:w3.org, tango tapas seattle site:nytimes.com

עבור אתרים בינוניים: site:seomoz.org/blog, site:news.ycombinator.com, site:education.com/magazine, bumbershoot site:thestranger.com, snowboards site:evogear.com

עבור אתרים קטנים: site:downtownartwalk.com, site:amphl.org/, site:totebo.com, dockboard site:loadingdocksupply.com, site:microsites.audi.com/audia5


רעננות:

למרות שכיסוי יכול ללמד על גודל האינדקס ומהירות בניית הקטלוג, רעננות (Freshness) של תוצאות מלמדת על מאמץ אמיתי של מנוע החיפוש למקם פריטי חדשות טריים ורלוונטיים כמו גם נושאים חמים אחרים בראש רשימת התוצאות. עשיתי שימוש בכמה וכמה שאילתות הקשורות לאירועים עדכניים, גם כאלה שזכו לפופולריות רבה וגם כאלה שנותרו לא מוכרים (כולל דפים חדשים השייכים למתחמים קטנים יחסית) על מנת לבחון את דרגת הרעננות אותה מספק מנוע החיפוש.

שאילתות בהן השתמשתי

• נושאים "סופר-פופולריים": los angeles earthquake, obama germany, gas prices, ted stevens, beijing Olympics

• נושאים פופולריים: new york city weather, dow jones average, seattle mariners schedule, cuil launch, nasa news

• נושאים בעלי רמת פופולריות בינונית: warp speed engine, unesco world heritage, movie times 98115, comic con 2008, most charitable us cities

• נושאים לא מוכרים: melinda van wingen, over the hedge comic 7/28, seomoz give it up blog, scrabulous facebook, internet startups that failed miserably


גיוון (Diversity):

כאשר שאילתות חיפוש הופכות מעורפלות או דו-משמעיות, מנועים פחות טובים מתקשים לספק תוצאות איכותיות, בעוד המנועים המובילים מסוגלים לספק ערך מוסף גבוה בזכות מגוון רחב של תוצאות ואפילו על ידי שהם מציגים הצעות לשיפור השאילתה על מנת להפוך אותה לברורה יותר.

השאילתות בהן השתמשתי (עשיתי שימוש ב-3 שאילתות בלבד לכל רמה)

• שאילתות מאוד דו-משמעיות: mouse, ruby, drivers

שאילתות בעלות רמה מסוימת של דו-משמעות: comics, shipping, earth

שאילתות ברורות יחסית: ibm, harry potter, graphic design

שאילתות שמשמעותן ברורה לחלוטין: seattle children's hospital map, color wheel diagram, great gatsby amazon


חוויית משתמש:

העיצוב, הממשק, המאפיינים, המהירות, ואיכות התוצאות כולם נכללים בקטגוריה של חוויית משתמש. מנוע שמציע תצוגה יוצאת דופן עשוי לקבל דירוג גבוה או נמוך, בהתאם לאיכות התוצאות שהוצגו והאם המידע הנוסף המתאפשר בזכות העיצוב המיוחד אכן מספק ערך מוסף. במקום להריץ סדרה של שאילתות, שפטתי את כל אחד מהמנועים בהתבסס על ההיצע שלהם בתחום תוך שימוש במידע שצברתי בשאר חלקי המבדק, וכן על סמך ניסיוני הקודם עם כל אחד מהם.

טבלת חוויית המשתמש מתבססת על הפרמטרים הבאים

• Query Speed - הזמן הממוצע מרגע הלחיצה על כפתור החיפוש ועד טעינתו באופן מלא של דף התוצאות.

• Results Layout - סידורן של התוצאות על הדף, קיומן של מודעות פרסום, הצעות לשאילתות אלטרנטיביות, אפשרויות ניווט, וכדומה.

• Vertical Inclusion - הכללתן של תשובות מיידיות (instant answer) כחלק מהתוצאות (כלומר, כאשר אני מריץ שאילתה כגון "what is the currency in Israel" אני מצפה שבראש הרשימה תופיע התשובה הפשוטה "New Israeli Sheqel".

• Query Assistance - השימוש בשאילתות דומות/קשורות והתמודדות עם רב-משמעויות.

• Advanced Features - היכולת לבצע חיפושים ספציפיים לאתר, האפשרות לחפש מונחים אך ורק אם הם מופיעים בכותרת, אפשרות לצמצם את החיפוש על פי שם מתחם, וכדומה.



לאלה מכם שהיו רוצים לספק תובנות משלהם אודות כיצד יש לבחון מנוע חיפוש, Slate.com מקיים תחרות קוראים בשאלה  ?How do we know if a new search engine is any good - אני ממליץ בחום להשתתף.

אם אתם מתעניינים, להלן תמונת מסך של הגיליון האלקטרוני שייצרתי ב-Google Docs על מנת לרכז את תוצאות המבדק (תוכלו לקרוא את המסמך המלא בקישור הבא)

מבדק מהסוג הזה מצריך עבודה רבה, ולמרות שהוא אינו מדויק מבחינה מדעית או סטטיסטית, ואף ללא ספק מוטה (אני השופט היחיד), אני חושב שהתוצאות דווקא די מועילות ומדויקות, אם כי יהיה זה מרתק להריץ מחקרים פומביים כמו זה על בסיס מדגם רחב בעל משמעות סטטיסטית.

הכותב הינו בלוגר ומייסד האתר הטכנולוגי SEOmoz.org


עוד בנושא - המתחרה של גוגל: עובדים לשעבר בחברה משיקים היום מנוע חיפוש בשם Cuil | מעניין לי את הקולי | דיונים חמים בנושא, בקהילת ווב 2.0 ב-TheMarker Cafe

לקבלת עידכונים מ-TheMarker IT, הרשמו לניוזלטר שלנו 

עקבו אחרינו בטוויטר
עשו לנו לייק וקבלו את מיטב הכתבות ישירות לפייסבוק

הוספת תגובה
תודה על פנייתך, היא תיבדק על ידי המערכת

הקלד את הנושא

הקלד את התגובה

שלח להוספת תגובה בלתי מזוהה לחץ כאן להוספת תגובה מזוהה לחץ כאן
תודה על פנייתך, היא תיבדק על ידי המערכת

הקלד את הנושא

הקלד את התגובה

שלח סגור להוספת תגובה בלתי מזוהה לחץ כאן להוספת תגובה מזוהה לחץ כאן
תודה על פנייתך, היא תיבדק על ידי המערכת
פרוייקטים מיוחדים
הרשמה לניוזלטר טקניישן
רוצים לקבל למייל את כל חדשות הטכנולוגיה? הירשמו לניוזלטר טקניישן
ברצוני לקבל ניוזלטרים, מידע שיווקי והטבות
נא להזין כתובת מייל חוקית
הפופולריות בדיגיטל
הצעות מיוחדות