מנוע חיפוש

del.icio.us del.icio.us
Digg Digg
Furl Furl
Reddit Reddit
Rojo Rojo
Add to OnlyWire

מנוע חיפוש הוא שירות המסופק בתחום המחשבים לחיפוש קבצים או מידע מסוים. בפרט מקובל השימוש במנוע חיפוש לשם איתור מידע באינטרנט, אך הוא שימושי גם במאגרי מידע מקומיים, למשל לשם איתור מידע במאגר פסקי דין הנמצא על תקליטור.

יש להבחין בין מנוע חיפוש, שמאגרי המידע שלו נבנים באופן אוטומטי, באמצעות סריקה של האינטרנט על ידי רובוט, ובין אינדקס, שבו מקוטלג המידע על ידי בני אדם.

בעזרת מנוע חיפוש ניתן למצוא מידע רב, לחפש מוצרים שונים, לחפש תמונות ולחפש מידע אחר. עקרון הפעולה הבסיסי של מנוע חיפוש הוא שהלקוח ממלא שאילתא המציגה את המידע הנחוץ לו ושולח אותה לשרת, השרת מקבל את השאילתא ומפעיל יישום לביצוע הפעולה, תוך הפעלת אלגוריתמים שנועדו לסנן את התוצאות כך שיהיו רק בנושא שהלקוח מחפש. לסיום פעולתו מציג השרת את התשובה בפני המשתמש.

מנוע החיפוש הראשון היה מנוע החיפוש ארצ'י לקבצים בשרתי FTP שפותח ב-1990. לאחריו פותחו שני מוצרים לפרוטוקול גופר, "ורוניקה" ו"ג'ארהד" (ששמותיהם היוו מחווה לשם ארצ'י - ורוניקה ו-ג'ארהד הן דמויות בסדרת הקומיקס ארצ'י). מנוע החיפוש הראשון לאינטרנט היה מנוע בשם Wandex (שלא קיים כיום), שפיתח מתיו גריי מ-MIT ב-1993. באותה שנה פותח גם Aliweb, המנוע הוותיק ביותר שעדיין קיים. ב-1994 יצא לאור Webcrawler, שהיה הראשון ששילב חיפוש בטקסט עצמו ולא רק בכותרות האתרים. באותה שנה פותחו שני מנועי חיפוש שהפכו למובילים בשוק בתקופתם: Lycos, שפותח באוניברסיטת קרנגי מלון; ו-Inforseek. מנועי חיפוש באינטרנט נבחנים על ידי הגולשים לפי איכות התוצאות שהם מספקים, ובהתאם לכך מאז שנת 2001 שולט מנוע החיפוש Google בשוק מנועי החיפוש.

תוכן עניינים

דף תוצאות החיפוש

בדף תוצאות החיפוש, מציג מנוע החיפוש למחפש את תמצית התוצאות שהניב החיפוש. על פי רוב מכיל דף זה כותרת שהיא קישור לדף האינטרנט או למסמך שנמצא וכן חלקי טקסט ובהם משפט או שניים שאמורים להסביר למחפש מדוע נבחר הדף או המסמך להכלל בין התשובות שקיבל.

במנועי חיפוש שונים ניתן למצוא לעיתים מידע נוסף על המסמך כגון גודל המסמך, כתובת המסמך וכן "מטמון" שהוא תמצית המסמך כפי שהיא נרשמה על ידי הבוט בפעם האחרונה שביקר בדף.

במנוע חיפוש המתקיים מפרסומת שהוא מציג, מוצגים בדרך כלל שלושה סוגים של תוצאות:

  • Pay-Per-Click advertising - פרסומות משולבות בראש התוצאות.
  • תוצאות החיפוש – שהן התוצאות ה-"טבעיות" שהחזיר המנוע בתגובה למילות החיפוש שהוזנו על ידי המחפש.
  • פרסומות בצד העמוד.

בעלי אתרים מייחסים חשיבות רבה למיקום האתר שלהם בתוצאות החיפוש שכן למיקום בדף החיפוש יש השפעה מכרעת על כמות הגולשים שיגיעו לאתר ממנוע החיפוש. ומאחר ואפקטיביות של האתר (פרסום, ביצוע מכירה וכדומה) תלויה בכמות המבקרים בו, נוצרת תחרות עזה בין האתרים השונים על המיקום בדף התוצאות. הפעילות של חברות העוסקות בקידום אתרים במנועי חיפוש באה לשפר את מיקומו של האתר בדף התוצאות.

מצד שני מנועי החיפוש פועלים כל הזמן לשפר את תוצאות החיפוש ומנסים לאתר נסיונות התערבות לא "טבעית" בתוצאות. לעיתים קורה שמנועי החיפוש אף "מענישים" אתר שבו הם חושדים שמתקיימת פעילות קידום לא הוגנת בכך שהם מרחיקים את האתר מקידמת תוצאות החיפוש אף מעבר למקום שהיה זוכה לו בלי כל התערבות.

גמישות לשונית

אחת התכונות הבסיסיות שעל מנוע חיפוש לספק היא גמישות לשונית, אם כי מנועי חיפוש רבים עדיין אינם מצוידים בתכונה זו. גמישות לשונית היא יכולתו של מנגנון החיפוש להתגבר על בעיות הקשורות בשפה הטבעית, כגון כתיב מלא וכתיב חסר, יחיד ורבים, טעויות כתיב קלות וכדומה.

רוב מנועי החיפוש לא מאפשרים גמישות במילות החיפוש ובהם גם מנוע החיפוש של אתר ויקיפדיה. משמעות הדבר היא שמנוע החיפוש מוצא רק דפים בהם מופיעות כל המילים הזהות למילות החיפוש. Google באנגלית - ובעברית, הוא בעל יכולת כזו במידה מסוימת. חיפוש wikipedya, למשל, גורם ל-Google לשאול "Did you mean: wikipedia". בעברית, לדוגמה, אם נקליד "מילחמה", גוגל ישאל אותנו אם התכוונו ל"מלחמה".

מבחינה משפטית

מנועי החיפוש מעוררים שורה ארוכה של סוגיות משפטיות שיש לגביהן פסיקות סותרות ומבלבלות. מנועי החיפוש מטלטלים מן היסוד דינים רבים, ובהם: דיני המידע, קניין רוחני, זכויות יוצרים, סימני מסחר, פרטיות, חופש הביטוי וחופש העיסוק. ראו, למשל, תביעה בעניין שימוש בסימן מסחר.

מנוע על

מנוע על (meta-search engine) הוא מנגנון שלוקח שאילתה ממשתמש קצה , שולח אותה במקביל למספר מנועי חיפוש ומחזיר תוצאות מכל אחד ממנועי החיפוש. בהתחשב בכך שאין מנוע חיפוש שמסוגל לקטלג את כל האתרים ברשת האינטרנט, היתרון של מנוע העל הוא ביכולתו להחזיר תוצאות רבות יותר מאשר מנוע חיפוש יחיד. החיסרון של מנועי העל הוא במספר הגדול של תוצאות לא-רלוונטיות שהוא מחזיר לעומת מנוע חיפוש בודד - בעיה אשר איתה ניתן להתמודד דרך ניסוח של שאילתות ממוקדות ושימוש באלגוריתם שיסנן את התוצאות הלא רלוונטיות או ידחוק אותם לסוף רשימת התוצאות.

מנועי על הם מנועים טפיליים - הם לא מכילים בסיס נתונים משל עצמם, אלא משתמשים בבסיסי נתונים של מנועים אחרים. הקושי בבניית אלגוריתם למנוע על הוא בסידור תוצאות החיפוש של המנועים השונים לפי רלוונטיות, כאשר לכל מנוע יש שיטה שונה לדרוג האתרים. בנוסף לכך, מכיוון שלכל מנוע חיפוש יש שיטה שונה במקצת לניסוח שאילתות, האלגוריתם של מנוע העל צריך 'לתרגם' את השאילתה של המשתמש כך שתתאים לכל אחד ממנועי החיפוש. כתוצאה מכך, מנוע העל לא יכול לנצל את כל אפשרויות החיפוש של המנועים השונים (לדוגמה, כאשר במנוע חיפוש אחד יש אפשרות שלא קיימת בשאר המנועים).

נאמנות למנוע חיפוש ספציפי

אחת השאלות המרכזיות ביחס למנועי החיפוש היא מה גורם לאדם לפתח נאמנות למנוע חיפוש ספציפי זה או אחר. מחקרים שנערכו לאחרונה[דרוש מקור] מלמדים שגולשי אינטרנט מפתחים נאמנות למנוע חיפוש ספציפי, בעיקר בשל שירותים נוספים שהוא מספק ואשר מסונכרנים עם יכולת החיפוש. לדוגמה, מנוע החיפוש גוגל מספק שורה ארוכה של שירותים מסונכרנים לחיפוש כמו: שירותי התראות, דואר אלקטרוני, העלאת קבצים לרשת, פתיחה וניהול של בלוגים ועוד. הרציונל שבני אדם מפתחים נאמנות למנוע חיפוש בשל השירותים הנוספים שהוא מספק, מסביר היטב מדוע גוגל רכשה לאחרונה את אתר האינטרנט youtube. למעשה, באמצעות רכישה זאת, גוגל מצפה לחזק ולפתח את נאמנות גולשי האינטרנט למנוע החיפוש שלה, וזאת על ידי הענקת שירות חדש של סרטי וידאו המסונכרנים לחיפוש בגוגל.

לקריאה נוספת

  • ג'ון בטל, החיפוש – כיצד גוגל ומתחרותיה שינו את פני התרבות וכתבו מחדש את חוקי עולם העסקים, הוצאת "עברית" ו"כתר", 2006.
  • Allan Hanson, From classification to indexing: How automation transforms the way we think, in: Social Epistemology, Volume 18, Number 4, October-December 2004 , pp. 333-356. (אנגלית) (אבסטרקט)

קישורים חיצוניים

This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.


Giant Panda

Mercedes Car
James Bond Guide
This site monitored by SitePinger.net