Professioneel zoeken | Achtergronden | Handige zoeksites

Handige links

Is een zoekmachine met een grote database de beste?

De omvang van de database, ofwel het aantal geïndexeerde pagina's, van een zoekmachine bepaalt voor een deel het resultaat van een zoekactie. Maar er zijn andere factoren van belang.

De drie belangrijkste criteria waarop zoekmachines inhoudelijk beoordeeld kunnen worden zijn:

Omvang database

De hoeveelheid webpagina's die een zoekmachine heeft bezocht is met name van belang wanneer je op zoek bent naar schaarse informatie. Als er maar twee sites op het web zijn waar de informatie staat die je zoekt, dan moeten die sites wél in de database zitten.

De meeste zoekacties die worden uitgevoerd bij een zoekmachine hebben echter geen betrekking op schaarse informatie. Circa 90 procent van de query's kan worden uitgevoerd door hooguit 10 procent van de database aan te spreken. Journalisten, documentalisten en researchers zijn relatief vaker op zoek naar weinig voorkomende documenten en webpagina's, en hebben dus vaker baat bij een zo groot mogelijke database. Zij kunnen dus beter de grootste zoekmachines hanteren.

Rangschikken

De exacte manier waarop de eerste tien zoekresultaten worden gerangschikt vormen het belangrijkste bedrijfsgeheim van een zoekmachine. In algemene termen willen de bedrijven er wel over spreken, maar de meeste informatie moet toch komen van een uitgebreide analyse van de resultaten.

Rangschikking bepaalt namelijk waarom de ene zoekrobot betere resultaten oplevert is dan een andere, terwijl ze beide toch grotendeels dezelfde webpagina's hebben bezocht.

Momenteel zijn er twee gangbare methoden van rangschikken:

  • op basis van de inhoud en de positie van een pagina
  • op basis van de links van/naar een pagina

Onder de inhoud van een pagina zijn veel meer elementen begrepen dan alleen de zichtbare elementen. Ook de (onzichtbare) metatags tellen mee. Bij de ene machine zwaarder dan de andere trouwens. Elementen: de <TITLE>, de eerste woorden, woorden die als kopregels (<H1>, <H2>) gedefinieerd zijn, <ALT>-tags achter plaatjes. Verder telt mee hoe vaak een woord voorkomt, en wat de onderlinge afstand tussen de woorden is.

Ook de positie binnen de site telt mee bij de beoordeling van het gewicht van een pagina; met andere woorden hoe hoog een pagina eindigt in de zoekresultaten. AltaVista is een zoekmachines zo rangschikt.

Andere zoekmachines laten de links van en naar een pagina zwaar meetellen bij het bepalen van de positie in de zoekresultaten. Sites die veel externe links bevatten staan hoger aangeschreven. Nog beter is het om gelinkt te worden vanaf sites. Hoe drukker bezocht zo'n site is, des te beter het is. Wie een link bij Yahoo heeft, doet het beter dan een link vanaf een particuliere homepage. Google werkt op zo'n manier.

Een variant hierop is het systeem dat Hotbot hanteert

Presentatie en performance

De reactiesnelheid en een overzichtelijke presentatie tenslotte zijn ook van belang bij het beoordelen van de kwaliteiten van een zoekmachine. Grootverbruikers van zoekmachines, professionele zoekers zeg maar, haken al snel af bij te veel toeters en bellen.

De sites weten dat, maar moeten ook erkennen dat veel extra features (gratis webmail, actueel nieuws e.d.) ook belangrijk zijn voor de aantrekkingskracht (stickeyness) van een site.

Veelgebruikers zijn dus aangewezen op de sites die (nog) geen veelheid aan extra's bieden, maar wel kunnen putten uit een enorme database. Momenteel zijn dat Google en FAST (gebruik de Advanced-optie).

(augustus 2000)