Ny metode kan bedre internsøk
Dessverre har det ikke vært enkelt å overføre Googles virkemåte til søk på internt nettsted eller intranett. Men en artikkel publisert av Microsoft Research beskriver hvordan man kan forbedre søk i websider ved hjelp av implisitte lenker.
http://www2006.org/programme/files/xhtml/559/559-shen.html
Hva er implisitte lenker?
Når en bruker klikker på to forskjellige dokumenter som har likhetstrekk i søkeresultatene, ekstraheres en implisitt lenke maskinelt fra webloggen. Så neste gang noen gjør et tilsvarende søk, vil disse dokumentene grupperes tettere sammen. Stadig flere brukere foretrekker å benytte søk til gjenfinning, og dermed vil man etter hvert få et stort og bredt datagrunnlag som kontinuerlig forbedrer trefflisten.
Mer presist resultat
Implisitte lenker en et kjærkomment alternativ til rangering basert på andre teknikker, som eksplisitte lenker (hyperlenker), manuell klassifisering (som Open Directory) og tekstanalyse. Google er i stor grad basert på eksplisitte lenker, noe som det ofte finnes få av inn til bedriftsnettsteder. Men ved å bruke en målemetode for tekstkategorisering (macro-F1 measurement), har Microsoft kommet fram til at søk ved hjelp av implisitte lenker kan gi et 20% mer presist resultat – og følgelig er en gunstig metode for internsøk.
Relevant for brukeren
Flere gode løsninger for gjenfinning har vist at søk basert på innholdet i et nettsted alene ikke er godt nok for klassifisering. Man trenger også tilleggsinformasjon, for eksempel hvordan innholdet blir vurdert og klassifisert av andre brukere. Implisitte lenker binder sammen innhold som blir sett på som relevant i brukerens kontekst, og kan følgelig være nyttig.
Svakheter
Ved å benytte implisitte lenker kan man unngå problemer med manipulering av eksplisitte lenker som Google daglig sliter med. Weblogger kan imidlertid også lures, og man kan aldri være sikker på om det er faktiske brukere eller spesiallagde applikasjoner som klikker på treffene i søkeresultatene. Man kan også stille spørsmålstegn ved selve testen Microsoft har foretatt, da det ikke kommer tydelig frem hvilke søkeprodukter eller algoritmer som er sammenlignet, eller hvordan søkeord har blitt valgt ut.
En god idé
Vi i Halogen liker likevel ideen med implisitte lenker som baseres på sluttbrukerens egne vurderinger av hvilket innhold som hører sammen. I tillegg utnyttes mer av den latente kunnskapen som ligger i weblogger, slik at brukerne kan få noe igjen for alt det slitet de har lagt ned i forsøket på å gjenfinne innhold.