SØK

Hva er relevans

Når du skriver inn en spørring på søkemotor sideneller i søkefeltet (øverst på skjermen) begynner nettleseren å skje hendelser som er skjult for vanlige brukere. Hvordan er da informasjonen i den store verdensomspennende websiden, og hva er søkerelevans? Ordet selv stammer fra det latinske "relevo" og er oversatt til russisk som "heve" eller "legge til rette". Den engelske ekvivalenten av begrepet er "relevans". I punkt 3.5.1 i GOST 7.73-96 er dette konseptet dechifisert, og "relevans" og "relevant" har samme definisjon, som består i samsvar med informasjonen mottatt av brukerens informasjonsforespørsel.

Denne nasjonale standarden inneholder også andrenyttige standardiserte termer og definisjoner knyttet til informasjonssøkingsområdet og dets formidling ved hjelp av informasjonsautomatiserte systemer. Dokumentet bidrar til å forstå betydningen av mange ord i informasjon, publisering eller bibliotek, og ikke bare en slik språkgruppe som "relevans". Definisjonen av begrepet "relevantt" og "pertentniy" tolkes også i punkt 3.5.2 i GOST 7.73-96. De bør tolkes som korrespondanse av mottatte informasjonsdata til informasjonsbehovet. Ofte er dette konseptet forvirret med relevans, hvilket i utgangspunktet ikke er sant, da det i et tilfelle er et spørsmål om å matche spørringen, og i det andre tilfellet handler det om korrespondanse av behovet. Det er også feil å svare på spørsmålet: "Hva er relevans?" For å svare på at dette begrepet ligger nær begrepet "tilstrekkelighet", det vil si den praktiske anvendeligheten av resultatet.

Men hvordan er informasjon? Søkemotoren bruker en hær av roboter - styrte programmer, besøkte nettsider og lagre informasjon om dem. Navnet er avledet fra det engelske ordet «bot», som er en forkortelse for «robot». Disse programmene finner nye nettsteder, og deretter gå til hovedsiden og bla gjennom innholdet. Bots lære sider relatert til hjemme (i nettleseren er det lastet først) interne linker. Bots ser også på lenker som peker på andre nettsteder, det vil si eksterne lenker. Lagre denne informasjonen, pass på dem, oppdage nye steder og lære hvordan web-ressurser er koblet sammen. Dermed studerer de utilsiktet "kartet" av World Wide Web. Men hva er relevans? Hva har det å gjøre med bots?

På et konkret eksempel vil vi se det tilbudetsøkemotorer Yandex og Google. På spørsmålet "Hva er relevans?" I utstedelsen av Yandex var det 28 millioner svar, og Googles 155.000. Her kan du si at de alle møter forespørselen, og behovene er ikke alltid, det vil si at ikke alle av dem vil være permanente. For eksempel, sider der Wikipedia-konsernsjefen presenterer en forklaring på dette konseptet, vil uten tvil være nyttig, og et nettsted om relevante og irrelevante kostnader ved avgjørelse er ikke relevant for dette emnet. Et klarere eksempel er at når Yandex utstedte 31 millioner svar på en forespørsel om "hands up", som innebar å få informasjon om en musikkgruppe, og blant dem er det en artikkel med klage på å heve hender, da dette ifølge fysioterapeutene er svært nyttig. Dette svaret kan ikke betraktes som en evigvarende, men ut av 31 millioner svar tar han 586. plass i utlevering.

Dermed er jo høyere relevansen av teksten, denDet er mer sannsynlig at han vil legge inn de første stillingene for søke svar. dette tallet er en kvantitativ vurdering, men algoritmer for realisering i de ulike søkemotorene er annerledes og ukjent for brukerne, og de endrer seg over tid, som søkemotorer prøver å klatre på rankingen, prøver å gi pertinence informasjon, redusere tiden for å søke etter den. Ansett som svært relevante siden ordet oppføring samsvarer med søket kan være i størrelsesorden 3-7%. Men dette er ikke det eneste kriteriet for dokumentets relevans. Disse inkluderer en rekke interne og eksterne indikatorer. Innvendige indikatorer (unntatt ordet tetthet), er deres stilling i teksten (innsettingen av tittel, til deres nærhet til topp- og til hverandre for å danne en sannsynlig søk), og tilstedeværelsen av synonymer, noe som bekrefter at innholdet av spørringen teksten. Hoved eksterne indikatoren anses å være populær i det globale nettverket, som indikerer Pagerank i Google, Yandex og TIC har Tor100 på Rambler systemer. Det vil si, hvor ofte siden overføres fra andre nettsteder, er det bedre hvis de har høye karakterer. Det er hva relevansen er.

  • evaluering: