A | A | A

ALGORYTM WYSZUKIWANIA

Współczesne komercyjne silniki wyszukiwarek bazują na nauce odnajdywania informacji. Nauka ta istnieje od połowy XX wieku, kiedy systemy takie wspomagały wyszukiwanie w bibliotekach, placówkach badawczych i laboratoriach rządowych. W początkowej fazie rozwoju tej dziedziny naukowcy zdali sobie sprawę, że prawidłowość funkcji wyszukujących opierała się na dwóch krytycznych komponentach:

  • Odpowiedniość / prawidłowość – stopień do którego zawartość zwracanych dokumentów odpowiadała zapytaniu użytkownika pod względem zamiarów i warunków
  • Popularność – mierzona na podstawie ilości odwołań lub cytatów (w kręgach akademickich i biznesowych często jedna praca odwołuje się do innej). Każdy dokument, który odwołuje się do innego zwiększa jego współczynnik popularności.

Wiele lat później obie te własności zostały przeniesione do realiów Internetu. Popularność strony mierzona jest przez silniki wyszukiwarek na podstawie liczby wizyt w ciągu określonego czasu oraz czasu spędzonego przez internautę na danej stronie. Pozycjonowanie strony dla tego parametru polega na umieszczeniu takiego tekstu w tytule strony oraz w jej opisie, aby zdecydowanie zachęcał internautę do kliknięcia linku w wynikach wyszukiwarki i odwiedzenia serwisu. Czas spędzony internauty na stronie zależy oczywiście od tego, czy znajdzie na niej informacje jakich poszukiwał oraz jak bardzo znaleziona treść będzie dla niego interesująca. Im częściej serwis będzie odwiedzany przez użytkowników wyszukiwarki oraz im więcej czasu będą oni spędzać na stronie, tym parametr popularności strony w wyszukiwarce będzie rósł i tym wyżej będzie umieszczana strona pośród kolejnych wyników wyszukiwania.

PageRank to metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Na podstawie tej wartości ustalany jest ranking znalezionych stron w wyszukiwarce dla każdego zapytania. Algorytm PageRank został opracowany przez założycieli firmy Google Larry'ego Page'a i Sergeya Brina podczas ich studiów na Uniwersytecie Stanforda w 1998 roku. PageRank jest rozwinięciem znanej od dawna heurystyki, wedle której jakość tekstu jest proporcjonalna do ilości tekstów, które się na niego powołują. Rozwinięcie zaproponowane przez autorów Google polegało na ważeniu sumy linków wskazujących na rozpatrywany tekst ich własną wartością PageRank. Innymi słowy: jeśli na dany tekst powołuje się artykuł, który sam ma wysoką ocenę, ma to większe znaczenie niż gdy na ten sam tekst powołuje się mało popularna strona.


Skocz do góry strony ↑