Význam PageRanku ako patentovanej techniky Google a jeho vplyv pri posudzovaní dôležitosti webovej stránky

Prof. PhDr. Soňa Makulová, PhD. 1. september 2009 v kategórii SEO optimalizácia

Úvod

V augustovom čísle elektronického spravodaja sme si v článku Prečo sú dôležité spätné spojenia a ich text vedúci na stránku objasnili význam spojení a ich textu na radenie záznamov vo výsledkoch vyhľadávania. Bol to práve vyhľadávač Google, ktorý začal pripisovať veľký význam spojeniam, ktoré vedú na stránku. Dokonca pôvodné meno Google v januári 1996 pred oficiálnym spustením bolo BackRub, práve kvôli schopnostiam analyzovať spojenia vedúce na webové sídlo.

Zatiaľ čo v prvých počiatkoch sa dával veľký dôraz na počet spojení vedúcich na stránku, dnes aj ako odozva na rôzne techniky spamu, sa berie do úvahy predovšetkým, kto odkazuje na Vašu stránku a aký má odkazujúca stránka PageRank. Preto je veľmi dôležité zaregistrovať webové sídlo v relevantných adresároch internetu s vysokým PageRankom a venovať pozornosť textom spojenia v odkazoch.

Ako určíme hodnotu stránky a PageRank

Prieskumové stroje využívajú počet spojení, ktoré vedie na stránku ako indikátor kvality stránky (Google nazýva túto kvalitu PageRankom). Podľa tvorcov Google predstavuje práve PageRank srdce systému. Patentovaná technológia PageRank bola vyvinutá zakladateľmi Google Larry Pagom a Sergeyom Brinom na univerzite v Stanforde počas ich doktorandského štúdia. Zjednodušene môžeme povedať, že PageRank je hodnota, ktorú Google dá Vašej stránke a ktorá vychádza z počtu a typu spojení vedúcich na stránku.

PageRank sa využíva veľmi často pri optimalizácii stránok pre vyhľadávacie nástroje z viacerých dôvodov. Ako aj uvádza Kent (2004 s. 213 - 222) je to predovšetkým preto, že Google je stále považovaný za najvýznamnejší vyhľadávací nástroj. PageRank sa dá pomerne veľmi jednoducho zistiť nainštalovaním lišty Google Toolbar.

Obr. Pri nainštalovaní lišty Google zistíme PageRank danej stránky

Obr. Pri nainštalovaní lišty Google zistíme PageRank danej stránky

Ako vidíme v hornej časti obrázku, ak si nainštalujeme lištu Google toolbar (http://toolbar.google.com/T4/index.html) zistíme PageRank danej stránky.  PageRank webovej stránky www.elet.sk je 6 z celkovej stupnice 10, čo sa považuje už za veľmi dobrý PageRank. Musíme si ale uvedomiť, že PageRank sa počíta pre každú stránku webového sídla zvlášť. Presvedčíme sa o tom veľmi jednoducho. Na nasledujúcich dvoch obrázkoch vidíme PageRank článkov z elektronického spravodaja ELET. Článok Prečo sú dôležité spätné spojenia a ich text vedúci na stránku, ktorý bol publikovaný pred mesiacom v auguste 2009 nemá ešte žiaden PageRank. Naopak, článok Na webovom sídle by mali byť vždy funkčné spojenia a správny html kód, ktorý bol publikovaný v januári 2008 už má PageRank 4 z celkovej stupnice 10.

Obr. Článok publikovaný pred mesiacom ešte nemá žiaden PageRank

Obr. Článok publikovaný pred mesiacom ešte nemá žiaden PageRank

Obr. Článok publikovaný v januári 2008 má už PageRank 4 z 8

Obr. Článok publikovaný v januári 2008 má už PageRank 4 z 10

Ako vypočítame PageRank

PageRank je obchodná značka spoločnosti Google a zároveň aj patent Stanfordskej univerzity. Podrobne je popísaný v ich článku The Anatomy of a Large-Scale Hypertextual Web Search Engine. Ako autori v úvode uvádzajú, v článku predstavujú prototyp vyhľadávacieho nástroja, ktorý využíva analýzu hypertextových spojení. Už v článku ho nazývajú Google a zdôrazňujú, že Google bol navrhnutý tak, aby monitoroval a indexoval  web ďaleko efektívnejšie ako predchádzajúce systémy a zároveň poskytoval ďaleko lepšie výsledky vo vyhľadávaní. V tom čase predstavoval prototyp databázu približne 24 miliónov stránok, ktorá bola k dispozícii na Stanfordskej univerzite.

Aj keď je algoritmus PageRanku podrobne v článku popísaný, nie je stále úplne zrejmé, či algoritmus, ktorý používa Google je presne ten istý. Jedno je ale isté, že je veľmi podobný. Napriek dôležitosti PageRanku by sme si mali uvedomiť, že predstavuje iba jedno z dôležitých kritérií, ktoré sa berú do úvahy pri zobrazení relevantných záznamov. Preto je možné, že pre niektoré kľúčové slová sa môžu umiestniť vyššie aj stránky s nižším PageRankom.

Ako je aj deklarované na webovom sídle spoločnosti Google, cieľom je vyvinúť perfektný vyhľadávací nástroj. Podľa Larry Paga by mal uvedený nástroj presne rozumieť tomu čo chcete a dať Vám presne to čo potrebujete.  Práve preto bola vyvinutá patentovaná technológia  PageRank™. Okrem nej sa využíva viac ako 200 ďalších ukazovateľov pri analýze štruktúry webu a určení dôležitosti jednotlivých stránok.

PageRank odráža názor Google na dôležitosť webových sídiel tak, že sa berie do úvahy viac ako 500 miliónov premenných a 2 miliardy termínov.  Stránky, ktoré Google pokladá za dôležité získavajú väčší PageRank a väčšinou sa zobrazia ako prvé vo výsledkoch vyhĺadávania. Technológia Google predstavuje kolektívnu inteligenciu webu, ktorá určuje dôležitosť webovej stránky.

Algoritmus využíva štruktúru hypertextových odkazov ako vzájomné odporúčanie stránok, čo poznáme aj pri hodnotení vedeckých prác podľa počtu citácií. Ale je tu jeden podstatný rozdiel, hodnotenie stránky sa nepočíta iba z celkového počtu odkazov, ktoré na ňu vedú, ale do úvahy sa berie aj hodnotenie alebo PageRank odkazujúcich stránok. Ohodnotenie stránky podľa PageRank môže dosiahnuť najviac 10 bodov.

Ak teda zo stránky A vedie odkaz na stránku B, stránka A tak vlastne posiela hlas stránke B. Čím viac hlasov stránka dostáva, tým je významnejšia. Počet odkazov nie je tak dôležitý ako to, odkiaľ odkaz na stránku prichádza. Vychádza z demokratického charakteru webu a využíva štruktúru hypertextových odkazov ako indikátor dôležitosti každej jednotlivej stránky.

Pôvodný algoritmus pre výpočet PageRanku, ktorý zverejnili jeho autori Larry Page a Sergey Brin (1998) je nasledovný:

PR (A) = (1-d) + d ( PR(T1) / C(T1) + ... + PR(Tn) / C(Tn))

  • PR(A) je PageRank stránky A
  • PR(Ti) je PageRank stránok Ti, ktoré odkazujú na stránku A
  • T1 ....Tn sú stránky odkazujúce na stránku A 
  • C(Ti) je počet odchádzajúcich odkazov zo stránok Tn
  • d je tzv. damping faktor alebo faktor útlmu, ktorý môže mať hodnotu od 0 do 1. Väčšinou je nastavený na 0,85.

Uvedený vzorec sa nám môže zdať byť komplikovaný a preto je dôležité si zapamätať nasledovné skutočnosti:

  • Stránka má PageRank iba v prípade, že bola zindexovaná vyhĺadávačom Google. Preto niektoré stránky ešte PageRank nemajú.
  • Akonáhle je stránka zindexovaná vyhľadávačom Google má určitý PageRank, ktorý býva zo začiatku veľmi malý.
  • V prípade, že z Vašej stránky odkazujete na inú stránku, znamená to, že dávate tejto stránke Váš hlas. Čím viac stránok na danú stránku odkazuje, tým viac hlasov získava a jej PageRank sa zvyšuje.
  • Aj keď odkazujete na iné stránky, neznamená to, že tým znižujete PageRank Vašej stránky.
  • PageRank sa dá zvýšiť dvoma spôsobmi:
    • zvýšiť počet stránok na webovom sídle, ktoré sú prepojené odkazmi,
    • získať odkazy z tematicky podobných sídiel.   
  • PageRank sa neurčuje pre celý web, ale pre každú stránku zvlášť.

Pre výpočet PageRanku jednej stránky potrebujeme poznať všetky ostatné PageRanky stránok, ktoré na ňu odkazujú ale takisto aj počet odkazov z každej stránky. 

Čím viac odkazov vedie z určitej stránky, tým sa aj PageRank danej stránky rozdelí na viac stránok. Uvedený model je vysvetlený zjednodušene v článku  The PageRank Citation Ranking: Bringing Order to the Web. Ako vidíme na nasledujúcom obrázku, stránka, ktorá má PageRank 100 odkazuje na dve stránky a preto dáva každej stránke 50 bodov. Na druhej strane, stránka, ktorá má PageRank 9 odkazuje na 3 stránky a preto dáva každej stránke 3 body. Na stránku vpravo hore prichádzajú dva odkazy s hodnotami 50 a 3, jej PageRank teda bude 53.

Obr. Zjednodušený výpočet PageRanku (The PageRank Citation Ranking: Bringing Order to the Web 1998)

Obr. Zjednodušený výpočet PageRanku (The PageRank Citation Ranking: Bringing Order to the Web 1998)

Vzhľadom na mnohé techniky spamu, ku ktorým patria aj tzv. farmy liniek a kupovanie spojení sa v poslednom čase stále viac kladie dôraz na odkazy z tematicky príbuzných sídiel a vytváranie tzv. tematicky orientovaného PageRanku, ktorý vychádza z modelu náhodného surfistu popísaného v článku The PageRank Citation Ranking: Bringing Order to the Web. Tento sa prechádza po webe prostredníctvom náhodného sledovania hypertextových odkazov. Pravdepodobnosť, že náhodný surfista navštívi konkrétnu stránku vyjadruje jej PageRank. Surfista sa väčšinou nikdy nevracia späť tlačítkom back, ale ak ho surfovanie prestane baviť alebo príde na stránku, z ktorej nevedú žiadne ďalšie spojenia, začne odznova na novej náhodnej stránke. Táto skutočnosť je vyjadrená vo vyššie spomínanom faktore útlmu (damping factor), čiže pravdepodobnosti, že surfista ukončí sledovanie spojení a bude vyžadovať novú náhodnú stránku. Preto je vždy pravdepodobnosť, že na stránku náhodný surfista odskočí je 1-d, takže stránka má vždy minimálny PageRank.

Záver

V dnešnom čísle elektronického spravodaja sme si predstavili význam PageRanku ako patentovanej techniky Google pri SEO optimalizácii.
Ako sme uviedli, čím je stránka kvalitnejšia, tým viac relevantných odkazov na ňu vedie a stránka získava vysoké umiestnenie pri výsledkoch vo vyhľadávaní. Vzhľadom na zložitosť problematiky sa tematicky orientovanému PageRanku budeme venovať aj v októbrovom čísle elektronického spravodaja.


Literatúra


a) BRIN, Sergey - PAGE, Lawrence. 1998. The Anatomy of a Large-Scale Hypertextual Search Web Engine [online]. Standford : Standford University, 1998 [cit. 2009-08-01]. Dostupné na internete: http://infolab.stanford.edu/~backrub/google.html

b) DUKÁTOVÁ, Jana. 2007. Optimalizácia webových stránok pre vyhľadávacie nástroje internetu. [Diplomová práca]. Bratislava : Filozofická faktulta Univerzity Komenského, 2007. 103 s.

c) The PageRank Citation Ranking: Bringing Order to the Web. 1998. Technical report. Standford InfoLab [cit. 2009-08-01]. Dostupné na internete: http://ilpubs.stanford.edu:8090/422/

d) Google Ranking Factors - SEO Checklist. [cit. 2009-07-10]. Dostupné na internete: http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm#positive-on

e) KENT, Peter. 2004. Search engine optimization for dummies.  Indianapolis : Wiley Publishing, 2004. 384 s. ISBN 0-7645-6758-6.

f) MAKULOVÁ, Soňa. 2009. Najdôležitejšie faktory, ktoré vplývajú na umiestnenie stránky vo vyhľadávačoch. In Newsletter. 1. júl 2009 [online],  [cit. 2009-08-13].  Dostupné na internete: http://www.elet.sk/?seo-optimalizacia-1&sprava=najdolezitejsie-faktory-ktore-vplyvaju-na-umiestnenie-stranky-vo-vyhladavacoch

g) MAKULOVÁ, Soňa. 2006. Analýza faktorov vplývajúcich na nájditeľnosť webových sídiel. In: Information Use in Information Society. International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava : Centrum VTI SR, 2006, s. 109 – 118

h) Search Engine Ranking FactorsV2. 1996-2009 [online]. Seattle : SEOmoz, c1996-2009 [cit. 2009-06-10]. Dostupné na: http://www.seomoz.org/article/search-ranking-factors

i) Šušol, J. 2007. Posudzovanie relevancie v tradičných a elektronických informačných zdrojoch [elektronický dokument]. In: Ikaros [elektronický zdroj]. - Roč. 11, č. 9 (2007), s. 1-12.

j) Príspevok bol spracovaný v rámci grantovej úlohy KEGA 3/7275/09 Informačné štúdiá v podmienkach web 2.0 a nových technológií (INWENT)

Zdieľajte článok

Zasielajte mi nové články na e-mail:

Ďalšie články z kategórie SEO optimalizácia

Dôležitosť kontextu pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)

1. máj 2017

Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...

Asociácia a relevancia pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)

1. apríl 2017

Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...

Spokojní klienti

Ceníme si dôveru mnohých významných klientov

Môžeme vám pomôcť?

Sme otvorení každej požiadavke. Radi využijeme naše skúsenosti vo váš prospech.