Význam tematicky orientovaného PageRanku a odkazov z tematicky orientovaných sídiel pri posudzovaní dôležitosti webovej stránky

Prof. PhDr. Soňa Makulová, PhD. 30. september 2009 v kategórii SEO optimalizácia

Úvod

V septembrovom čísle elektronického spravodaja sme si v článku Význam PageRanku ako patentovanej techniky Google a jeho vplyv pri posudzovaní dôležitosti webovej stránky objasnili význam PageRanku pri posudzovaní webovej stránky. Zdôraznili sme, že zatiaľ čo v ranných časoch SEO optimalizácie sa dával veľký dôraz na počet spojení vedúcich na stránku, dnes aj ako odozva na rôzne techniky spamu, sa berie do úvahy predovšetkým, kto odkazuje na Vašu stránku a aký má odkazujúca stránka PageRank. Preto je veľmi dôležité zaregistrovať webové sídlo v relevantných adresároch internetu s vysokým PageRankom a venovať pozornosť textom spojenia v odkazoch. Podrobne sme sa venovali aj určeniu hodnoty PageRanku nainštalovaním lišty Google toolbar a odporúčaniam, ktoré by ste mali brať do úvahy, ak chcete, aby Vaša stránka získala vyšší PageRank. V dnešnom čísle sa budeme bližšie venovať tematicky orientovanému PageRanku a významu odkazov z tematicky príbuzných sídiel.

Skutočný PageRank

Predtým, než si bližšie ozrejmíme tematicky orientovaný PageRank, si vysvetlíme skutočný PageRank. Už sme hovorili, že pri nainštalovaní lišty môžeme zistiť veľmi jednoducho hodnotu PageRanku, ktorá sa pohybuje od 1 po 10. Tak napríklad stránka BBC má PageRank 9, podobne aj stránka Yahoo!, ale napríklad Google Slovensko má PageRank 7.

Obr. Stránka Google Slovensko má PageRank 7 z 10

Obr. Stránka Google Slovensko má PageRank 7 z 10

Ak si uvedomíme, že stránka spoločnosti ELET má PageRank 6 z 10, tak je jasné, že skutočný PageRank je na logaritmickej škále. Potom rozdiel medzi PageRankom 5 a 6 je ďaleko väčší ako medzi PageRankom 2 a 3.

Obr. PageRank stránky spoločnosti ELET je 6 z 10

Obr. PageRank stránky spoločnosti ELET je 6 z 10

Všeobecný konsenzus v diskusných fórach je podľa Kenta (2004, s 219), že PageRank na lište je pravdepodobne na logaritmickej škále so základom 5 alebo 6, prípadne dokonca nižšom. V nasledujúcej tabuľke uvádzame skutočný PageRank pri logaritmickom základe 5 (Kent 2007, s. 220).

PageRank na lište Skutočný PageRank pri logaritmickom základe 5
0 0 – 5
1 5 – 25
2 25 – 125
3 125 – 625
4 625 – 3 125
5 3 125 – 15 625
6 15 625 – 78 125
7 78 125 – 390 625
8 390 625 – 1 953 125
9 1 953 125 – 9 765 625
10 9 765 625 – 48 828 125

Tabuľka: Porovnanie hodnoty PageRanku na lište a skutočného PageRanku pri logaritmickom základe 5
 
Preto by sme si mali vždy uvedomiť dve skutočnosti:

  • Dve stránky, ktoré majú ten istý PageRank na lište majú pravdepodobne odlišný skutočný PageRank, ktorý je v rozmedzí podľa horeuvedenej tabuľky.
  • Je ďaleko jednoduchšie získať PageRank 2 ak sme boli na stupnici 1, ako postúpiť na stupnicu 3 alebo 4. Webová stránka s PageRankom 8 je už zriedkavá o čom sa môžeme presvedčiť aj na stránkach slovenského internetu.

Strácajúci sa PageRank

Peter Kent (2004, s 221) nazýva uvedenú skutočnosť leaking PageRank, prípadne PageRank leakage. Ako sme už uviedli v predchádzajúcom článku, v prípade, že z našej stránky odkazujeme na externú stránku, dávame jej hlas. Ak má napríklad naša stránka skutočný PageRank 1 000 a odkazujeme na 10 stránok, každá stránka dostáva hlas 100 (10 x 100 = 1 000). Preto by sme nemali zabúdať aj na interné odkazy v rámci webového sídla, v podstate to znamená, že dávame hlas aj našim stránkam. Všeobecne sa ale odporúča, aby sme sa venovali viac odkazom, ktoré prichádzajú na našu stránku. Podľa Adama Lasnika, odborníka z Google, by sme sa nemali trápiť nad znižovaním PageRanku prostredníctvom externých odkazov, ale skôr sa vystríhať rôznych tzv. fariem liniek s výmennými odkazmi a neodkazovať na nerelevantné stránky (Google Recommends To Not Control Outbound PageRank Leak 2007).

Inteligentný surfer

Tak sa od náhodného surfera, ktorý bol predstavený pri vzniku teórie PagRanku v článku Sergeya Brina a Lawrenca Paga The Anatomy of a Large-Scale Hypertextual Web Search Engine (1998) dostávame k modelu inteligentného surfera.

Pojem inteligentný surfer predstavili v svojom článku The Intelligent Surfer: Probabilistic Combination of Link and Content Information in PageRank Matthew Richardson a Pedro Domingos. Zatiaľ čo náhodný surfer klikal na odkazy náhodne, inteligentný surfer kliká iba na stránky, ktoré obsahujú kľúčové slovo nachádzajúce sa v otázke. To znamená, že pre každé slovo, ktoré sa na stránke objaví, musíme vypočítať vlastný PageRank založený na odkazoch medzi stránkami, ktoré dané slovo obsahujú.

Ako uvádza aj Radim Smička (2004) výpočet PageRanku týmto spôsobom by bol veľmi komplikovaný hlavne v prípadoch, kedy sa vyhľadávané slovo vyskytuje zriedkavo. Aby bolo dané slovo zahrnuté do výpočtu, muselo by sa totižto nachádzať nielen na stránkach, ale aj na stránkach, ktoré na ňu odkazujú, čím by sa mohli stratiť mnohé relevantné stránky a vyhľadávanie by mohlo byť náchylnejšie na stránky generované spamom. Problém by bol aj potrebný čas na výpočet stránky, ktorý by bol oproti výpočtu originálneho PageRanku 100 až 200 krát väčší.

Tematicky alebo predmetovo citlivý PageRank

Doteraz sme sa bavili o tom, že výpočet PageRanku záleží hlavne na počte spojení a PageRanku hlasujúcej stránky. Preto si odborníci stále viac uvedomovali, že sú veľmi dôležité aj kľúčové slová spojenia. Preto sa stále viac stretávame so snahou aj o tzv. predmetovo citlivý PageRank, ktorý berie do úvahy iba spojenia z tematicky relevantných webových stránok. Rozdiel oproti predchádzajúcemu prípadu je v tom, že PageRank sa nepočíta pre každé slovo, ale pre každý predmet alebo tému. Termín predmetovo citlivý PageRank je podrobne vysvetlený v článku Topic Sensitive PageRank zo Stanfordskej univerzity (Haveliwala 2002).

Pre každú tému rozlišuje tzv. stránky autorít. Pre svoj experiment si vybral ako autoritatívne stránky adresára Open Directory Project, konkrétne 16 hlavných kategórií.

Obr. Adresár Open Directory Project predstavuje stránky autorít pre 16 hlavných tém

Obr. Adresár Open Directory Project predstavuje stránky autorít pre 16 hlavných tém

Preto väčšina prieskumových strojov utvára aliancie s adresármi, ako napríklad Open directory project, prípadne Yahoo!, čím zároveň získavajú relevantné informácie o tom, v ktorej kategórii sa stránka nachádza a či sú odkazy na stránku relevantné.

Potom pri tematicko alebo predmetovo citlivom PageRanku majú vyššiu hodnotu spojenia, ktoré prichádzajú z tematicky príbuzných sídiel, ako spojenia z ľubovoľných stránok. Na rozdiel od klasického PageRanku vypočítaného pre každú stránku sa  tematicky orientovaný PageRank  vypočíta pre každú tematickú oblasť, ktorá sa na stránke objaví. Jedna stránka tak získava rôzne hodnoty PageRanku pre rôzne témy. Okrem toho prieskumový stroj odlišuje pre každý predmet aj tzv. authority pages alebo stránky autorít.

Záver

V dnešnom čísle elektronického spravodaja sme si predstavili význam tematicky orientovaného PageRanku a predstavili model inteligentného surfera. O tom, že pri posudzovaní relevancie stránky stále viac zohrávajú off page faktory sme sa mohli presvedčiť aj pri poslednom prieskume Search Engine Ranking Factors 2009, kde sa jednotliví experti vyjadrovali, ktoré faktory pokladajú za najdôležitejšie pri radení záznamov na výstupe. Na treťom mieste sa podľa názoru 72 expertov z celého sveta umiestnilo množstvo jedinečných spojení z rôznych domén a na piatom mieste dôveryhodnosť domény.


Literatúra


a) BRIN, Sergey - PAGE, Lawrence. 1998. The Anatomy of a Large-Scale Hypertextual Search Web Engine [online]. Standford : Standford University, 1998 [cit. 2009-08-01]. Dostupné na internete: http://infolab.stanford.edu/~backrub/google.html

b) DUKÁTOVÁ, Jana. 2007. Optimalizácia webových stránok pre vyhľadávacie nástroje internetu. [Diplomová práca]. Bratislava : Filozofická faktulta Univerzity Komenského, 2007. 103 s.

c) The PageRank Citation Ranking: Bringing Order to the Web. 1998. Technical report. Standford InfoLab [cit. 2009-09-10]. Dostupné na internete: http://ilpubs.stanford.edu:8090/422/

d) Google Ranking Factors - SEO Checklist. [cit. 2009-09-10]. Dostupné na internete: http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm#positive-on

e) Google Recommends To Not Control Outbound PageRank Leak. February 9, 2007 [cit. 2009-09-10]. Dostupné na internete: http://www.seroundtable.com/archives/007449.html

f) KENT, Peter. 2004. Search engine optimization for dummies.  Indianapolis : Wiley Publishing, 2004. 384 s. ISBN 0-7645-6758-6.

g) HAVELIWALA, Taher. 2002. Topic Sensitive PageRank [online]. Stanford : Standford University, 2002 [cit. 2009-09-14]. Dostupné na internete: http://ilpubs.stanford.edu:8090/573/

h) MAKULOVÁ, Soňa. 2006. Analýza faktorov vplývajúcich na nájditeľnosť webových sídiel. In: Information Use in Information Society. International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava : Centrum VTI SR, 2006, s. 109 – 118

i) RICHARDSON, Matthew - DOMINGOS, Pedro. 2002. The Intelligent Surfer: Probabilistic Combination of Link and Content Information in PageRank [online]. Seattle : University of Washington, 2002 [cit. 2009-09-18]. Dostupné na internete: http://www.cs.washington.edu/homes/pedrod/papers/nips01b.pdf

j) Search Engine Ranking Factors 2009 [online]. Seattle : SEOmoz. [cit. 2009-09-14]. Dostupné na internete: http://www.seomoz.org/article/search-ranking-factors

k) SMIČKA, Radim. 2004. Optimalizace pro vyhledávače – SEO : jak zvýšit návštěvnost webu. Dubany : Jasminka, 2004. 120 s. ISBN 80-239-2961-5.

l) Príspevok bol spracovaný v rámci grantovej úlohy KEGA 3/7275/09 Informačné štúdiá v podmienkach web 2.0 a nových technológií (INWENT)

Zdieľajte článok

Zasielajte mi nové články na e-mail:

Ďalšie články z kategórie SEO optimalizácia

Dôležitosť kontextu pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)

1. máj 2017

Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...

Asociácia a relevancia pri vyhľadávaní (Ako Google interpretuje vyhľadávacie dotazy a čo to znamená pre SEO optimalizáciu)

1. apríl 2017

Úvod V súčasnosti patrí Google určite k najviac využívaným vyhľadávacím nástrojom internetu. Toho sú si vedomí aj vlastníci webových stránok a preto je ich snahou sa objaviť vo...

Spokojní klienti

Ceníme si dôveru mnohých významných klientov

Môžeme vám pomôcť?

Sme otvorení každej požiadavke. Radi využijeme naše skúsenosti vo váš prospech.