Google Page Rank – istorie, explicatii, cum functioneaza, algoritmul PR

Am gasit pe tudi.ro cred ca cel mai bun articol despre Google Page Rank. O sa vi-l prezint si voua:
google-pagerank-explicatii

Istoria PageRank-ului

In Ianuarie 1998, un tanar absolvent de Stanford, Larry Page, dezvolta impreuna cu colegul sau Sergey Brin un sistem de “node ranking” intr-o baza de date care sa scoata la suprafata documentele cele mai importante din set, in functie de relatiile dintre documente. In cazul nostru asta se traduce asa: intr-un motor de cautare (baza de date) cele mai importante site-uri (documente) sunt cele care au cele mai multe linkuri (relatii). Odata cu inregistrarea patent-ului cu numarul 6,285,999 si reglementarea procedurilor birocratice, in Septembrie 1998 cei doi lansau motorul de cautare Google, bazat pe tehnologia descrisa intr-o lucrare stiintifica cu titlul de “The Anatomy of a Large Scale Hypertextual Web Search Engine” in care e descris pentru prima data proiectul Google, conceptul de PageRank si alte detalii despre structura unui motor de cautare, destul de interesante, dar care nu intra in obiectul de studiu al articolului de fata.

Google anatomy of a large scale search engine.

Trebuie inteles ca la vremea respectiva PageRank-ul si un motor de cautare bazat pe tehnologia respectiva era complet revolutionar, pentru ca majoritatea search engine-urilor la momentul respectiv erau bazate pe algoritmi simplisti, usor exploatabili (ganditi-va la epoca motoarelor care rankau paginile dupa continutul din meta keywords si cat de usor era atunci sa “optimizezi” un site) si care dadeau de multe ori rezultate irelevante. Tot in aceasta lucrare amintita mai sus e descris algoritmul dupa care functioneaza PageRank-ul, dar revenim putin mai tarziu la el.

In urmatorii ani, profitand de crash-ul Yahoo, focusul Microsoft pe sisteme de operatie, nu pe tehnologia lor de search si de boom-ul in numar al utilizatorilor de Internet Google a devenit liderul de piata a motoarelor de cautare iar PageRank a devenit liderul de facto al algoritmilor de rankare, in materie de relevanta.

Evident, ca orice sistem care poate aduce un avantaj financiar imens si algoritmul PageRank-ului a fost exploatat incet dar sigur de catre gray si black hatterii vremurilor. Prin cumpararea de linkuri, prin aducerea de linkuri “gratuite”, creearea de link farmuri si alte artificii tehnice site-urile acestor webmasteri primeau foarte multe voturi de pe alte siteuri, crescand in PR si rank-uri desi site-urile lor nu erau neaparat cele mai relevante. Treptat, ca sa elimine aceste siteuri din index, sau macar din primele cautari care ar trebui sa fie cat mai relevante, Google a sporit numarul de factori de relevanta necesari ca un document sa ajunga la varful unei cautari, PageRank-ul fiind folosit din ce in ce mai putin in acest scop (asta nu inseamna ca nu a ramas important – vedem imediat de ce).

A aparut insa o alta problema: oamenii inca se bazau pe PageRank pentru a determina in mare masura calitatea unui site si cumparau linkuri cu PR mare pentru a-si manipula propriile rezultate. Problema e ca un PR decent nu e chiar greu de adus si multi si-au facut mici averi vanzand domenii sau site-uri de calitate slaba, dar cu PR mare. In 2007 se ajunsese intr-un punct in care se invarteau sume de 4 cifre pentru linkuri cu PR peste 4, desi site-urile de pe care proveneau linkurile nu prezentau un avantaj mare in rank-uri (de exemplu, se putea obtine un PR4 din cateva linkuri in directoare, sau de pe 2-3 siteuri cu PR mai mare). Vanzarea si cumpararea de linkuri pentru a manipula PR-ul si rezultatele in motoare era in plina crestere cand Google, prin Matt Cutts, ataca decisiv si ameninta ca au implementat algoritmi care detecteaza vanzarea de linkuri si ca vor pedepsi pe cei ce manipuleaza PR prin devalorizarea linkurilor inbound si scaderea PR-ului actual. In plus, se incuraja folosirea atributului rel=”nofollow” pe linkurile platite, pentru a nu influenta modul in care e transmis link juice-ul si PR-ul prin ele.

The Paid Links War cum a fost numit de catre Danny Sullivan de la SMX a atins cateva siteuri exponentiale care vindeau PR, efectul fiind unul de domino: toti cei care urmareau site-urile respective si erau ei insisi webmasteri, s-au oprit din a cumpara linkuri sau si-au revizuit tactica. In mare, efectul a fost pozitiv pentru ca tot mai multe afaceri care pana atunci luau “the easy path” si cumparau linkuri acum au inceput sa produca in primul rand continut de calitate, care sa le atraga linkuri pe cale naturala.

Nota personala: Nu cred ca Google are un algoritm atat de complex care sa detecteze fiecare link cumparat/vandut pe un site. Nu are cum sa faca diferenta intre un link exchange intre prieteni si un LE platit de exemplu. Sau intre un link editorial dintr-un guest post si unul dintr-un review cumparat. Insa cu siguranta daca abuzezi in a cumpara linkuri sau daca esti un link broker in vazul lumii (deci poti fi raportat direct) sunt sanse mari sa ridici niste flag-uri rosii pe la Google. Deci daca veti cumpara vreodata linkuri: discretie si bun simt.
Algoritmul PageRank-ului

Dupa cum ziceam, algoritmul PageRank-ului e la vazul lumii, ba mai mult, e analizat, descris si explicat de catre fondatorii Google in lucrarea pe care o aminteam mai sus. Daca nu ati avut timp sau chef sa o cititi, va arat eu cum functioneaza in teorie algoritmul PR-ului:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Unde PR(A) = PageRank-ul paginii A

d = un asa-numit dampening factor care normalizeaza PR-ul transmis prin linkuri si poate avea o valoare intre 0 si 1 (Larry Page spune ca in general valoarea dampening factor-ului e de 0.85). Pentru ca fiecare “hop” al PR-ului printr-un link incearca sa imite modul in care un user ar naviga pe pagina respectiva, dampening factor-ul e probabilitatea ca prin unele linkuri acel user sa nu dea click pe o pagina (ex: din 100 de linkuri pe o pagina, doar 85 sunt folosite de useri).

PR(T1…n) = PageRank-ul paginilor T1…Tn care linkeaza catre pagina A.

C(T1…n) = Numarul de linkuri de pe paginile T1…Tn la care se imparte PageRank-ul (deci daca pagina T5 are 10 linkuri si PR4, ea va transmite 0.4 PR (0.34 dupa aplicarea unui dampening factor de 0.85).

Asta e formula de baza, peste care mai mult ca sigur se aplica multe filtre pe care le putem doar deduce. Pe langa asta, variabilele din algoritmul de baza pot avea o plaja larga de marimi (intre un dampening factor de 0.11 si unul de 0.85 e o diferenta mare) deci e greu sa calculam “manual” cat PR obtinem dintr-un anumit link.

Ca sa vizualizam mai bine, hai sa dam cateva exemple (cu dampening factor-ul standard de 0.85):

a. O pagina A care nu are nici un link extern ar avea un castig de PR calculat dupa formula asta:
PR(A) = (1-0.85) + 0.85 * 0 = 0.15

b. O pagina A care are un link de la o pagina T cu PR2 si 10 linkuri outbound ar avea un PR dupa formula:
PR(A) = (1-0.85) + 0.85 * (2/10) = 0.15 + 0.85 * 0.2 = 0.32

Evident, intr-un caz adevarat e aproape imposibil sa faci astfel de calcule pentru ca trebuie sa iei in considerare sute sau mii de linkuri externe si linkuri interne, fiecare adunand putin PR pe paginile catre care linkeaza.

Un ultim lucru care merita luat in considerare e ca PageRank-ul din toolbar e doar partea naturala a unui numar rational. Deci un toolbar PR de 2 ar putea insemna si un PageRank de 2,00000005 si unul de 2,99990005. E destul de greu sa aflii la care pol al spectrului esti, dar e un lucru demn de luat in considerare cand vedeti scaderi sau cresteri de PR.

Pe wikipedia gasiti un articol destul de exact si bine documentat dupa parerea mea, in care e explicat mai pe larg algoritmul PageRank-ului.

Atentie: nimeni nu ar putea garanta in ce masura algoritmul initial prezentat mai sus a ramas la fel si in 2009, dar in urma testarii intensive de catre marea majoritate a optimizerilor care au adoptat Metoda Stiintifica in studiu se poate trage concluzia ca in mare algoritmul a ramas la fel dar a fost cosmetizat si particularizat.
Manipularea PageRank-ului pe un Site

In Engleza un termen folosit in mod uzual e “PR sculpting”, anume slefuirea site-urilor in asa fel incat sa obtii PR-ul dorit pe fiecare pagina. Tipul asta de manipulare nu e interzis, ba chiar a fost recomandat de catre inginerii Google, in special Matt Cutts. Exista 3 metode de PR sculpting folosite in mod curent de catre optimizeri si webmasteri:

1. Reducerea linkurilor pe o pagina A – astfel PR-ul si Linkjuice-ul de pe pagina A va fi transmis catre mai putine pagini, dar cu o valoare mai mare (acel C(T1…Tn) din algoritm scade, deci se transmite mai mult PR pe pagina T1…Tn).

2. Folosirea atributului rel=”nofollow” – pe linkuri nefolositoare sau pe pagini care nu vrei sa rankeze in motoare sau sa primeasca PR oricum. Spre exemplu site-ul unei companii care vinde servicii web va vrea ca pagina de servicii sa rankeze sus, nu si pagina “despre noi”, “contact” sau “portofoliu” (pagini facute in principiu pentru userii care deja au ajuns pe site) asa ca le poate pune acestora din urma nofollow, pentru a concentra puterea pe celelalte linkuri.

3. Folosirea de javascript, flash sau a altei tehnologii pentru a “ascunde” linkuri – un fel de cloaking legal prin care iti ascunzi linkurile in spatele unui script sau element care nu poate fi parsat de catre un crawler. Totusi, parca e mai simplu sa pui un rel=”nofollow” pe link decat sa umplii pagina de JS-uri.

Am testat si re-testat cu PR sculpting si efectele au fost pozitive: merita facut, in special pe siteuri pe care ai potential mare de a ranka pe keyworduri long tail, dar care primesc foarte putin link juice intern si PR, deci e bine daca poti concentra cat mai mult pe ele. Spre exemplu, un magazin online care are potential de ranking pe numele de produs va vrea sa trimita cat mai mult juice/PR intern catre deep link-urile cu produse, pentru ca sunt slabe sanse sa primeasca linkuri externe pe ele.
Efectele PageRank-ului in Rezultatele Cautarilor

Probabil unul dintre cele mai controversate subiecte legate de PageRank e modalitatea si cantitatea in care el influenteaza pozitia unei pagini in SERPs. Dupa cum ziceam si in introducere, riscul cel mai mare e de a cadea in extremele lui “PR-ul nu conteaza deloc in SERP” si in cea a “PR-ul e cel mai important factor in SERP”. Adevarul e undeva la mijloc si desi nu avem informatii concrete de la Google, avem ani de testare, logica si bun simt:

Cautati de exemplu in google termenul web design. Ce observam in primele 10 rezultate? Majoritatea lor au un PageRank mare, de 7 sau 6 dar s-au strecurat acolo si doua PR3-uri. Cele 2 PR3-uri sunt insa domenii relevante pentru query, au keywordul in URL, in titlu, in descriere, au link domain-uri mari, vechime si continutul pe pagina e si el destul de bine optimizat. Concluzia: PR-ul poate fi un indicator al calitatii unui site, dar nu da certitudinea ca un site mai relevant, dar cu un PR mai mic nu te va depasi in motoare.

Un alt exemplu concludent vi-l pot da chiar pe unul din site-urile mele, un proiect pe care nu am avut timp sa il lansez: site-ul www.ufogamer.com . Aveam pe el un singur link, de la un site cu PR5 si asta imi dadea mie pe pagina principala un PR4 complet nemeritat, obtinut dintr-o singura sursa. Site-ul nici macar nu era indexat de Google, nu avea trafic, nu avea nimic pentru ca era inca work in progress, dar avea PR4 de la acel link obtinut usor. Intre timp PR-ul siteului care linka spre mine a scazut la 3 si a scazut si PR-ul de pe ufogamer la 3, dar exemplul ramane in picioare: un PR mediu poate fi obtinut foarte usor, dar nu garanteaza ca va fi si util in rankings.

Un alt test il puteti face si voi, pe blogurile sau site-urile voastre: calculati-va PR-ul pe fiecare pagina interna (eventual folositi un tool cum e SEOquake pentru Firefox) si observati ce pagini viziteaza crawlerii motoarelor, in special Googlebot, si cat de des viziteaza paginile respective. Puteti observa asta din control panel-ul host-ului sau cu un tool extern. O sa vedeti ca un crawler e tentat sa foloseasca mai intai linkurile catre pagini cu PR mare, care vor fi si vizitate mai des decat paginile considerate mai putin importante. Lucrul acesta are un efect pozitiv pasiv, pentru ca o indexare mai rapida si un crawl mai des poate indirect sa aduca si rezultate mai bune in SERPs.

In concluzie, PR-ul nu trebuie luat decat ca un indicator general, nu ca un factor decisiv in optimizare. Da, se poate observa o corelare intre calitatea unui site si marimea PR-ului, dar cele doua nu se garanteaza reciproc. In plus, avand in vedere ca numarul si calitatea de linkuri necesare pentru un PR3 creste exponential cand vine vorba de un PR4, PR5 sau mai sus, nu cadeti in capcana de a considera o pagina cu PR4 ca fiind neaparat “de calitate”. Ati vazut ce usor am putut obtine PR4 dintr-un singur link si multi reusesc sa ajunga la nivelul acesta doar din inscrieri in directoare si link exchange (blogatu’ e un exemplu). Saltul de la PR4 la PR5+ e insa mult mai mare, pentru ca numarul si calitatea linkuri creste exponential, dupa cum ne arata si un tabel interesant facut de un link broker cunoscut, TNX.net. Nu e neaparat 100% exact tabelul, dar va puteti face o idee despre ce inseamna un salt de la PR4 la PR5 si mai sus.
Mituri SEO Legate de PageRank

Revin cu cateva mituri legate de PageRank si le reformulez putin pe cele care le-am mentionat in Ghidul de Optimizare pentru WordPress:

1. PageRank-ul e decisiv in pozitia pe care un site o are in cautari

Trebuie explicat aici. Cred ca o mare parte a confuziei vine din descrierea data chiar de Google pentru tehnologia PageRank-ului, in care se zice ca “PageRank reflects our view of the importance of web pages by considering more than 500 million variables and 2 billion terms. Pages that we believe are important pages receive a higher PageRank and are more likely to appear at the top of the search results.” .

Cred ca e putin imprudent din partea celor de la Google sa denumeasca la fel tehnologia care sta in spatele ranking-ului siteurilor ca si valoarea indicativa din toolbar. PageRank-ul la care se refera aici Google e ceea ce in lumea SEO-ului e cunoscut ca si “page trust”, anume o serie de factori care influenteaza cat de bine privita e o pagina de catre Google si cat de sus va aparea dupa procesul de keyword-matching (care tine de relevanta respectivei paginii pentru o anumita cautare).

Deci, sa nu facem confuzia intre toolbar PR si trust-ul acordat unei pagini. Trust-ul e decisiv in pozitia pe care o va avea un site in cautari, toolbar PR-ul nu.

2. PageRank-ul nu conteaza deloc in algoritmul de rankare a unei pagini

Hai sa nu fim asa decisivi, atata timp cat nu stim nimic concret despre cum influenteaza PR-ul unei pagini rankarea ei in motoare. As baga mana in foc ca din cele 500 de milioane de variabile de care vorbeste Google mai sus, una din ele cu o importanta cat de mica e si toolbar PR-ul, dar nu cred ca are o valoare asa de mare incat sa ne chinuim sa crestem PR-ul doar de dragul de a-l creste. Odata cu aducerea de linkuri solide, de pe siteuri de calitate, va creste si toolbar PR-ul oricum. Ne mai putem lega de 2 indicii ca sa stabilim daca mitul asta este sau nu adevarat:

a. In 2007 cand s-a scazut drastic toolbar PR-ul multor site-uri care vindeau linkuri nu s-a observat si o scadere generala in SERPs a siteurilor respective. De aici putem trage concluzia ca daca intr-adevar PR-ul conteaza in algoritmul de ranking, conteaza foarte putin.

b. La cautari competitive majoritatea rezultatelor de pe prima pagina au PR mare (exemplul cu web design-ul de mai sus). Ce-i drept, e un factor constant, dar faptul ca paginile respective au un PR mare e mai degraba un efect secundar al numarului mare de linkuri inbound si calitatea crescuta a link profile-ului siteurilor respective.

3. PageRank-ul creste in acelasi ritm

Mai degraba am putea spune ca PageRank-ul creste exponential. In nici un caz daca pentru a obtine PageRank 3 ai avut nevoie de 10 linkuri cu PageRank 2, ca sa obtii PR4 va trebui sa aduci inca 10 linkuri cu PR2. Tabelul celor de la TNX, pe care l-am mentionat mai sus, poate sa va dea o idee generala asupra modului in care creste toolbar PR-ul.

4. PageRank determina cum rankeaza o pagina

E mai degraba un joc de cuvinte, care a produs confuzie in randul webmasterilor: Page-ul din PageRank vine de la creatorul algoritmului si unul din co-fondatorii Google, Larry Page, nu de la substantivul comun “page”. In orice caz, nu toolbar PR-ul e cel care determina cum si pe ce pozitie apare un site in cautari, ci o combinatie intre trust-ul siteului (numit de Google de asemenea PageRank – vezi mitul cu numarul 1) si mecanismul de keyword-matching.

5. Algoritmul PageRank-ului e strict secret

Tocmai l-am explicat mai sus. Nu algoritmul in sine e secret ci factorii aditionali care intervin in procesul de rankare a siteurilor pentru anumite cautari.

6. PageRank-ul are o valoare de la 1 la 10 care se schimba odata la 3 luni

Dupa cum ati vazut, algoritmul PR-ului e destul de complex si la o suma de cateva sute de numere rationale adunate si apoi inmultite cu inca un dampening factor rational nu prea are cum sa dea un intreg. Matt Cutts ne explica:

“It’s more accurate to think of it as a floating-point number. Certainly our internal PageRank computations have many more degrees of resolution than the 0-10 values shown in the toolbar; At some point we take our internal PageRanks, put them on a 0-10 scale, and export them so that they’re visible to Google Toolbar users.”

Cum am explicat mai sus, un PR de 2 poate insemna orice valoare intre 2,000000 si 2,999999 (sa zicem ca avem doar 6 zecimale, de dragul teoriei).

7. Nu conteaza cate linkuri outbound are site-ul care linkeaza catre mine, tot atata PR o sa primesc

Conteaza, chiar destul de mult. Numarul de linkuri outbound ale siteului care linkeaza catre pagina A e acel numitor din fractia PR(T)/C(T) a algoritmului. Cu cat acel C(T) e mai mic, cu atat o mai mare parte a PR-ul siteului T va ajunge la noi.

8. Imi scade PR-ul daca primesc linkuri de la un site cu PR mai mic

Nu e adevarat. Nu doar ca s-a testat intens pe subiectul asta dar nici nu are cum sa fie adevarat din punct de vedere matematic/logic daca ne uitam putin la algoritm. Fiecare termen din algoritm e pozitiv, deci oricat am aduna termeni pozitivi, nu avem cum sa avem un rezultat negativ. In cel mai rau caz, daca PR-ul siteului T care linkeaza catre noi are PR 0 si, sa zicem, 20 de linkuri, obtinem un termen d(PR(T)/C(T)) de forma 0.85 *(0 / 20), adica 0.85 * 0 = 0.

9. Imi scade PR-ul daca linkez catre un site cu PR mai mic

Nici aceasta varianta nu e adevarata pentru ca PR-ul se calculeaza doar pe baza linkurilor inbound catre site-ul tau, nu si pentru cele outbound. Nu conteaza daca linkati catre 10 site-uri de calitate sau 100 de site-uri slabe, PR-ul pe pagina voastra va ramane la fel.

10. Mi-a scazut PR-ul! Am fost penalizat pe nedrept pentru vanzare de linkuri!

Sunt doua cazuri in care ti se poate scadea PR-ul pentru vanzare de linkuri: un “handjob” al unui reviewer uman care determina ca ai vandut linkuri pe site-ul tau si te pedepseste prin scaderea PR-ului sau un flag automat care detecteaza un abuz (citeste: exagerare) in linkuri externe pozitionate in locuri neimportante a paginii (de exemplu in footer sau sidebar) sau afilierea cu un link broker. Flag-urile respective sunt mai degraba deductii logice ale mele, dar nu stiu sigur daca acestea pe care le-am enumerat sunt exacte sau daca nu mai exista si altele.

In orice caz, daca v-a scazut PR-ul si stiti sigur ca nu ati vandut linkuri si va simtiti curati, sansele cele mai mari sunt sa fi pierdut cateva linkuri importante intre cele doua update-uri sau sa le fi scazut PR-ul altor site-uri care linkeaza catre site-ul vostru, ceea ce ar face ca mai putin PR sa se transmita catre voi.

Un ultim caz pentru care PR-ul poate scadea e ca urmare a efectului de neutralizare la 1 a sistemului gandit de Google. Ce inseamna asta e ca daca am lua suma PR-urilor paginilor indexate de Google si am imparti la numarul total de siteuri indexate, rezultatul ar fi 1. Putem deduce ca pentru fiecare pagina cu un PR de 7, exista 7 pagini cu PR0 care sa metina neutralitatea. Va dati seama ca la miliardele de pagini pe care Google le are in index faptul ca pe o singura pagina a scazut sau a crescut PR-ul va avea un efect de strop intr-un ocean, dar merita notata si varianta asta.

Articol preluat de pe tudi.ro

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *