Internet Windows Android

calculul pagerank. PageRank explicat

Pentru a calcula PageRank pentru o pagină, trebuie să luați în considerare toate linkurile interne și externe către pagina respectivă. Mai jos este ecuația pentru calcularea valorii PageRank a paginii A.

PR(A)=(1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

PR(t1…tn)- greutatea paginii care face legătura cu pagina A

C- numărul de link-uri de ieșire din pagina A

d este coeficientul de atenuare, de obicei luat ca 0,85.

O pagină își „votează” valoarea PageRank pe fiecare pagină la care trimite. Valoarea de vot pentru o pagină este suma valorii PageRank a paginii respective * 0,85. Această valoare este distribuită uniform între toate paginile către care duc link-urile de ieșire.

Ecuația implică faptul că un singur link dintr-o pagină PR4 cu cinci link-uri de ieșire va transfera mai multă greutate decât un link de la o pagină PR8 cu 100 de link-uri de ieșire. Cu cât mai multe link-uri de ieșire pe o pagină, cu atât mai puțin PageRank va fi transmis către acel link.

Rețineți că atunci când o pagină își votează PageRank pe alte pagini, propriul PageRank al acelei pagini nu este redus. Pagina de vot nu contribuie la valoarea sa de PageRank. Este ca o adunare a acționarilor, în care fiecare acționar votează în funcție de numărul de acțiuni pe care le deține, dar nu le dă. În continuare, vom vedea că toate aceleași pagini pierd indirect ceva PageRank.

Ecuația arată clar de unde provine valoarea PageRank pentru orice pagină. Să presupunem că avem 2 pagini, A și B, care se leagă între ele, nu există alte link-uri pe aceste pagini. Iată ce se întâmplă:

Calcularea Google PageRank pentru Pagina A

Pasul 1: Calculați valoarea PageRank pentru pagina A

Pagina are acum noua valoare PageRank. Pentru calcul a fost folosită ponderea linkului de ieșire din pagina B. Dar pagina B are și o legătură de ieșire către pagina A, iar valoarea PageRank rezultată nu poate fi precisă până când valoarea PageRank pentru pagina B este cunoscută.

Calcularea Google PageRank pentru Pagina B

Pasul 2: Calculați valoarea PageRank pentru pagina B

Pagina B are acum o nouă valoare PageRank, care nu poate fi precisă, deoarece valoarea PageRank din Pagina A este inexactă pentru calcul.

Nu putem calcula PageRank exact pentru pagina A până când nu cunoaștem PageRank pentru pagina B și nu putem calcula PageRank exact pentru pagina B până când nu cunoaștem PageRank pentru pagina A.

Este posibil să se recalculeze valoarea PageRank pentru paginile A și B din nou și din nou, iar de fiecare dată rezultatul va fi diferit de cel precedent și va fi inexact. Putem repeta calculele din nou folosind valorile obținute în pasul anterior. Dar folosim întotdeauna valori imprecise pentru calcule, astfel încât rezultatele vor fi întotdeauna imprecise.

Puteți depăși problema repetând calculele de mai multe ori. De fiecare dată vom obține rezultate ceva mai precise. De fapt, acuratețea nu poate fi niciodată atinsă, deoarece calculele se bazează întotdeauna pe intrări imprecise.

Mai devreme sau mai târziu vom ajunge la un punct în care iterațiile ulterioare vor avea un efect redus asupra rezultatelor calculelor. Acest lucru explică de ce recalcularea valorilor PageRank pentru toate paginile din Google necesită atât de mult timp și resurse de calcul.

Singurul lucru de care putem fi siguri este că un link din orice sursă crește PageRank pentru site-ul nostru.

Care este cel mai bun mod de a gestiona indexarea link-urilor interne de pe site pentru a crește PR-ul paginilor sale individuale? Luați în considerare formula care calculează PR pentru pagina curentă A:

Aici d- coeficientul de atenuare al greutății de referință, valoarea sa exactă este ascunsă de Google, de obicei este luată ca 0,85. În contextul întrebării noastre, acest lucru nu este semnificativ, deoarece dorim să evaluăm PR-ul paginilor selectate de pe site față de toate celelalte;
T 1 ,…, T n - pagini care leagă la DAR;
PR(T 1 ) ,…, PR(T n ) – PR paginilor de referință;
CT 1 ) ,…, CT n ) - numărul de link-uri de pe paginile de referință.

Particularitati:

  1. Dacă o pagină conține un link către ea însăși, atunci acest link nu este luat în considerare în calcul.
  2. De asemenea, nu sunt luate în considerare legăturile către pagini care nu au legături.
  3. Două sau mai multe link-uri identice de pe aceeași pagină sunt considerate unul singur.
  4. Google poate impune pe unele site-uri filtre care înrăutățesc fluxul de greutate a link-urilor și introduc distorsiuni în formula de determinare a PR, nu luăm în considerare acest efect aici.

Cum se folosește această formulă, deoarece în partea dreaptă arată PR-ul paginilor care urmează să fie și ele calculate? Să luăm toate paginile de pe Internet indexate de Google și să luăm PR-ul inițial al fiecăreia dintre ele ca una, apoi să calculăm secvenţial Page Rank pentru toate. Aceasta a fost prima iterație în care fiecare pagină a primit un fel de valoare PR. Repetăm ​​calculele prin acest algoritm de multe ori, folosind valorile obținute în pasul anterior ca pagini PR. Particularitatea algoritmului este că indiferent ce PR inițial luăm și în orice ordine îl calculăm, pentru un număr suficient de mare de iterații vom ajunge la aceleași numere.

Cu toate acestea, PR întreg obișnuit de la 0 la 10 nu este ceea ce am obținut în paragraful anterior. PR 0…10 – așa-numita „Bară de instrumente” PR ( Bara de instrumente PageRank), a fost introdus pentru a putea reprezenta toate valorile PR în termeni absoluti, indiferent de numărul de pagini din rețea. Aici era:

unde baza este un număr care depinde de numărul de pagini din indexul Google și de alți factori, luați de obicei baza egal cu 7;
A– factor de reducere, 0< A≤ 1, cel mai adesea luat ca 1.

Cote bazași A, precum și formula pentru TLPR în sine, nu sunt importante pentru noi acum, principalul lucru este că o creștere a TLPR este întotdeauna asociată cu o creștere a PR, așa că ne vom concentra pe acesta din urmă. Să uităm de legăturile externe către alte resurse și să încercăm să calculăm PR doar pe baza factorilor interni. Să presupunem că avem un site web cu șase pagini:

Fiecare are un meniu: „Pagina principală”, „Despre site”, „Lista articole”. Elementele de meniu sunt menționate pe toate paginile site-ului. „Lista de articole” se referă și la paginile cu articole. Page Rank cu o astfel de distribuție a linkurilor este indicat în diagrama de mai sus. Când am calculat PR, am făcut 100 de iterații, luând una ca valoare inițială și am rotunjit numerele rezultate la sutimi după virgulă.

Să presupunem că vrem să promovăm doar pagina principală. Pentru a-și crește PR-ul, ar fi logic să se permită indexarea doar acelor link-uri care duc la acesta. În același timp, ținem cont de faptul că nici o singură pagină nu trebuie tăiată de pe site, adică pe fiecare pagină ar trebui să fie plasat un link indexat:

Ei bine, PR-ul paginii solicitate a crescut. Acum să încercăm să punem un link către „Articolul 1” din acesta și să vedem cum se schimbă distribuția:

S-ar părea că, prin plasarea unui link suplimentar pe pagina principală, ar trebui să luăm greutatea linkului de pe acesta și, prin urmare, să o slăbim. Dar, de fapt, se dovedește exact invers - greutatea de referință revine cu o creștere! Prin această acțiune ridicăm simultan „Articolul 1”.

Să ne răzgândim acum și să decidem să promovăm doar lista de articole:

Tocmai am reușit să obținem cel mai mare PR dintre toate calculate anterior, egal cu 2,8 pentru lista de articole. După cum arată acest exemplu, este mai ușor să crești PR-ul unei pagini care are multe link-uri interne, cu condiția, desigur, ca backlink-uri să fie instalate pe ea. Același efect a fost demonstrat când am făcut un link către „Articolul 1” din cel principal.

Și acum vom sparge structura logică a site-ului: vom pune link-uri de la pagina principală către toate celelalte, și de la toate paginile către cea principală. Alte link-uri vor fi închise de la indexare.

  1. Cea mai bună modalitate de a crește Page Rank-ul paginilor cu multe link-uri este instalarea backlink-urilor. Astfel de pagini includ forumuri, liste de articole, sitemap-uri etc.
  2. PR-ul unei pagini se ridică grozav dacă pui un link către ea din paginile de la p.1, acumulând Page Rank.
  3. Pentru a crește PR-ul paginii principale, va fi util să plasați anunțuri de articole, știri etc. care să conducă la pagini cu text integral pe ea. Din nou, nu uitați de backlink-uri.

Și iată un script care te va ajuta cu calculul PR. Experimentați cu diferite opțiuni pentru indexarea link-urilor de pe site.

    // matrice de pagini de site: primul element din matricea fiecărei pagini este numele acesteia,

    // toate celelalte elemente sunt indici de pagini din matrice care sunt legate de la curent

    $pages = matrice

    matrice( "Pagina principală", 1 , 2 ) ,

    matrice ("Despre site" , 0 , 2 ) ,

    matrice ("Lista de articole" , 0 , 1 , 3 , 4 , 5 ) ,

    array("Articol 1", 0, 1, 2),

    array(„Articol 2” , 0 , 1 , 2 ) ,

    matrice(„Articol 3”, 0, 1, 2)

    // setează paginile valoarea inițială PR = 1

    pentru ($i = 0 ; $i< count ($pages ) ; $i ++ ) $pr [ $i ] = 1 ;

    // numărul de iterații = 100

    pentru ($i = 0 ; $i< 100 ; $i ++ )

    pentru ($j = 0; $j< count ($pages ) ; $j ++ )

    $adăugați = 0 ; // creștere din legături externe

    pentru ($k = 0; $k< count ($pages ) ; $k ++ )

    dacă ($k == $j ) continuă ;

Colegii, suntem în sfârșit gata să vă prezentăm atenției o funcție revoluționară a Netpeak Spider - calculul PageRank-ului intern! Nu a mai rămas nimic din vechiul mecanism de calcul și, pentru a-l introduce pe cel nou, am fost nevoiți să realizăm versiunea anterioară, care a schimbat radical algoritmul de scanare din interiorul programului. Am pregătit pentru dvs. această post-instrucțiune, la care vă puteți întoarce direct din interfața noului instrument intern de calcul PageRank.

Ce este PageRank

PageRank este greutatea relativă a paginii, calculată prin formula:

PR(A) = (1 - d) / N + d * (PR(B) / L(B) + PR(C) / L(C) + ...)

  • N este numărul total de noduri (pagini) active implicate în calcul;
  • d– factor de atenuare (de obicei se folosește 0,85);
  • L- numărul de link-uri de ieșire.

În general, este acceptat că la iterația zero (0) PageRank-ul fiecărei pagini este același și este egal cu 1 / N. La următoarele iterații, se folosește ponderea tuturor legăturilor de intrare, care este ponderea din iterația anterioară împărțită la numărul de link-uri de ieșire (în formula - L).

Special pentru tine, am pregătit mai multe tabele care arată clar funcționarea algoritmului:

Google calculează acest parametru pentru fiecare pagină de pe Internet, în timp ce Netpeak Spider vă permite să calculați PageRank intern , care se limitează la site-ul accesat cu crawlere sau la lista de adrese URL.

De ce să se calculeze PageRank intern

Această caracteristică este revoluționară cel puțin pentru că vă permite să obțineți informații reale despre proiectul dvs.:

1. Înțelegeți exact cum este distribuit link juice pe tot site-ul și unde este concentrat.

2. Stabiliți ce pagini care nu sunt importante pentru promovarea motoarelor de căutare devin supraponderale.

3. Aflați care pagini sunt „noduri suspendate” și pur și simplu „ard” sucul de link-uri de intrare.

Presupunând că link-urile externe duc la site-ul dvs., imaginați-vă cât de mult bugetul SEO poate fi economisit prin implementarea unei scheme de legături interne mai eficiente.

Cum se calculează PageRank intern

Netpeak Spider oferă 2 moduri de a calcula PageRank intern:

1. Automat

Doar selectați parametrul special „Internal PageRank” în setările de accesare cu crawlere din fila „Parametri” și acesta va fi calculat automat când procesul de accesare cu crawlere este întrerupt sau după ce acesta s-a finalizat cu succes.

Vă rugăm să rețineți că, pentru a calcula acest indicator, este necesar să activați parametrul „Legături de ieșire”, deoarece linkurile de ieșire stau la baza obținerii de backlink, fără de care nu se poate calcula PageRank intern.

2. Manual (folosind un instrument separat)

Pentru a apela un instrument special, accesați meniul „Tools” → „Internal PageRank Calculation”.

Aici veți vedea următoarele blocuri:

2.1. Setări care sunt utilizate și pentru metoda de calcul automată:

  • numărul de iterații [de la 5 la 50]→ un număr mai mare de iterații asigură o precizie mai mare a calculelor, totuși, conform observațiilor noastre, aproximativ 15 iterații este valoarea cea mai potrivită, permițându-vă să obțineți rapid rezultatul dorit, astfel încât 15 iterații sunt setate implicit în Netpeak Spider;
  • numai link-uri interne→ o setare care vă permite să dezactivați influența tuturor legăturilor externe de ieșire asupra calculelor;
  • numai linkuri în fila [Toate rezultatele] / [Filtre].→ o setare care vă permite să limitați calculele doar la acele link-uri care se află pe filele corespunzătoare: utilizați [Filtre] în cazurile în care trebuie să calculați PageRank doar în cadrul unei anumite categorii a site-ului analizat;
  • modul de afișare a rezultatelor→ „Real” arată valorile exacte de PageRank, dar poate fi incomod pentru site-urile cu un număr mare de pagini; Modul „Adaptiv” vă permite să vedeți aceleași date, dar înmulțite cu un coeficient special, permițându-vă să lucrați convenabil cu site-uri mari.

Vă rugăm să rețineți că, dacă debifați casetele de selectare „doar link-uri interne” și „doar link-uri în fila [Toate rezultatele] / [Filtre]” în același timp, Netpeak Spider va începe să descarce și să analizeze toate linkurile de ieșire din toate paginile accesate cu crawlere în timpul calculelor. În acest caz, în raport pot apărea link-uri cu codul de stare „Necrawled” (necrawled) - acest lucru este necesar pentru a calcula PageRank-ul intern cât mai corect posibil, pe baza linkurilor de ieșire reale.

2.2. Formula prin care se calculează PageRank-ul intern, precum și parametrii de mai sus N, d și un link către acest articol.

2.3. Listă de adrese URL ignorate: puteți adăuga un link la această listă pentru a o exclude complet din analiza PageRank. Această funcție vă permite să lucrați cu calcule foarte flexibil, schimbând legătura internă direct în program.

Rețineți că nu este exclus un singur link dintr-o anumită pagină, ci întregul nod: imaginați-vă că nu există un singur link către această pagină de pe întregul site (linkuri de intrare) și nici un singur link de la această pagină către alte pagini ale site-ului (link-uri de ieșire).

2.4. Exportați datele din tabel în fișier în format CSV/Excel.

2.5. Tabelul rezultat care conține următoarele coloane:

  • bloc „Pagini”→ număr de serie (#) și link către pagină;
  • bloc „Iterații”→ după începerea calculelor, aici vor apărea coloanele corespunzătoare cu date pentru fiecare iterație;
  • bloc „Relații”→ aceasta arată numărul de legături de ieșire și de intrare care pot fi deschise făcând dublu clic pe butonul stâng al mouse-ului sau apelând meniul contextual: o vizualizare convenabilă a acestor rapoarte a fost dezvoltată special pentru dvs., cu posibilitatea de a merge mai adânc și de a reveni folosind butoanele obișnuite „Înapoi” / „Înainte”, primind acces complet la graficul conexiunii;
  • bloc „Analiza algoritmică”→ aici sunt colectați parametrii care sunt determinați în mod specific folosind algoritmul PageRank, și anume „Starea linkului” (citiți mai multe despre acest parametru mai jos) și „Link final” - afișat în cazurile în care a fost găsită o redirecționare ca urmare a algoritmului;
  • bloc "Parametri principali"→ vă permite să vedeți codul de răspuns al serverului și tipul de conținut al paginilor corespunzătoare;
  • bloc „Opțiuni de indexare”→ combină parametrii care afectează în mod critic distribuția greutății link-ului pe site: instrucțiuni de la Robots.txt, Canonical, X-Robots-Tag, Meta Robots, precum și URL-ul final al redirecționării și eticheta Refresh, dacă sunt prezente pe pagina.

În partea de jos a tabelului, se calculează „Suma tuturor PageRanks” → la fiecare iterație, suma ar trebui să fie egală cu 1 (în modul „Real”) sau 10 la puterea corespunzătoare (în modul „Adaptive”). Dacă suma diferă de valorile specificate, atunci site-ul analizat are noduri suspendate pe care pierzi link juice.

2.6. Panoul de stare, care, împreună cu tabelul rezultat, arată toți pașii algoritmului, permițând utilizatorilor să vadă dinamica calculelor.

La ieșirea din instrumentul „Internal PageRank Calculation”, datele ultimei iterații vor fi plasate automat în tabelul principal al programului în coloana corespunzătoare. Dacă înainte de asta existau deja unele date în tabelul principal, atunci cele mai recente le vor suprascrie.

Algoritm de calcul

Încă o dată, pentru a calcula PageRank intern, trebuie să activați parametrul Linkuri de ieșire, care acoperă toate relațiile dintre pagini, permițându-vă să luați în considerare instrucțiunile de bază de indexare, atributele linkurilor și opțiunile de redirecționare a greutății linkurilor.

Întregul proces constă din 2 pași consecutivi:

1. Construirea unui grafic de conexiune → scopul acestei etape este de a construi relația de legături și de a stabili statutul acestora:

1.2. Analiză inițială → împărțirea legăturilor în stările OK, Hanging Node și Redirecționare (citiți mai multe despre stările linkurilor mai jos).

1.4. Numărarea linkurilor de intrare.

1.5. Analiza finală → analiza detaliată a legăturilor de ieșire și de intrare, precum și definiția „Legăturilor de sfârșit” și a legăturilor în starea „Nod fără legătură”.

2. Calcul intern PageRank → începând de la iterația 0 și până la cea specificată în setări.

Stările linkurilor

Cea mai interesantă parte a algoritmului PageRank este că toate linkurile sunt împărțite logic în 4 stări:

1. OK

Acestea sunt pagini HTML cu un cod de răspuns al serverului „200 OK”, care conțin link-uri de ieșire și pot fi:

  • noindex, adică neindexat → da, nu ți s-a părut: paginile neindexate au și greutatea link-ului
  • cu eticheta Canonical îndreptată spre sine
  • cu eticheta Refresh îndreptată spre sine

2. Nod agățat

Pagini cu 0 linkuri de ieșire, ceea ce înseamnă că aceste pagini nu transmit sucul de linkuri, pierzându-l în întregime.

Acest tip include:

  • 2xx pagini care pur și simplu nu conțin link-uri de ieșire
  • 2xx pagini închise în Robots.txt
  • 2xx pagini nofollow în instrucțiunile X-Robots-Tag sau Meta Robots
  • 2xx pagini, dar nu HTML și, prin urmare, nici link-uri de ieșire
  • Link-uri 3xx închise în Robots.txt
  • Legături 3xx cu redirecționare infinită (codul de stare „3xx Redirect Loop”)
  • 4xx pagini
  • 5xx pagini
  • pagini care returnează orice alt cod de răspuns al serverului
  • pagini de redirecționare (Canonic sau Refresh) care nu au ajuns la pagina țintă: în acest caz, va fi afișat codul de stare „Redirecționat fără sfârșit”, adică o redirecționare fără sfârșit
  • link-uri de ieșire care nu sunt în tabelul „Toate rezultatele” → rețineți că, în mod implicit, cu casetele de selectare „doar link-uri interne” și „doar link-uri din fila [Toate rezultatele] / [Filtre]” dezactivate, Netpeak Spider va încerca să găsească toate linkurile care se află pe site, indiferent de setările de accesare cu crawlere - acest lucru este necesar pentru a obține o imagine completă și precisă a transferului greutății linkului

3. Redirecționează

Acest tip include:

  • 3xx pagini
  • Pagini 2xx cu etichetă Canonical îndreptate către o altă pagină
  • 2xx pagini cu eticheta Refresh direcționate către o altă pagină

4. Nod fără legătură

Link-uri care nu au link-uri de intrare.

  • accesarea cu crawlere a unui site cu instrucțiunile de indexare dezactivate (Robots.txt, Canonical, Refresh, X-Robots-Tag, Meta Robots și atributul nofollow pe linkuri) → rețineți că atunci când aceste instrucțiuni sunt dezactivate, Netpeak Spider accesează cu crawlere site-ul diferit decât se face acest lucru de către roboții motoarelor de căutare, dar algoritmul PageRank funcționează întotdeauna conform acestor instrucțiuni, așa că unele link-uri obținute ca urmare a accesării cu crawlere pot fi inaccesibile pentru algoritmul PageRank.
  • accesarea cu crawlere a propriei liste de URL-uri → link-uri care nu au legătură în niciun fel.

3 bug-uri noi

Imediat după calcularea automată sau manuală a PageRank-ului intern, 3 tipuri de erori vor intra în interfața principală a programului, dacă sunt prezente pe site:

  • PageRank: dangle→ după cum sa menționat mai sus, acestea sunt pagini fără link-uri de ieșire care nu trec greutatea link-ului, încălcând astfel distribuția naturală a ponderii link-urilor pe site;
  • PageRank: redirecționare→ Pagini care redirecționează link juice - acestea pot fi pagini care returnează o redirecționare 3xx sau care conțin etichete Canonical / Refresh care indică o adresă URL diferită.
  • PageRank: linkuri lipsă→ acestea sunt pagini inaccesibile către care nu au fost găsite linkuri de intrare.

Pe scurt despre principal

Stimați colegi, am reușit să implementăm cel mai precis algoritm de calcul al PageRank-ului intern, care vă permite să aflați o serie de perspective despre site-ul analizat: cum exact este distribuită greutatea link-ului pe pagini, ce pagini care nu sunt necesare pentru SEO obțin excesul de greutate, care „noduri suspendate” sunt prezente pe site și, în sfârșit, cum să remediați aceste erori.

Încercați o nouă caracteristică unică, experimentați cu diferite setări și implementați scheme de legături interne noi și mai eficiente! :)

PageRank este unul dintre principalii indicatori externi ai site-ului, care afectează semnificativ popularitatea resursei tale pe Internet și afectează semnificativ veniturile potențiale pe care le poți primi (de exemplu, prin vânzarea de link-uri pe paginile site-ului tău).
În acest articol, vreau să descriu în detaliu toate punctele care se referă la PageRank de la Google.

Ce este PageRank și pentru ce este?
După cum știți, PageRank este un indicator numeric al autorității relative a unei pagini de site, printre toate celelalte pagini de pe Internet, utilizate de motorul de căutare Google. PageRank se bazează pe principiul calculării credibilității unui om de știință în cercurile științifice de către cine și cât de des de la alți oameni de știință se referă la munca acestuia.
Caracteristici PageRank:
- indicatorul este atribuit nu resursei în ansamblu, ci unei pagini separate a site-ului (de regulă, pagina principală are cel mai înalt nivel PageRank, deoarece numărul cel mai mare de link-uri către aceasta);
- linkul care duce din pagina nu reduce PageRank (greutatea statica) a acestei pagini;
- Nivelul PageRank nu afectează relevanța paginii, adică nu va ajunge pe primele poziții în interogările de căutare, doar pentru că are mai multă pondere. Într-o oarecare măsură, acest lucru afectează cu siguranță poziția, dar Google dă preferință conținutului de calitate al paginii care îndeplinește interogarea de căutare.

Pentru ce este PageRank? La urma urmei, nu afectează relevanța.
Webmasterii au nevoie de aceasta pentru a crește costul plasării de link-uri către resursele lor. Dacă prețul unui link pe o pagină (nu cea principală) cu PR = 0 costă maxim 10 cenți, atunci cu PR = 4 costă de multe ori mai mult.
De asemenea, un nivel ridicat de PageRank indică autoritatea paginii, percepția completă a acesteia de către motorul de căutare Google. Combinația de astfel de pagini permite Google să-și formeze o opinie tematică despre resursă. Nu o spun, dar cred că destul de des Google nu reușește să găsească informațiile specifice solicitate și oferă răspunsuri la resurse tematice similare și, în consecință, le clasifică în funcție de nivelul PageRank. Ca și cum ar fi solicitat utilizatorului unde ar putea găsi informațiile de interes pentru el.

Cum se calculează PageRank?
Pentru a calcula PageRank pentru o pagină, trebuie să luați în considerare toate linkurile interne și externe către această pagină:
- cu cât sunt mai multe link-uri externe către pagină, cu atât mai multă greutate PageRank este transferată către această pagină;
- cu cât sunt mai multe link-uri interne în pagină (inclusiv link-uri externe către alte resurse), cu atât mai multă pondere a PageRank este distribuită uniform pe fiecare link. Astfel, toate linkurile vor primi aceeași greutate.

Pe baza acesteia, trebuie să creați o legătură internă a site-ului, astfel încât PageRank să fie transferat către toate paginile, dar nu imediat, ci într-un lanț. Și cu cât lanțul este mai lung, cu atât mai multă greutate primesc paginile din acesta (puteți dezactiva transferul PageRank la linkuri adăugând atributul rel=nofollow la acestea).

Următoarea ecuație poate fi utilizată pentru a calcula PageRank pentru o pagină:

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + PR(tn)/C(tn))

PR() - PageRank al paginii ca număr numeric (număr în virgulă mobilă);
A - pagina PageRank pe care o determinăm;
t1...tn - pagina care face legătura cu pagina A;
C - numărul de link-uri de ieșire din pagina A;
d este factorul de amortizare, de obicei luat ca 0,85.

Pagina transmite valoarea PageRank tuturor paginilor către care face legătura. În acest caz, valoarea PageRank este calculată ca valoarea PageRank proprie a paginii înmulțită cu 0,85. Apoi, această valoare este distribuită uniform între toate paginile la care se referă.

Cu ajutorul tabelului, putem calcula aproximativ ce PageRank va primi pagina noastră cu un anumit număr de link-uri către aceasta:

Numar de link-uri: PageRank al paginilor care leagă la a noastră:
0 1 2 3 4 5 6 7 8 9 10
1 0 0 0 +1 +2 +3 +4 +5 +6 +7 +8
4 0 0 +1 +2 +3 +4 +5 +6 +7 +8 +9
19 0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10
101 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 -
555 +2 +3 +4 +5 +6 +7 +8 +9 +10 - -
3 055 +3 +4 +5 +6 +7 +8 +9 +10 - - -
16 803 +4 +5 +6 +7 +8 +9 +10 - - - -
92 414 +5 +6 +7 +8 +9 +10 - - - - -
508 277 +6 +7 +8 +9 +10 - - - - - -
2 795 522 +6 +7 +8 +9 +10 - - - - - -
15 375 379 +7 +8 +9 +10 - - - - - - -
84 564 584 +8 +9 +10 - - - - - - - -
449 527 525 +9 +10 - - - - - - - - -

Puteți verifica valoarea paginilor PR pe

Toată lumea îl folosește, dar puțini oameni știu cum funcționează. Google PageRank este unul dintre cei mai importanți parametri pentru dezvoltatorii web.

Căutarea prin miliardele de pagini existente și milioanele create în fiecare zi este mai dificilă decât ți-ai putea imagina. PageRank este doar unul dintre sutele de factori utilizați de Google pentru a îmbunătăți calitatea căutării. Dar cum funcționează și ce factori îl influențează și ce nu, și ce știm despre PageRank?

În acest articol, vă prezentăm doar faptele.

În ultima săptămână, am analizat o mulțime de fapte și presupuneri care ni s-au părut realiste. În plus, am compilat câteva cercetări academice despre căutare și 16 instrumente utile de PageRank.

Cele mai importante fapte sunt descrise pe scurt la începutul articolului.

Cum funcționează PageRank?

  1. PageRank una dintre numeroasele metode folosite de Google pentru a determina relevanța și importanța paginii.
  2. Google interpretează un link de la pagina A la pagina B ca voce A în favoarea lui B, desigur, nu se ține cont doar de numărul de voturi, ci și de calitatea paginilor de vot.
  3. PageRank pe baza numărului de linkuri primite, dar nu numai pe ea, relevanța și calitatea sunt și ele importante.
  4. Nu toate linkurile contribuie în mod egal la PageRank.
  5. Dacă există un singur link pe o pagină cu PR8, atunci site-ul către care se leagă va primi toate PR-urile pe care le poate transmite, dar dacă sunt 100 de link-uri, atunci fiecare link va transmite doar o parte din acest PR.
  6. Link-urile de intrare greșite nu afectează PR.
  7. PR ia în considerare durata de viață a site-ului, relevanța link-urilor primite și timpul de existență a acestora.
  8. La calcularea PR, conținutul nu este luat în considerare.
  9. PR este calculat nu pentru site ca un întreg, ci pentru fiecare pagină separat.
  10. Fiecare link primit contează, cu excepția linkurilor de pe site-uri interzise.
  11. PR nu este doar valori întregi de la 0 la 10, ci este un număr real.
  12. Este din ce în ce mai dificil să se atingă fiecare nivel următor de PR, probabil că se folosește o scară logaritmică.
  13. PR este recalculat constant, dar datele pentru bara de instrumente sunt actualizate la fiecare câteva luni.
  14. Google încearcă să găsească pagini care sunt solide și relevante în același timp.

Factori care afectează PageRank

  1. Actualizările frecvente ale site-ului nu cresc automat PR.
  2. PR ridicat nu garantează poziții înalte în rezultatele căutării.
  3. DMOZ și Yahoo! nu crește automat PR.
  4. Site-urile .edu și .gov nu cresc automat PR.
  5. Paginile interne nu au neapărat un PR mai scăzut decât cel principal.
  6. Linkurile de la Wikipedia nu cresc automat PR.
  7. Legăturile cu atributul nofollow nu afectează PR.
  8. Legăturile interne eficiente afectează PR.
  9. Link-urile de pe site-uri tematice au un efect mai puternic.
  10. Textul folosit într-un link poate fi adesea mai important decât PR-ul paginii care leagă.
  11. Legăturile de ieșire și de intrare către site-uri tematice de înaltă calitate au un efect pozitiv asupra PR.
  12. Mai multe link-uri identice dintr-o pagină sunt considerate ca una.
  13. Site-ul poate fi interzis pentru link-uri către site-uri interzise.

1.1 Ce este PageRank?

  • PR este doar una dintre metodele folosite de Google pentru a determina relevanța și importanța paginii. [PageRank explicat corect 6]
  • Google folosește mulți factori pentru a clasa paginile, PageRank este unul dintre cei mai buni. PR reflectă două puncte importante, câte pagini leagă la o anumită pagină și ce nivel de pagini leagă la aceasta. Cinci până la șase link-uri de la site-uri precum www.cnn.com 7 sau www.nytimes.com 8 pot fi mai utile decât multe link-uri de la site-uri mai puțin stabilite. [ Google Librarian Central 9 ]
  • PR poate reflecta doar calitatea aproximativă a unei pagini, dar nu are nicio legătură cu relevanța sa de actualitate, care poate fi determinată doar luând în considerare contextul linkurilor și factori precum densitatea cuvintelor cheie, titlul paginii etc. [PageRank: un eseu 10]

1.2 Cum funcționează PageRank?

  • Nimeni nu știe exact cum calculează Google PR.[Google PageRank explicat 11]
  • PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). Așa arată formula aproximativă pentru calcularea PR, unde paginile t1-tn care se leagă la A, C(tn) este numărul de link-uri de ieșire către pagina corespunzătoare, coeficientul d este de obicei egal cu 0,85.
  • Putem presupune că PR este calculat prin formula PR = 0,15 + 0,85 * (partea din PR a fiecărei pagini de link transmisă de a noastră). Cantitatea de PR pe care o pagină o poate folosi pentru a vota pe ceilalți este puțin mai mică decât propriul PR, 0,85 * PR pentru a fi exact și este împărțită între paginile către care trimite. [Google's PageRank 12]
  • Algoritmul de calcul PR se bazează pe distribuirea PR-ului propriu al paginii, între paginile la care se leagă. De exemplu, dacă există un singur link pe o pagină cu PR8, atunci pagina la care se leagă va primi toate PR disponibile, dar dacă există 100 de link-uri pe această pagină, atunci fiecare dintre ele va primi doar o sutime din PR disponibil. . [Importanța PageRank 13]
  • Ca rezultat al acestui algoritm de calcul PR, un link dintr-o pagină cu PR4 și 5 link-uri externe este mai eficient decât un link dintr-o pagină cu PR8 și 100 link-uri externe. PR-ul legat de pagini este important, dar la fel de important este și numărul de link-uri de ieșire pe care le conțin, cu cât mai multe link-uri de ieșire, cu atât mai puțin PR va trece fiecare. [Google's PageRank 12]
  • PR folosește linkurile de intrare ca un indicator al importanței paginii. Google interpretează un link de la pagina A la pagina B ca un vot al paginii A în favoarea paginii B. Se ia în calcul nu doar numărul de voturi, ci și calitatea paginilor de vot. Cu cât PR-ul unei pagini este mai mare, cu atât votul acesteia este mai important. [ Google: tehnologie 14 ]
  • Nu toate linkurile sunt la fel de utile. Cu cât PR-ul paginii care leagă este mai mare, cu atât transmite mai mult PR, dar trebuie să ții cont de faptul că acest PR este împărțit în mod egal între toate paginile către care se leagă. Prin urmare, un link de la o pagină cu PR4 și un singur link de ieșire poate produce mai mult decât un link de la o pagină cu PR5 și 100 de link-uri de ieșire. Un exemplu tipic al binecunoscutelor pagini master de milioane de dolari, o astfel de pagină cu PR7 și sute de link-uri de ieșire, în ciuda importanței sale, transmite PR nesemnificativ către alte pagini. [Google PageRank explicat 11]
  • Fiecare nivel următor de PR este atins mult mai dificil decât cel anterior. Calculul PR folosește o scară logaritmică, ceea ce înseamnă că este nevoie de un pas pentru a trece de la PR0 la PR1, PR3 este ceva mai greu de punctat, PR4 este și mai greu și PR5 este semnificativ mai greu. [Întrebări frecvente Google Page Rank 15]
  • PR este calculat nu pentru site ca un întreg, ci pentru fiecare pagină individualăși este legată recursiv la PR-ul paginilor care leagă la acesta. [Algoritmul Page Rank 17]
  • Google combină PR cu tehnici sofisticate de căutare a textului, multe aspecte ale conținutului paginii și ale paginilor care leagă la aceasta sunt analizate pentru a găsi pagini mai bune decât altele care se potrivesc cu interogarea utilizatorului. [Ce este Google PageRank? optsprezece]
  • PR este recalculat în mod constant, dar datele din bara de instrumente sunt actualizate la fiecare câteva luni, site-urile noi sunt atribuite PR0. [Google PageRank explicat 11]
  • PR nu este doar valori întregi de la 0 la 10, PR este un număr real. Este corect să ne gândim la PR ca la un număr real, deoarece în calculele interne folosim multe gradații, și nu doar valorile de la 0 la 10 afișate în bara de instrumente. [Matt Cutts 19]
  • Robotul nu analizează site-urile instantaneu. Este nevoie adesea de două actualizări complete pentru ca toate linkurile de intrare să fie detectate, numărate și afișate ca linkuri de intrare. [Întrebări frecvente Google 20]

1.3 Factori care afectează PageRank

  • Fiecare link primit contează, cu excepția linkurilor de pe site-uri interzise. PR este un fel de sistem de vot, fiecare link către o pagină este un vot în favoarea ei. Paginile cu PR ridicate sunt considerate mai importante și voturile lor contează mai mult în unele cazuri, dar, în general, cu cât sunt mai multe link-uri de intrare, cu atât mai bine. [Întrebări frecvente Google PageRank 21]
  • Adăugarea de noi pagini poate scădea PR. Acest efect este că PR-ul total al site-ului crește, dar una sau mai multe pagini vechi pierd o parte din PR, din cauza cărora cele noi îl primesc, cu cât se adaugă mai multe pagini, cu atât mai mult PR pierd cele existente. Pe site-urile mari, acest efect este invizibil, dar pe site-urile mici poate fi observat uneori. [PageRank explicat 12]
  • Scăderea PR. PR-ul unei pagini poate scădea din cauza dispariției unor link-uri importante care i-au dat PR sau a unei scăderi a PR-ului paginilor care leagă la aceasta. [Întrebări frecvente Google PageRank 22]
  • Titlurile (h1, … , h6) și etichetele puternice sunt importante, dar nu afectează PR. Folosiți metaetichete, titluri și b, etichete puternice, dar păstrați conținutul lizibil și util. Acordați atenție textului din jurul cuvintelor cheie, motoarele de căutare sunt din ce în ce mai bune la semantică, așa că contextul cuvintelor cheie este foarte important.
  • De mare importanță este eficacitatea structurii interne a site-ului. Paginile de pe site ar trebui să fie legate în cel mai simplu mod posibil, în mod ideal nu ar trebui să existe pagini la mai mult de trei clicuri distanță de pagina principală. [ 23 ]
  • Link-urile de la și către site-uri legate de PR sunt foarte importante. Cu cât tema paginilor este mai apropiată, cu atât linkul transmite mai mult PR. Link-urile către site-uri de renume cu subiecte similare arată motoarele de căutare că site-ul este util vizitatorilor, acest lucru nu este întotdeauna adevărat pentru site-urile care există de câțiva ani și au un clasament Google ridicat. Referindu-ne doar la site-uri de înaltă calitate, puteți obține un avantaj față de concurenți. [Lăsați algoritmul Google să vă arate traficul 23 , Întrebări frecvente 15 ]
  • Textul linkului contează. Cu cât textul linkului este mai specific, cu atât Google îl poate asocia mai bine la interogările utilizatorilor.
  • Fermele link (link cleaning stations) sunt penalizate. Google este interesat de paginile care conțin mai puțin de 100 de link-uri de ieșire, paginile cu un număr mare de link-uri sunt considerate ferme de link-uri și penalizate. [Întrebări frecvente Google 24]
  • Link-urile primite de pe site-uri populare sunt foarte importante. Dacă o pagină este legată de pagini cu PR, aceasta primește o parte din reputația lor.
  • Un site poate fi interzis dacă trimite către site-uri interzise. Fiți foarte atenți la link-urile de ieșire, nu faceți linkuri către site-uri suspecte (escrocherii de linkuri, site-uri interzise etc.), Google vă poate penaliza site-ul pentru astfel de link-uri, verificați întotdeauna PR-ul site-urilor la care faceți legătura. [SiteProNews 25]
  • Frauda se pedepsește cu penalizare PRși poate duce la interdicție. Text ascuns, redirecționări, desimulare, schimb automat de link-uri și alte acțiuni care contrazic Regulile Google privind calitatea 26 poate duce la interzicerea unui site de către Google.
  • Google ia în considerare durata de viață a site-ului, relevanța link-urilor primite și timpul de existență a acestora dacă link-ul de intrare nu este relevant, nu va genera prea multe PR.
  • Mit: Cu cât PR este mai mare, cu atât este mai mare poziția în rezultatele căutării. Desigur, paginile cu un PR ridicat în rezultatele căutării sunt situate mai sus decât concurenții cu un PR mai scăzut, dar nu trebuie să uităm că Google ține cont de contextul linkurilor de intrare și doar de acele linkuri care sunt legate de cuvintele din interogarea poate avea o poziție ridicată în rezultatele căutării pentru această interogare. [