Internet ablakok Android

pagerank számítás. Magyarázata PageRank

Egy oldal PageRank értékének kiszámításához figyelembe kell vennie az adott oldalra mutató összes belső és külső hivatkozást. Az alábbiakban az A oldal PageRank értékének kiszámítására szolgáló egyenlet látható.

PR(A)=(1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

PR(t1…tn)- az A oldalra mutató oldal súlya

C- az A oldalról kimenő linkek száma

d a csillapítási együttható, amelyet általában 0,85-nek vesznek.

Egy oldal „szavazza” a PageRank értékét minden olyan oldalon, amelyre hivatkozik. Az oldal szavazati értéke az oldal saját PageRank értékének összege * 0,85. Ez az érték egyenletesen oszlik el az összes oldal között, amelyre a kimenő linkek vezetnek.

Az egyenlet azt jelenti, hogy egy öt kimenő linket tartalmazó PR4 oldal egyetlen hivatkozása nagyobb súllyal bír, mint egy 100 kimenő linket tartalmazó PR8 oldal hivatkozása. Minél több kimenő hivatkozás található egy oldalon, annál kevesebb PageRank kerül átadásra az adott linknek.

Vegye figyelembe, hogy amikor egy oldal megszavazza a PageRank értékét más oldalakon, az adott oldal saját PageRank értéke nem csökken. A szavazó oldal nem járul hozzá a PageRank értékéhez. Olyan ez, mint a részvényesek közgyűlése, ahol minden részvényes a tulajdonában lévő részvények száma szerint szavaz, de nem adja oda. Továbbá látni fogjuk, hogy ugyanazok az oldalak közvetve elveszítik a PageRank egy részét.

Az egyenlet egyértelműen megmutatja, honnan származik az oldal PageRank értéke. Tegyük fel, hogy van 2 oldalunk, A és B, amelyek egymásra hivatkoznak, ezeken az oldalakon nincs más hivatkozás. Íme, mi történik:

A Google PageRank kiszámítása az A oldalhoz

1. lépés: Számítsa ki az A oldal PageRank értékét

Az oldal mostantól az új PageRank értékkel rendelkezik. A számításhoz a B oldal kimenő hivatkozásának súlyát használtuk, de a B oldalnak van egy kimenő hivatkozása is az A oldalra, és a kapott PageRank érték nem lehet pontos, amíg a B oldal PageRank értéke nem ismert.

A Google PageRank kiszámítása a B oldalhoz

2. lépés: Számítsa ki a B oldal PageRank értékét

A B oldal új PageRank értéket kapott, ami nem lehet pontos, mert az A oldal PageRank értéke pontatlan a számításhoz.

Nem tudjuk kiszámítani a pontos PageRank értékét az A oldalhoz, amíg nem ismerjük a B oldal PageRank értékét, és nem tudjuk kiszámítani a pontos PageRank értékét a B oldalhoz, amíg nem ismerjük az A oldal PageRank értékét.

Lehetőség van az A és B oldal PageRank értékének újra és újra kiszámítására, és az eredmény minden alkalommal eltér az előzőtől, és pontatlan lesz. Megismételhetjük a számításokat az előző lépésben kapott értékek felhasználásával. De mindig pontatlan értékeket használunk a számításokhoz, így az eredmények mindig pontatlanok lesznek.

A problémát a számítások többszöri megismétlésével oldhatja meg. Minden alkalommal valamivel pontosabb eredményeket kapunk. Valójában soha nem érhető el pontosság, mivel a számítások mindig pontatlan bemeneteken alapulnak.

Előbb-utóbb eljutunk arra a pontra, ahol a további iterációnak alig lesz hatása a számítások eredményére. Ez megmagyarázza, hogy a PageRank értékeinek újraszámítása a Google összes oldalára miért vesz igénybe annyi időt és számítási erőforrásokat.

Az egyetlen dolog, amiben biztosak lehetünk, az az, hogy egy bármilyen forrásból származó hivatkozás növeli oldalunk PageRank értékét.

Mi a legjobb módja a webhely belső hivatkozásainak indexelésének az egyes oldalak PR-jének növelése érdekében? Tekintsük azt a képletet, amely az aktuális A oldal PR-jét számítja ki:

itt d- a referenciasúly csillapítási együtthatója, pontos értékét a Google elrejti, általában 0,85-nek veszi. A kérdésünkkel összefüggésben ennek nincs jelentősége, hiszen a kiválasztott oldalak PR-jét szeretnénk értékelni az összes többihez képest;
T 1 ,…, T n - linkre hivatkozó oldalak DE;
PR(T 1 ) ,…, PR(T n ) – hivatkozó oldalak PR;
C(T 1 ) ,…, C(T n ) - a hivatkozások száma a hivatkozó oldalakon.

Sajátosságok:

  1. Ha egy oldal önmagára mutató hivatkozást tartalmaz, akkor ez a hivatkozás nem kerül figyelembevételre a számítás során.
  2. Az olyan oldalakra mutató hivatkozásokat sem veszik figyelembe, amelyek magukban nem tartalmaznak hivatkozásokat.
  3. Két vagy több azonos hivatkozás egy oldalról egynek számít.
  4. A Google egyes webhelyeken szűrőket írhat elő, amelyek rontják a linkek súlyának áramlását, és torzításokat vezetnek be a PR meghatározására szolgáló képletbe, ezt a hatást itt nem vesszük figyelembe.

Hogyan kell használni ezt a képletet, mert a jobb oldalon a szintén kiszámítandó oldalak PR-je látható? Vegyük a Google által indexelt összes internetes oldalt, és vegyük mindegyik kezdeti PR-ját egynek, majd szekvenciálisan számítsuk ki az összes Page Rank értékét. Ez volt az első iteráció, amelyben minden oldal kapott valamilyen PR értéket. Ezzel az algoritmussal sokszor megismételjük a számításokat, az előző lépésben kapott értékeket PR-oldalként használva. Az algoritmus sajátossága, hogy akármilyen kezdeti PR-t veszünk és bármilyen sorrendben számoljuk ki, kellően nagy számú iteráció esetén ugyanarra a számra jutunk.

A szokásos egész PR 0-tól 10-ig azonban nem az, amit az előző bekezdésben kaptunk. PR 0…10 – az úgynevezett "Eszköztár" PR ( Eszköztár PageRank), azért vezették be, hogy az összes PR-értéket abszolút értékben ábrázolhassa, függetlenül a hálózatban lévő oldalak számától. Itt van:

ahol az alap egy szám, amely a Google indexében lévő oldalak számától és egyéb, általában vett tényezőktől függ bázis egyenlő 7;
a– redukciós tényező, 0< a≤ 1, leggyakrabban 1-nek veszik.

Esély bázisés a, valamint maga a TLPR képlete, most nem fontosak számunkra, a lényeg az, hogy a TLPR növekedése mindig a PR növekedésével jár együtt, ezért az utóbbira fogunk koncentrálni. Felejtsük el a külső hivatkozásokat más forrásokhoz, és próbáljuk meg a PR-t csak belső tényezők alapján kiszámítani. Tegyük fel, hogy van egy hat oldalas webhelyünk:

Mindegyikhez tartozik egy menü: "Főoldal", "A webhelyről", "Cikkek listája". A menüelemekre az oldal minden oldalán hivatkozunk. A "cikklista" a cikkeket tartalmazó oldalakra is vonatkozik. Az ilyen linkeloszlású oldal rangsorát a fenti diagram jelzi. A PR számításánál 100 iterációt végeztem, egyet vettem kezdeti értéknek, és a kapott számokat a tizedesvessző utáni századokra kerekítettem.

Tegyük fel, hogy csak a főoldalt szeretnénk reklámozni. A PR növelése érdekében logikus lenne, ha csak a hozzá vezető linkek indexelését engedélyeznénk. Ugyanakkor figyelembe vesszük, hogy egyetlen oldalt sem szabad levágni az oldalról, vagyis minden oldalon indexelt linket kell elhelyezni:

Nos, felment a kért oldal PR-ja. Most próbáljunk meg linket tenni az "1. cikkhez" és nézzük meg, hogyan változik a terjesztés:

Úgy tűnik, hogy egy extra link elhelyezésével a főoldalon le kell vonnunk a link súlyát, és ezáltal gyengítenünk kell. Valójában azonban éppen az ellenkezője derül ki - a referenciasúly növekedéssel tér vissza! Ezzel az intézkedéssel egyidejűleg felvetjük az "1. cikkelyt".

Most meggondoljuk magunkat, és úgy döntünk, hogy csak a cikkek listáját hirdetjük:

Most sikerült megszereznünk a legmagasabb PR-értéket az összes korábban kiszámított közül, ami 2,8 a cikklistára. Amint ez a példa mutatja, egyszerűbb növelni a sok belső hivatkozást tartalmazó oldal PR-értékét, feltéve, hogy természetesen visszamutató hivatkozások vannak telepítve rá. Ugyanezt a hatást mutattuk be, amikor a fő cikkből linket készítettünk az „1. ​​cikkhez”.

És most megtörjük az oldal logikai felépítését: a főoldalról az összes többire, az összes oldalról pedig a főoldalra mutató hivatkozásokat helyezünk el. A többi link az indexelés elől zárva lesz.

  1. A sok hivatkozást tartalmazó oldalak Page Rank értékének növelésének legjobb módja a backlinkek telepítése. Ilyen oldalak közé tartoznak a fórumok, cikklisták, webhelytérképek stb.
  2. Egy oldal PR-je nagyszerűen megemelkedik, ha az 1. oldal oldalairól linket teszel rá, ezzel Page Rank-ot halmozva.
  3. A főoldal PR-jének növelése érdekében hasznos lehet cikkek, hírek stb. közlemények elhelyezése, amelyek a teljes szöveget tartalmazó oldalakra vezetnek. Ismét ne feledkezzünk meg a visszamutató linkekről.

És itt van egy forgatókönyv, amely segít a PR kiszámításában. Kísérletezzen a webhelyen található linkek indexelésének különböző lehetőségeivel.

    // webhelyoldalak tömbje: az egyes oldalak tömbjének első eleme az oldal neve,

    // az összes többi elem a tömbben lévő oldalak indexe, amelyek az aktuálisról hivatkoznak

    $oldalak = tömb

    sor( "Főoldal", 1 , 2 ) ,

    tömb ("A webhelyről" , 0 , 2 ) ,

    tömb ("Cikkek listája" , 0 , 1 , 3 , 4 , 5 ) ,

    array("1. elem" , 0 , 1 , 2 ) ,

    array("2. elem" , 0 , 1 , 2 ) ,

    array("3. elem" , 0 , 1 , 2 )

    // az oldalak kezdeti értékének beállítása PR = 1

    for ($i = 0 ; $i< count ($pages ) ; $i ++ ) $pr [ $i ] = 1 ;

    // iterációk száma = 100

    for ($i = 0 ; $i< 100 ; $i ++ )

    for ($j = 0 ; $j< count ($pages ) ; $j ++ )

    $add = 0 ; // növekedés külső hivatkozásokból

    for ($k = 0 ; $k< count ($pages ) ; $k ++ )

    if ($k == $j ) tovább ;

Kollégák, végre készen állunk, hogy figyelmükbe ajánljuk a Netpeak Spider forradalmi funkcióját - a belső PageRank kiszámítását! A régi számítási mechanizmusból nem maradt semmi, az új bevezetéséhez pedig kénytelenek voltunk végrehajtani az előző kiadást, ami gyökeresen megváltoztatta a programon belüli szkennelési algoritmust. Ezt az utólagos utasítást elkészítettük Önnek, amelyre közvetlenül az új belső PageRank számítási eszköz felületéről térhet vissza.

Mi az a PageRank

PageRank az oldal relatív súlya, a következő képlettel számítva:

PR(A) = (1-d) / N + d* (PR(B) / L(B) + PR(C) / L(C) + ...)

  • N a számításba bevont aktív csomópontok (oldalak) teljes száma;
  • d– csillapítási tényező (általában 0,85-öt használnak);
  • L- a kimenő linkek száma.

Általánosan elfogadott, hogy a nulla (0) iterációnál minden oldal PageRank értéke azonos és egyenlő 1/N. A következő iterációknál az összes bejövő hivatkozás súlyát használjuk, ami az előző iteráció súlya osztva a kimenő linkek száma (a képletben - L).

Kifejezetten az Ön számára készítettünk néhány táblázatot, amelyek egyértelműen bemutatják az algoritmus működését:

A Google kiszámítja ezt a paramétert az internet minden oldalára, míg a Netpeak Spider lehetővé teszi a számítást belső PageRank , amely a feltérképezett webhelyre vagy az URL-ek listájára korlátozódik.

Miért kell kiszámítani a belső PageRank értéket?

Ez a funkció legalábbis azért forradalmi, mert lehetővé teszi, hogy valódi betekintést nyerjen a projektjébe:

1. Pontosan megértse, hogyan oszlik el a linklé a webhelyen, és hol koncentrálódik.

2. Határozza meg, hogy mely oldalak, amelyek nem fontosak a keresőmotorok promóciója szempontjából, válnak túlsúlyossá.

3. Tudja meg, hogy mely oldalak "lelógó csomópontok" és egyszerűen "égetik" a bejövő linkeket.

Feltételezve, hogy a külső hivatkozások az Ön webhelyére vezetnek, képzelje el, mennyi SEO költségvetést takaríthat meg egy hatékonyabb belső linkelési rendszer megvalósításával.

A belső PageRank kiszámítása

A Netpeak Spider 2 módszert kínál a belső PageRank kiszámítására:

1. Automatikus

Csak válassza ki a "Belső PageRank" speciális paramétert a "Paraméterek" lap feltérképezési beállításainál, és a rendszer automatikusan kiszámítja a feltérképezési folyamat szünetelésekor vagy sikeres befejezése után.

Kérjük, vegye figyelembe, hogy ennek a mutatónak a kiszámításához engedélyezni kell a „Kimenő linkek” paramétert, mivel a kimenő linkek képezik a visszacsatolás alapját, amelyek nélkül nem számítható ki a belső PageRank.

2. Kézi (külön eszközzel)

Egy speciális eszköz hívásához lépjen az "Eszközök" → "Belső PageRank számítás" menübe.

Itt a következő blokkokat láthatja:

2.1. Az automatikus számítási módszerhez is használt beállítások:

  • iterációk száma [5-től 50-ig]→ a nagyobb iterációk száma nagyobb számítási pontosságot biztosít, azonban megfigyeléseink szerint körülbelül 15 iteráció a legmegfelelőbb érték, amivel gyorsan elérheti a kívánt eredményt, így a Netpeak Spiderben alapértelmezés szerint 15 iteráció van beállítva;
  • csak belső linkek→ egy beállítás, amely lehetővé teszi az összes külső kimenő hivatkozás számításra gyakorolt ​​hatásának letiltását;
  • csak az [Összes eredmény] / [Szűrők] lapon található hivatkozások→ egy beállítás, amely lehetővé teszi, hogy a számításokat csak azokra a hivatkozásokra korlátozza, amelyek a megfelelő lapokon találhatók: használja a [Szűrőket] olyan esetekben, amikor a PageRank-ot csak az elemzett webhely egy bizonyos kategóriáján belül kell kiszámítani;
  • eredmények megjelenítési mód→ "Real" a pontos PageRank értékeket mutatja, de kényelmetlen lehet a nagy oldalszámú webhelyek esetén; Az „Adaptív” mód lehetővé teszi ugyanazon adatok megtekintését, de egy speciális együtthatóval megszorozva, így kényelmesen dolgozhat nagy webhelyekkel.

Kérjük, vegye figyelembe, hogy ha egyszerre törli a "csak belső hivatkozások" és a "csak az [Összes eredmény] / [Szűrők] lapon található hivatkozások" jelölőnégyzetet, a Netpeak Spider elkezdi letölteni és elemezni az összes kimenő hivatkozást az összes feltérképezett oldalról a számítások során. Ebben az esetben a jelentésben megjelenhetnek a „Not Crawled” (nem feltérképezett) állapotkódú linkek – ez azért szükséges, hogy a tényleges kimenő linkek alapján a belső PageRank a lehető legpontosabban számítható legyen.

2.2. A képlet, amellyel a belső PageRank kiszámításra kerül, valamint a fenti N, d paraméterek és egy hivatkozás erre a cikkre.

2.3. Figyelmen kívül hagyott URL-lista: Hozzáadhat egy hivatkozást ehhez a listához, hogy teljesen kizárja azt a PageRank elemzésből. Ez a funkció lehetővé teszi, hogy nagyon rugalmasan dolgozzon a számításokkal, közvetlenül a programban módosítva a belső hivatkozásokat.

Ne feledje, hogy nem egy adott oldalon lévő egyetlen linket zár ki, hanem a teljes csomópontot: képzelje el, hogy a teljes webhelyről egyetlen link sem mutat erre az oldalra (bejövő linkek), és egyetlen link sem erről az oldalról más oldalakra. oldalak (kimenő linkek).

2.4. Adatok exportálása táblázatból fájlba CSV/Excel formátumban.

2.5. Az eredményül kapott táblázat, amely a következő oszlopokat tartalmazza:

  • Blokk "Oldalok"→ sorozatszám (#) és link az oldalra;
  • Blokk "Iterációk"→ a számítások megkezdése után itt jelennek meg a megfelelő oszlopok az egyes iterációk adataival;
  • Blokk "Kapcsolatok"→ ez mutatja a kimenő és bejövő hivatkozások számát, amelyeket a bal egérgomb dupla kattintásával vagy a helyi menü meghívásával lehet megnyitni: ezeknek a jelentéseknek a kényelmes nézetét kifejezetten az Ön számára fejlesztettük ki, és lehetőség van arra, hogy mélyebbre menjen és visszatérjen a szokásos "Vissza" / "Előre" gombok, amelyek teljes hozzáférést kapnak a kapcsolati grafikonhoz;
  • Blokk "Algoritmikus elemzés"→ itt vannak összegyűjtve a kifejezetten a PageRank algoritmussal meghatározott paraméterek, nevezetesen a „Link állapota” (erről a paraméterről bővebben lentebb olvashat) és a „Végső hivatkozás” – olyan esetekben, amikor az algoritmus eredményeként átirányítást találtak;
  • Blokk "Fő paraméterek"→ lehetővé teszi a szerver válaszkódjának és a megfelelő oldalak tartalomtípusának megtekintését;
  • Blokk "Indexelési lehetőségek"→ kombinálja azokat a paramétereket, amelyek kritikusan befolyásolják a linkek súlyának eloszlását a webhelyen: a Robots.txt, a Canonical, az X-Robots-Tag, a Meta Robots utasításait, valamint az átirányítás végső URL-jét és a Refresh címkét, ha vannak ilyenek. az oldalon.

A táblázat alján az „Összes PageRanks összege” kerül kiszámításra → minden iterációnál az összegnek egyenlőnek kell lennie 1-gyel ("Valós" módban) vagy 10-nel a megfelelő teljesítményhez ("Adaptív" módban). Ha az összeg eltér a megadott értékektől, akkor az elemzett webhelyen lógó csomópontok találhatók, amelyeken elveszíti a hivatkozást.

2.6. Állapotpanel, amely a kapott táblázattal együtt az algoritmus összes lépését mutatja, így a felhasználók láthatják a számítások dinamikáját.

A "Belső PageRank számítás" eszközből való kilépéskor az utolsó iteráció adatai automatikusan bekerülnek a program főtáblázatába a megfelelő oszlopba. Ha előtte már volt néhány adat a főtáblában, akkor az újabbak felülírják azokat.

Számítási algoritmus

A belső PageRank kiszámításához ismét engedélyezni kell a Kimenő hivatkozások paramétert, amely lefedi az oldalak közötti összes kapcsolatot, lehetővé téve az alapvető indexelési utasítások, a linkattribútumok és a linksúly átirányítási beállítások figyelembevételét.

Az egész folyamat 2 egymást követő lépésből áll:

1. Kapcsolódási gráf felépítése → ennek a szakasznak a célja a linkek kapcsolatának felépítése és állapotuk beállítása:

1.2. Kezdeti elemzés → linkek felosztása OK, Hanging Node és Redirecting állapotokra (a linkállapotokról bővebben lent olvashat).

1.4. Bejövő linkek számolása.

1.5. Végső elemzés → a kimenő és bejövő hivatkozások részletes elemzése, valamint a "Vége hivatkozások" és a "Nem kapcsolódó csomópont" állapotú hivatkozások meghatározása.

2. Belső PageRank számítás → a 0. iterációtól kezdve a beállításokban megadottig.

Linkállapotok

A PageRank algoritmus legérdekesebb része az, hogy az összes hivatkozás logikailag 4 állapotra van felosztva:

1. Rendben

Ezek "200 OK" kiszolgáló válaszkóddal rendelkező HTML oldalak, amelyek kimenő hivatkozásokat tartalmaznak, és lehetnek:

  • noindex, azaz nem indexelt → igen, nem úgy tűnt, hogy a nem indexelt oldalak linksúlyt is hordoznak
  • a Canonical címke magára mutatott
  • a Refresh címkével önmagára mutatott

2. Lógó csomó

0 kimenő linket tartalmazó oldalak, ami azt jelenti, hogy ezek az oldalak nem adják tovább a linklevet, és teljesen elveszítik azt.

Ez a típus a következőket tartalmazza:

  • 2xx oldal, amely egyszerűen nem tartalmaz kimenő linkeket
  • 2xx oldal zárva a Robots.txt fájlban
  • 2xx nofollow oldal az X-Robots-Tag vagy Meta Robots utasításokban
  • 2xx oldal, de nem HTML, így nincs kimenő link
  • 3xx linkek zárva a Robots.txt fájlban
  • 3xx hivatkozások végtelen átirányítással ("3xx átirányítási hurok" állapotkód)
  • 4xx oldal
  • 5xx oldal
  • bármely más szerver válaszkódot visszaadó oldalak
  • átirányítási oldalak (Canonical vagy Refresh), amelyek nem érték el a céloldalt: ebben az esetben az "Endless Redirected" állapotkód jelenik meg, vagyis egy végtelen átirányítás
  • az „Összes eredmény” táblázatban nem szereplő kimenő hivatkozások → vegye figyelembe, hogy alapértelmezés szerint a „csak belső hivatkozások” és a „csak az [Összes eredmény] / [Szűrők] lapon található hivatkozások” jelölőnégyzetek letiltásával a Netpeak Spider megpróbálja megtalálni az oldalon található összes hivatkozás a feltérképezési beállításoktól függetlenül – ez azért szükséges, hogy teljes és pontos képet kapjunk a link súlyának átviteléről

3. Átirányítás

Ez a típus a következőket tartalmazza:

  • 3xx oldal
  • 2xx oldal Canonical címkével egy másik oldalra mutatva
  • 2xx oldal egy másik oldalra mutató Refresh címkével

4. Nem kapcsolódó csomópont

Hivatkozások, amelyek nem tartalmaznak bejövő hivatkozásokat.

  • webhely feltérképezése letiltott indexelési utasításokkal (Robots.txt, Canonical, Refresh, X-Robots-Tag, Meta Robots és a linkeken található nofollow attribútum) → vegye figyelembe, hogy ha ezek az utasítások le vannak tiltva, a Netpeak Spider ettől eltérően térképezi fel a webhelyet keresőrobotok által, de a PageRank algoritmus mindig ezen utasítások szerint működik, így előfordulhat, hogy a feltérképezés eredményeként kapott hivatkozások egy része elérhetetlen a PageRank algoritmus számára.
  • saját URL-listájának feltérképezése → olyan hivatkozások, amelyek semmilyen módon nem kapcsolódnak egymáshoz.

3 új hiba

Közvetlenül a belső PageRank automatikus vagy manuális kiszámítása után 3 típusú hiba kerül a program fő felületére, ha azok jelen vannak az oldalon:

  • PageRank: lóg→ mint fentebb említettük, ezek olyan oldalak, amelyek nem tartalmaznak kimenő linkeket, és nem adják át a linkek súlyát, ezáltal megsértik a linkek súlyának természetes eloszlását a webhelyen;
  • PageRank: átirányítás→ Linklevet átirányító oldalak – ezek lehetnek olyan oldalak, amelyek 3xx átirányítást adnak vissza, vagy tartalmazhatnak más URL-re mutató Canonical/Refresh címkéket.
  • PageRank: hiányzó linkek→ ezek olyan elérhetetlen oldalak, amelyekre nem található bejövő hivatkozás.

Röviden a főről

Kollégák, sikerült megvalósítanunk a legpontosabb algoritmust a belső PageRank kiszámításához, amellyel számos betekintést nyerhetsz az elemzett oldalról: hogyan oszlik el pontosan a linkek súlya az oldalakon, mely oldalak jutnak el a SEO szempontjából feleslegesen. túlsúly, mely „lelógó csomópontok” találhatók az oldalon, és végül hogyan lehet ezeket a hibákat kijavítani.

Próbáljon ki egy új egyedi funkciót, kísérletezzen különböző beállításokkal, és valósítson meg új és hatékonyabb belső összekapcsolási sémákat! :)

A PageRank a webhely egyik fő külső mutatója, amely jelentősen befolyásolja az Ön erőforrásának népszerűségét az interneten, és jelentősen befolyásolja a potenciális bevételt (például a webhely oldalain található linkek eladásával).
Ebben a cikkben szeretném részletesen leírni az összes olyan pontot, amely a Google PageRank-jával kapcsolatos.

Mi az a PageRank és mire való?
Mint ismeretes, a PageRank a Google keresőmotorja által használt számszerű mutatója egy webhely oldalának az interneten található összes többi oldalhoz képest. A PageRank azon az elven alapul, hogy egy tudós hitelességét tudományos körökben az alapján számítják ki, hogy ki és milyen gyakran hivatkozik más tudósok munkáira.
A PageRank jellemzői:
- a mutató nem az erőforrás egészéhez, hanem a webhely egy külön oldalához van hozzárendelve (általában a főoldal rendelkezik a legmagasabb PageRank szinttel, mivel a legtöbb hivatkozás van rá);
- az oldalról vezető hivatkozás nem csökkenti az oldal PageRank értékét (statikus súlyát);
- A PageRank szintje nem befolyásolja az oldal relevanciáját, vagyis nem kerül az első pozíciókra a keresési lekérdezésekben, csak mert nagyobb a súlya. Ez bizonyos mértékig biztosan befolyásolja a pozíciót, de a Google a keresési lekérdezésnek megfelelő oldal minőségi tartalmát részesíti előnyben.

Mire való a PageRank? Végül is ez nem befolyásolja a relevanciát.
A webmestereknek szükségük van rá, hogy növeljék az erőforrásaikra mutató linkek elhelyezésének költségeit. Ha egy oldalon (nem a főoldalon) egy link ára PR = 0 mellett maximum 10 centbe kerül, akkor PR = 4 esetén ennek sokszorosa.
Ezenkívül a PageRank magas szintje az oldal tekintélyét, a Google keresőmotor általi teljes észlelését jelzi. Az ilyen oldalak kombinációja lehetővé teszi a Google számára, hogy tematikus véleményt alkosson az erőforrásról. Nem mondom meg, de úgy gondolom, hogy a Google gyakran nem találja meg a keresett konkrét információkat, és hasonló tematikus forrásokra ad választ, és ennek megfelelően a PageRank szinttől függően rangsorolja azokat. Mintha megkérné a felhasználót, hogy hol találhatja meg az őt érdeklő információt.

Hogyan számítsuk ki a PageRank-ot?
Egy oldal PageRank értékének kiszámításához figyelembe kell vennie az oldalra mutató összes belső és külső hivatkozást:
- minél több külső hivatkozás van az oldalra, annál nagyobb PageRank súly kerül át erre az oldalra;
- minél több belső hivatkozás található az oldalon (beleértve az egyéb forrásokra mutató külső hivatkozásokat is), annál nagyobb a PageRank súlya egyenletesen elosztva az egyes linkeken. Így minden hivatkozás azonos súlyt kap.

Ez alapján létre kell hozni az oldal belső linkjét, hogy a PageRank minden oldalra átkerüljön, de nem azonnal, hanem láncban. És minél hosszabb a lánc, annál nagyobb súlyt kapnak a benne lévő oldalak (letilthatja a PageRank átvitelét a linkekre, ha hozzáadja a rel=nofollow attribútumot).

A következő egyenlet használható egy oldal PageRank értékének kiszámításához:

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + PR(tn)/C(tn))

PR() - Az oldal PageRank értéke numerikus számként (lebegőpontos szám);
A - oldal PageRank, amelyet mi határozunk meg;
t1...tn - A oldalra mutató oldal;
C - az A oldalról kimenő linkek száma;
d a csillapítási tényező, általában 0,85.

Az oldal átadja a PageRank értéket az összes olyan oldalnak, amelyre hivatkozik. Ebben az esetben a PageRank értéke az oldal saját PageRank értékének 0,85-tel való szorzataként kerül kiszámításra. Ezután ez az érték egyenletesen oszlik el az összes oldal között, amelyre vonatkozik.

A táblázat segítségével hozzávetőlegesen kiszámolhatjuk, hogy bizonyos számú linkkel oldalunk milyen PageRank-ot kap:

Linkek száma: A mi oldalunkra hivatkozó oldalak PageRank:
0 1 2 3 4 5 6 7 8 9 10
1 0 0 0 +1 +2 +3 +4 +5 +6 +7 +8
4 0 0 +1 +2 +3 +4 +5 +6 +7 +8 +9
19 0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10
101 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 -
555 +2 +3 +4 +5 +6 +7 +8 +9 +10 - -
3 055 +3 +4 +5 +6 +7 +8 +9 +10 - - -
16 803 +4 +5 +6 +7 +8 +9 +10 - - - -
92 414 +5 +6 +7 +8 +9 +10 - - - - -
508 277 +6 +7 +8 +9 +10 - - - - - -
2 795 522 +6 +7 +8 +9 +10 - - - - - -
15 375 379 +7 +8 +9 +10 - - - - - - -
84 564 584 +8 +9 +10 - - - - - - - -
449 527 525 +9 +10 - - - - - - - - -

A PR oldalak értékét itt ellenőrizheti

Mindenki használja, de kevesen tudják, hogyan működik. A Google PageRank az egyik legfontosabb paraméter a webfejlesztők számára.

A több milliárd létező és a naponta létrehozott oldalak milliói között nehezebb keresni, mint gondolnád. A PageRank csak egy a Google által a keresés minőségének javítására használt több száz tényező közül. De hogyan működik, milyen tényezők befolyásolják és mi nem, és mit tudunk a PageRank-ról?

Ebben a cikkben csak a tényeket mutatjuk be.

Az elmúlt hét során rengeteg olyan tényt és feltételezést vizsgáltunk meg, amelyek reálisnak tűntek számunkra. Ezenkívül összeállítottunk néhány tudományos kutatást a keresésről és 16 hasznos PageRank eszközt.

A legfontosabb tényeket a cikk elején röviden ismertetjük.

Hogyan működik a PageRank?

  1. PageRank a Google által használt számos módszer egyike hogy meghatározzuk az oldal relevanciáját és fontosságát.
  2. A Google úgy értelmezi az A oldalról a B oldalra mutató hivatkozást hang A B mellett természetesen nem csak a szavazatok számát veszik figyelembe, hanem a szavazóoldalak minőségét is.
  3. PageRank a bejövő linkek száma alapján, de nem csak rajta, a relevancia és a minőség is fontos.
  4. Nem minden link járul hozzá egyformán a PageRank értékhez.
  5. Ha egy PR8-as oldalon csak egy link található, akkor az oldal, amelyre hivatkozik, megkapja az összes PR-t, amit továbbítani tud, de ha van 100 hivatkozás, akkor minden link csak egy részét továbbítja ennek a PR-nak.
  6. A rossz bejövő linkek nem befolyásolják a PR-t.
  7. A PR figyelembe veszi az oldal élettartamát, a bejövő linkek relevanciáját és létezésük idejét.
  8. A PR kiszámításakor a tartalmat nem veszik figyelembe.
  9. A PR-t nem a webhely egészére számítják ki, hanem minden oldalra külön-külön.
  10. Minden bejövő link számít, kivéve a tiltott oldalak linkjeit.
  11. A PR nem csak egész szám 0 és 10 között, hanem valós szám.
  12. Egyre nehezebb elérni a PR minden egyes szintjét, feltehetően logaritmikus skálát használnak.
  13. A PR-t folyamatosan újraszámolják, de az eszköztár adatai néhány havonta frissülnek.
  14. A Google megpróbál olyan oldalakat találni, amelyek szilárdak és egyszerre relevánsak.

A PageRank-ot befolyásoló tényezők

  1. A webhely gyakori frissítése nem növeli automatikusan a PR-t.
  2. A magas PR nem garantálja a magas pozíciókat a keresési eredmények között.
  3. DMOZ és a Yahoo! ne növelje automatikusan a PR-t.
  4. Az .edu és .gov oldalak nem növelik automatikusan a PR-t.
  5. A belső oldalak PR-értéke nem feltétlenül alacsonyabb, mint a főoldalé.
  6. A Wikipédiából származó linkek nem növelik automatikusan a PR-t.
  7. A nofollow attribútummal rendelkező hivatkozások nem befolyásolják a PR-t.
  8. A hatékony belső kapcsolatok befolyásolják a PR-t.
  9. A tematikus oldalak linkjei erősebb hatást fejtenek ki.
  10. A hivatkozásban használt szöveg gyakran fontosabb lehet, mint a linkelő oldal PR-je.
  11. A jó minőségű tematikus oldalakra mutató kimenő és bejövő linkek pozitív hatással vannak a PR-re.
  12. Egy oldalon lévő több azonos hivatkozás egynek minősül.
  13. Az oldal letiltható a tiltott oldalakra mutató hivatkozások miatt.

1.1 Mi az a PageRank?

  • A PR csak egy a Google által használt módszerek közül hogy meghatározzuk az oldal relevanciáját és fontosságát. [A PageRank helyes magyarázata 6 ]
  • A Google sok tényezőt használ az oldalak rangsorolására, a PageRank az egyik legjobb. A PR két fontos szempontot tükröz, hogy hány oldal hivatkozik egy adott oldalra, és milyen szintű oldalak hivatkoznak rá. Öt-hat link olyan webhelyekről, mint a www.cnn.com 7 vagy a www.nytimes.com 8, hasznosabb lehet, mint a kevésbé ismert webhelyekről származó sok több hivatkozás. [ Google Könyvtáros Központ 9 ]
  • A PR csak hozzávetőlegesen tükrözheti az oldal minőségét, de semmi köze annak aktuális relevanciájához, amelyet csak a linkek kontextusának, valamint olyan tényezőknek a figyelembevételével lehet meghatározni, mint a kulcsszó sűrűsége, az oldal címe stb. [PageRank: 10. esszé]

1.2 Hogyan működik a PageRank?

  • Senki sem tudja pontosan, hogyan számítja ki a Google a PR-t.[Google PageRank Explained 11]
  • PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)).Így néz ki a PR kiszámításának hozzávetőleges képlete, ahol t1-tn A-ra hivatkozó oldal, C(tn) a megfelelő oldalra mutató kimenő linkek száma, d együttható általában 0,85.
  • Feltételezhetjük, hogy a PR-t a PR = 0,15 + 0,85 * képlettel számítjuk ki (az egyes linkoldalak PR-jának a miénk által továbbított része). Az a PR mennyisége, amellyel egy oldal szavazhat másokra, valamivel kevesebb, mint a saját PR-értéke, egészen pontosan 0,85 * PR, és megoszlik azon oldalak között, amelyekre hivatkozik. [Google PageRank 12]
  • A PR-számítási algoritmus az oldal saját PR-jának megoszlásán alapul, azon oldalak között, amelyekre hivatkozik. Például, ha egy PR8-as oldalon csak egy link található, akkor az az oldal, amelyre hivatkozik, megkapja az összes elérhető PR-t, de ha ezen az oldalon 100 link van, akkor mindegyik csak a rendelkezésre álló PR egy századát kapja meg. . [A PageRank 13 jelentősége]
  • Ennek a PR-számítási algoritmusnak az eredményeként egy PR4-es és 5 külső hivatkozást tartalmazó oldalról származó hivatkozás hatékonyabb, mint egy PR8-as és 100 külső hivatkozást tartalmazó oldal hivatkozása. A linkelő oldalak PR-ja fontos, de ugyanolyan fontos a bennük lévő kimenő linkek száma is, minél több kimenő link, annál kevesebb PR-on megy keresztül. [Google PageRank 12]
  • A PR a bejövő linkeket az oldal fontosságának jelzőjeként használja. A Google az A oldalról B oldalra mutató hivatkozást úgy értelmezi, hogy az A oldal a B oldal mellett szavazott. Nemcsak a szavazatok számát veszi figyelembe, hanem a szavazóoldalak minőségét is. Minél magasabb egy oldal PR-je, annál fontosabb a szavazata. [ Google: technológia 14 ]
  • Nem minden link egyformán hasznos. Minél magasabb a linkelő oldal PR értéke, annál több PR-t közvetít, de figyelembe kell venni, hogy ez a PR egyenlően oszlik meg az összes hivatkozott oldal között. Ezért egy PR4-et tartalmazó oldalról és egyetlen kimenő linkről származó hivatkozás többet eredményezhet, mint egy PR5-öt és 100 kimenő hivatkozást tartalmazó oldal hivatkozása. A jól ismert milliós mesteroldalak tipikus példája, egy ilyen PR7-es és több száz kimenő linket tartalmazó oldal fontossága ellenére jelentéktelen PR-t ad át más oldalaknak. [Google PageRank Explained 11]
  • A PR minden következő szintje sokkal nehezebben érhető el, mint az előző. A PR számítása logaritmikus skálát használ, ami azt jelenti, hogy PR0-ról PR1-re egy lépés szükséges, a PR3-at valamivel nehezebb, a PR4-et még nehezebb, a PR5-öt pedig lényegesen nehezebb. [Google Page Rank GYIK 15]
  • A PR-t nem a webhely egészére, hanem minden egyes oldalra számítják kiés rekurzív módon kapcsolódik a rá hivatkozó oldalak PR-jához. [A Page Rank algoritmus 17]
  • A Google a PR-t kifinomult szöveges keresési technikákkal kombinálja, az oldal és az arra hivatkozó oldalak tartalmának számos aspektusát elemzi, hogy jobb oldalakat találjon, mint a többi, a felhasználó lekérdezésének megfelelő oldalakat. [Mi az a Google PageRank? tizennyolc ]
  • A PR-t folyamatosan újraszámolják, de az eszköztár adatai néhány havonta frissülnek, az új webhelyekhez PR0 van hozzárendelve. [Google PageRank Explained 11]
  • A PR nem csak 0 és 10 közötti egész értékek, hanem valós szám. Helyes, ha a PR-t valós számnak tekintjük, mivel a belső számításokban sok gradációt használunk, nem csak az eszköztáron megjelenő 0-tól 10-ig terjedő értékeket. [Matt Cutts 19]
  • A robot nem elemzi azonnal a webhelyeket. Gyakran két teljes frissítésre van szükség az összes bejövő hivatkozás észleléséhez, számlálásához és bejövő hivatkozásként való megjelenítéséhez. [Google GYIK 20]

1.3 A PageRank értékét befolyásoló tényezők

  • Minden bejövő link számít, kivéve a tiltott oldalak linkjeit. A PR egyfajta szavazórendszer, minden oldalra mutató link egy szavazat az oldalra. A magas PR oldalakat fontosabbnak tekintik, és bizonyos esetekben fontosabbak a szavazatuk, de általában minél több bejövő link, annál jobb. [Google PageRank GYIK 21]
  • Új oldalak hozzáadása csökkentheti a PR-t. Ez a hatás az, hogy az oldal teljes PR-je nő, de egy vagy több régi oldal elveszíti a PR egy részét, ami miatt újak kapják meg, minél több oldal kerül hozzáadásra, annál nagyobb PR-t veszítenek a meglévők. Nagy területeken ez a hatás láthatatlan, de kis helyeken néha megfigyelhető. [PageRank Explained 12]
  • Csökkent PR. Egy oldal PR-je csökkenhet néhány fontos link eltűnése miatt, amelyek PR-t adtak, vagy ha az oldalak PR-ja csökken. [Google PageRank GYIK 22]
  • A címsorok (h1, … , h6) és az erős címkék fontosak, de nem befolyásolják a PR-t. Használjon metacímkéket, címeket és b, erős címkéket, de a tartalom legyen olvasható és hasznos. Ügyeljen a kulcsszavakat körülvevő szövegre, a keresőmotorok egyre jobbak a szemantikában, ezért nagyon fontos a kulcsszavak kontextusa.
  • Nagyon fontos a webhely belső szerkezetének hatékonysága. Az oldalon található oldalakat a lehető legegyszerűbb módon kell linkelni, ideális esetben egyetlen oldal sem lehet három kattintásnál távolabb a főoldaltól. [23]
  • Nagyon fontosak a magas PR-szintű oldalakra mutató linkek. Minél közelebb van az oldalak témája, annál több PR-t közvetít a link. A jó hírű, hasonló témájú oldalakra mutató linkek azt mutatják a keresőmotoroknak, hogy az oldal hasznos a látogatók számára, ez nem mindig igaz a több éve létező, magas Google-rangsorral rendelkező oldalakra. Kizárólag jó minőségű webhelyekre hivatkozva némi előnyre tehet szert a versenytársakkal szemben. [Engedd, hogy a Google algoritmusa mutassa meg a forgalmat 23, GYIK 15]
  • A link szövege számít. Minél pontosabb a link szövege, a Google annál jobban tudja azt a felhasználói lekérdezésekhez kapcsolni.
  • A linkfarmok (linktisztító állomások) büntetést kapnak. A Google a 100-nál kevesebb kimenő linket tartalmazó oldalak iránt érdeklődik, a sok hivatkozást tartalmazó oldalak linkfarmnak minősülnek, és büntetést kapnak. [Google GYIK 24]
  • A népszerű oldalakról bejövő linkek nagyon fontosak. Ha egy oldalra magas PR-oldalak hivatkoznak, akkor a hírnevük egy részét megkapja.
  • Egy oldalt akkor lehet kitiltani, ha tiltott oldalakra hivatkozik. Legyen nagyon óvatos a kimenő linkekkel, ne hivatkozzon gyanús oldalakra (link csalások, tiltott oldalak, stb.), a Google megbüntetheti az oldalát az ilyen hivatkozásokért, mindig ellenőrizze a linkelt oldalak PR-jét. [SiteProNews 25]
  • A csalást PR-büntetéssel büntetikés eltiltást vonhat maga után. Rejtett szöveg, átirányítások, álcázás, automatikus linkcsere és egyéb ellentmondó műveletek A Google minőségi irányelvei 26. A webhelyet a Google kitilthatja.
  • A Google figyelembe veszi a webhely élettartamát, a bejövő linkek relevanciáját és létezésük idejét ha a bejövő link nem releváns, akkor nem generál sok PR-t.
  • Tévhit: Minél magasabb a PR, annál magasabb a pozíció a keresési eredmények között. Természetesen a magas PR-értékkel rendelkező oldalak a keresési eredmények között magasabban helyezkednek el, mint az alacsonyabb PR-értékkel rendelkező versenytársak, de nem szabad elfelejteni, hogy a Google figyelembe veszi a bejövő linkek kontextusát, és csak azokat a linkeket, amelyek kapcsolódnak a lekérdezés előkelő helyet foglalhat el a lekérdezés keresési eredményei között. [