internet pencereler Android

pagerank hesaplama Açıklamalı PageRank

Bir sayfanın PageRank'ini hesaplamak için o sayfaya giden tüm dahili ve harici bağlantıları hesaba katmanız gerekir. Aşağıda A sayfasının PageRank değerini hesaplama denklemi verilmiştir.

PR(A)=(1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

PR(t1…tn)- A sayfasına bağlantı veren sayfanın ağırlığı

C- A sayfasından giden bağlantıların sayısı

d genellikle 0.85 olarak alınan zayıflama katsayısıdır.

Bir sayfa, bağlandığı her sayfada PageRank değerini "oylar". Bir sayfanın oy değeri, o sayfanın kendi PageRank değerinin * 0.85 toplamıdır. Bu değer, giden bağlantıların yönlendirildiği tüm sayfalar arasında eşit olarak dağıtılır.

Denklem, beş giden bağlantıya sahip bir PR4 sayfasından alınan tek bir bağlantının, 100 giden bağlantıya sahip bir PR8 sayfasından gelen bir bağlantıdan daha fazla ağırlık aktaracağını ima eder. Bir sayfada ne kadar çok giden bağlantı varsa, o bağlantıya o kadar az PageRank aktarılır.

Bir sayfa diğer sayfalarda kendi PageRank'ini oylarken, o sayfanın kendi PageRank'inin azalmadığını unutmayın. Oylama sayfası, PageRank değerine katkıda bulunmaz. Her hissedarın sahip olduğu hisse sayısına göre oy kullandığı, ancak bunları başkasına vermediği bir hissedarlar toplantısı gibidir. Ayrıca, aynı sayfaların dolaylı olarak bir miktar PageRank kaybettiğini göreceğiz.

Denklem, herhangi bir sayfanın PageRank değerinin nereden geldiğini açıkça gösterir. Diyelim ki A ve B olmak üzere birbirine bağlanan 2 sayfamız var, bu sayfalarda başka bağlantı yok. İşte olanlar:

Sayfa A için Google PageRank'i Hesaplama

Aşama 1: Sayfa A için PageRank değerini hesaplayın

Sayfa artık yeni PageRank değerine sahip. Hesaplama için B sayfasından giden bağlantının ağırlığı kullanıldı, ancak B sayfasının ayrıca A sayfasına giden bir bağlantısı var ve elde edilen PageRank değeri, B sayfasının PageRank değeri bilinene kadar doğru olamaz.

B Sayfası için Google PageRank'i Hesaplama

Adım 2: B sayfası için PageRank değerini hesaplayın

Sayfa B'nin artık yeni bir PageRank değeri vardır ve bu, Sayfa A'daki PageRank değeri hesaplama için yanlış olduğundan doğru olamaz.

B sayfasının PageRank'ini öğrenene kadar A sayfasının PageRank'ini tam olarak hesaplayamayız ve A sayfasının PageRank'ini bilene kadar B sayfasının tam PageRank'ini hesaplayamayız.

A ve B sayfaları için PageRank değerini tekrar tekrar hesaplamak mümkündür ve her seferinde sonuç bir öncekinden farklı olacak ve hatalı olacaktır. Bir önceki adımda elde edilen değerleri kullanarak hesaplamaları tekrar yapabiliriz. Ancak hesaplamalar için her zaman kesin olmayan değerler kullanırız, bu nedenle sonuçlar her zaman kesin olmaz.

Hesaplamaları defalarca tekrarlayarak sorunun üstesinden gelebilirsiniz. Her seferinde biraz daha doğru sonuçlar alacağız. Aslında, hesaplamalar her zaman kesin olmayan girdilere dayandığından doğruluk hiçbir zaman elde edilemez.

Er ya da geç, daha fazla yinelemenin hesaplamaların sonuçları üzerinde çok az etkisi olacağı bir noktaya ulaşacağız. Bu, Google'daki tüm sayfalar için PageRank değerlerinin yeniden hesaplanmasının neden bu kadar çok zaman ve bilgi işlem kaynağı gerektirdiğini açıklıyor.

Emin olabileceğimiz tek şey, herhangi bir kaynaktan gelen bir bağlantının sitemiz için PageRank'i artırmasıdır.

Bireysel sayfaların PR'sini artırmak için sitedeki dahili bağlantıların indekslenmesini yönetmenin en iyi yolu nedir? Geçerli sayfa A için PR'yi hesaplayan formülü göz önünde bulundurun:

burada d- Referans ağırlığın zayıflama katsayısı, kesin değeri Google tarafından gizlenir, genellikle 0,85 olarak alınır. Sorumuz bağlamında bu önemli değil, çünkü sitede seçilen sayfaların PR'sini diğerlerine göre değerlendirmek istiyoruz;
T 1 ,…, T n - bağlantı veren sayfalar ANCAK;
PR(T 1 ) ,…, PR(T n ) – Yönlendiren sayfaların PR'ı;
C(T 1 ) ,…, C(T n ) - yönlendiren sayfalardaki bağlantıların sayısı.

Özellikler:

  1. Bir sayfa kendisine bir bağlantı içeriyorsa, bu bağlantı hesaplamada dikkate alınmaz.
  2. Kendilerinde bağlantı bulunmayan sayfalara verilen bağlantılar da dikkate alınmaz.
  3. Aynı sayfadan iki veya daha fazla aynı bağlantı bir olarak sayılır.
  4. Google, bazı sitelere bağlantı ağırlığı akışını kötüleştiren ve PR belirleme formülünde bozulmalar getiren filtreler uygulayabilir, bu etkiyi burada dikkate almıyoruz.

Bu formül nasıl kullanılır, çünkü sağ taraf da hesaplanacak sayfaların PR'sini gösterir? İnternette Google tarafından indekslenen tüm sayfaları alalım ve her birinin ilk PR'sini bir olarak alalım, sonra sırayla hepsi için Page Rank'ı hesaplayalım. Bu, her sayfanın bir tür PR değeri aldığı ilk yinelemeydi. Bir önceki adımda elde edilen değerleri PR sayfaları olarak kullanarak bu algoritma ile hesaplamaları birçok kez tekrarlıyoruz. Algoritmanın özelliği, hangi başlangıç ​​PR'sini alırsak alalım ve onu hangi sırayla hesaplarsak hesaplayalım, yeterince büyük sayıda yineleme için aynı sayılara geleceğiz.

Ancak, 0'dan 10'a kadar olan olağan PR tamsayısı, önceki paragrafta elde ettiğimiz şey değildir. PR 0…10 – "Araç Çubuğu" olarak adlandırılan PR ( Araç Çubuğu Sayfa Sıralaması), ağdaki sayfa sayısından bağımsız olarak tüm PR değerlerini mutlak olarak temsil edebilmek için tanıtıldı. İşte burada:

burada taban, Google dizinindeki sayfaların sayısına ve genellikle alınan diğer faktörlere bağlı bir sayıdır. temel 7'ye eşit;
a– azaltma faktörü, 0< a≤ 1, çoğunlukla 1 olarak alınır.

oranlar temel ve a TLPR'nin formülünün yanı sıra şimdi bizim için önemli değil, asıl mesele TLPR'deki bir artışın her zaman PR'deki bir artışla ilişkili olmasıdır, bu yüzden ikincisine odaklanacağız. Diğer kaynaklara dış bağlantıları unutalım ve PR'yi yalnızca dahili faktörlere göre hesaplamaya çalışalım. Diyelim ki altı sayfalı bir web sitemiz var:

Her birinin bir menüsü vardır: "Ana sayfa", "Site hakkında", "Makale listesi". Menü öğelerine sitenin tüm sayfalarında başvurulur. "Makale Listesi" ayrıca makale içeren sayfalara atıfta bulunur. Böyle bir bağlantı dağılımına sahip Sayfa Sıralaması, yukarıdaki şemada belirtilmiştir. PR'yi hesaplarken 100 yineleme yaptım, birini başlangıç ​​değeri olarak aldım ve elde edilen sayıları ondalık noktadan sonra yüzde bire yuvarladım.

Diyelim ki sadece ana sayfayı tanıtmak istiyoruz. PR'sini artırmak için, yalnızca ona giden bağlantıların endekslenmesine izin vermek mantıklı olacaktır. Aynı zamanda, siteden tek bir sayfanın kesilmemesi gerektiğini, yani her sayfaya dizine alınmış bir bağlantının yerleştirilmesi gerektiğini dikkate alıyoruz:

İstenen sayfanın PR'ı yükseldi. Şimdi ondan "Madde 1"e bir link koymaya çalışalım ve dağılımın nasıl değiştiğini görelim:

Ana sayfaya fazladan bir bağlantı yerleştirerek, bağlantı ağırlığını ondan almamız ve böylece onu zayıflatmamız gerektiği anlaşılıyor. Ama aslında, tam tersi ortaya çıkıyor - referans ağırlığı bir artışla geri dönüyor! Bu eylemle aynı anda "Madde 1"i gündeme getiriyoruz.

Şimdi fikrimizi değiştirelim ve yalnızca makale listesini tanıtmaya karar verelim:

Daha önce hesaplananların en yüksek PR'sini elde etmeyi başardık, makale listesi için 2,8'e eşit. Bu örneğin gösterdiği gibi, birçok dahili bağlantıya sahip bir sayfanın PR'sini artırmak, elbette, geri bağlantıların kurulu olması koşuluyla daha kolaydır. Aynı etki, ana maddeden "Madde 1"e bir bağlantı yaptığımızda da gösterildi.

Ve şimdi sitenin mantıksal yapısını bozacağız: ana sayfadan diğerlerine ve tüm sayfalardan ana sayfaya bağlantılar koyacağız. Diğer bağlantılar indekslemeden kapatılacaktır.

  1. Çok sayıda bağlantı içeren sayfaların Sayfa Sıralamasını artırmanın en iyi yolu, geri bağlantı kurmaktır. Bu tür sayfalar forumları, makale listelerini, site haritalarını vb. içerir.
  2. Bir sayfanın PR'ı, sayfa 1'deki sayfalardan bir bağlantı koyarsanız, Page Rank biriktirirse harika yükselir.
  3. Ana sayfanın PR'ını artırmak için, tam metinli sayfalara yönlendiren makale, haber vb. duyuruları yerleştirmek faydalı olacaktır. Yine, geri bağlantıları unutmayın.

Ve işte size PR hesaplamasında yardımcı olacak bir senaryo. Sitedeki bağlantıları dizine eklemek için farklı seçeneklerle denemeler yapın.

    // site sayfaları dizisi: her sayfanın dizisindeki ilk öğe adıdır,

    // diğer tüm öğeler, dizideki geçerli öğeden bağlanan sayfaların dizinleridir

    $sayfalar = dizi

    dizi( "Ana Sayfa", 1 , 2 ) ,

    dizi ("Site hakkında" , 0 , 2 ),

    dizi ("Makalelerin listesi" , 0 , 1 , 3 , 4 , 5 ),

    dizi("Öğe 1" , 0 , 1 , 2 ),

    dizi("Öğe 2" , 0 , 1 , 2 ),

    dizi("Öğe 3" , 0 , 1 , 2 )

    // sayfaların başlangıç ​​değerini ayarla PR = 1

    için ($i = 0 ; $i< count ($pages ) ; $i ++ ) $pr [ $i ] = 1 ;

    // yineleme sayısı = 100

    için ($i = 0 ; $i< 100 ; $i ++ )

    için ($j = 0 ; $j< count ($pages ) ; $j ++ )

    $ekle = 0 ; // dış bağlantılardan büyüme

    için ($k = 0 ; $k< count ($pages ) ; $k ++ )

    eğer ($k == $j ) devam ederse ;

Meslektaşlarım, nihayet dikkatinize Netpeak Spider'ın devrim niteliğindeki bir işlevini sunmaya hazırız - dahili PageRank hesaplaması! Eski hesaplama mekanizmasından geriye hiçbir şey kalmamıştı ve yenisini tanıtmak için program içindeki tarama algoritmasını kökten değiştiren önceki sürümü yürütmek zorunda kaldık. Yeni dahili PageRank hesaplama aracının arayüzünden doğrudan dönebileceğiniz bu son talimatı sizin için hazırladık.

PageRank nedir?

Sayfa Sıralaması aşağıdaki formülle hesaplanan sayfanın göreli ağırlığıdır:

PR(A) = (1 - d) / N + d * (PR(B) / L(B) + PR(C) / L(C) + ...)

  • N hesaplamaya dahil olan toplam aktif düğüm (sayfa) sayısıdır;
  • d– zayıflama faktörü (tipik olarak 0,85 kullanılır);
  • L- giden bağlantıların sayısı.

Genellikle sıfır (0) yinelemede her sayfanın PageRank'inin aynı olduğu ve 1 / N'ye eşit olduğu kabul edilir. Sonraki yinelemelerde, önceki yinelemenin ağırlığının bölündüğü tüm gelen bağlantıların ağırlığı kullanılır. giden bağlantıların sayısı (formülde - L).

Özellikle sizin için algoritmanın işleyişini açıkça gösteren birkaç tablo hazırladık:

Google bu parametreyi İnternet'teki her sayfa için hesaplarken, Netpeak Spider hesaplamanıza izin verir. dahili PageRank , taranan site veya URL listesiyle sınırlıdır.

Neden Dahili PageRank'i Hesapla

Bu özellik, en azından projeniz hakkında gerçek bilgiler edinmenizi sağladığı için devrim niteliğindedir:

1. Bağlantı suyunun site genelinde nasıl dağıtıldığını ve nerede yoğunlaştığını tam olarak anlayın.

2. Arama motoru tanıtımı için önemli olmayan hangi sayfaların fazla kilo aldığını belirleyin.

3. Hangi sayfaların "sarkan düğümler" olduğunu ve sadece gelen bağlantı suyunu "yaktığını" bilin.

Harici bağlantıların sitenize yol açtığını varsayarsak, daha etkili bir dahili bağlantı şeması uygulayarak SEO bütçesinden ne kadar tasarruf edilebileceğini hayal edin.

Dahili PageRank Nasıl Hesaplanır

Netpeak Spider, dahili PageRank'i hesaplamak için 2 yol sunar:

1. Otomatik

"Parametreler" sekmesindeki tarama ayarlarında "Dahili PageRank" özel parametresini seçmeniz yeterlidir; tarama işlemi duraklatıldığında veya başarıyla tamamlandıktan sonra otomatik olarak hesaplanacaktır.

Lütfen bu göstergeyi hesaplamak için “Giden bağlantılar” parametresini etkinleştirmeniz gerektiğini unutmayın, çünkü geri bağlantılar elde etmenin temeli giden bağlantılar olup, bunlar olmadan dahili PageRank hesaplanamaz.

2. Manuel (ayrı bir araç kullanarak)

Özel bir aracı çağırmak için "Araçlar" → "Dahili PageRank Hesaplaması" menüsüne gidin.

Burada aşağıdaki blokları göreceksiniz:

2.1. Otomatik hesaplama yöntemi için de kullanılan ayarlar:

  • yineleme sayısı [5'ten 50'ye kadar]→ daha fazla sayıda yineleme, daha yüksek hesaplama doğruluğu sağlar, ancak gözlemlerimize göre, yaklaşık 15 yineleme en uygun değerdir ve istenen sonucu hızla almanıza olanak tanır, bu nedenle Netpeak Spider'da varsayılan olarak 15 yineleme ayarlanır;
  • sadece dahili bağlantılar→ tüm harici giden bağlantıların hesaplamalar üzerindeki etkisini devre dışı bırakmanıza izin veren bir ayar;
  • yalnızca [Tüm sonuçlar] / [Filtreler] sekmesindeki bağlantılar→ hesaplamaları yalnızca ilgili sekmelerdeki bağlantılarla sınırlandırmanıza izin veren bir ayar: PageRank'i yalnızca analiz edilen sitenin belirli bir kategorisinde hesaplamanız gereken durumlarda [Filtreler]'i kullanın;
  • sonuç görüntüleme modu→ "Gerçek" tam PageRank değerlerini gösterir, ancak çok sayıda sayfası olan siteler için uygun olmayabilir; "Uyarlanabilir" mod, aynı verileri görmenizi sağlar, ancak özel bir katsayı ile çarpılarak büyük sitelerle rahatça çalışmanıza olanak tanır.

Lütfen "yalnızca dahili bağlantılar" ve "[Tüm sonuçlar] / [Filtreler] sekmesindeki yalnızca bağlantılar" onay kutularının işaretini kaldırırsanız, Netpeak Spider'ın hesaplamalar sırasında taranan tüm sayfalardan tüm giden bağlantıları indirmeye ve analiz etmeye başlayacağını unutmayın. Bu durumda, raporda "Taranmadı" (taranmadı) durum koduna sahip bağlantılar görünebilir - bu, gerçek giden bağlantılara dayalı olarak dahili PageRank'i mümkün olduğunca doğru hesaplamak için gereklidir.

2.2. Dahili PageRank'in hesaplandığı formül ve yukarıdaki N, d parametreleri ve bu makaleye bir bağlantı.

2.3. Yoksayılan URL Listesi: PageRank analizinden tamamen hariç tutmak için bu listeye bir bağlantı ekleyebilirsiniz. Bu işlev, doğrudan programda dahili bağlantıyı değiştirerek hesaplamalarla çok esnek bir şekilde çalışmanıza olanak tanır.

Hariç tutulanın belirli bir sayfadaki tek bir bağlantı değil, tüm düğüm olduğunu unutmayın: tüm siteden bu sayfaya tek bir bağlantı (gelen bağlantılar) olmadığını ve bu sayfadan diğerine tek bir bağlantı olmadığını hayal edin. sitenin sayfaları (giden bağlantılar).

2.4. Verileri tablodan dosyaya CSV/Excel formatında dışa aktarın.

2.5. Aşağıdaki sütunları içeren sonuç tablosu:

  • engellemek "Sayfalar"→ seri numarası (#) ve sayfaya bağlantı;
  • engellemek "Yinelemeler"→ hesaplamaları başlattıktan sonra, her yineleme için verileri içeren ilgili sütunlar burada görünecektir;
  • engellemek "İlişkiler"→ bu, farenin sol tuşuna çift tıklanarak veya bağlam menüsü çağrılarak açılabilen giden ve gelen bağlantıların sayısını gösterir: bu raporların kullanışlı bir görünümü, özellikle sizin için daha derine inme ve geri dönme yeteneği ile geliştirilmiştir. bağlantı grafiğine tam erişim sağlayan olağan "Geri" / "İleri" düğmeleri;
  • engellemek "Algoritmik analiz"→ burada, özellikle PageRank algoritması kullanılarak belirlenen toplanan parametreler, yani "Bağlantı durumu" (bu parametre hakkında daha fazla bilgi aşağıdadır) ve "Son bağlantı" - algoritmanın bir sonucu olarak bir yönlendirmenin bulunduğu durumlarda gösterilir;
  • engellemek "Ana parametreler"→ sunucu yanıt kodunu ve ilgili sayfaların içerik türünü görmenizi sağlar;
  • engellemek "Dizin Oluşturma Seçenekleri"→ sitedeki bağlantı ağırlığının dağılımını kritik olarak etkileyen parametreleri birleştirir: Robots.txt, Canonical, X-Robots-Tag, Meta Robots'tan gelen talimatlar, ayrıca yönlendirmenin nihai URL'si ve varsa Refresh etiketi sayfada.

Tablonun alt kısmında, "Tüm PageRanklerin Toplamı" hesaplanır → her yinelemede toplam, 1'e ("Gerçek" modda) veya uygun güce 10'a ("Uyarlamalı" modda) eşit olmalıdır. Toplam belirtilen değerlerden farklıysa, analiz edilen site, bağlantı suyunu kaybettiğiniz sarkan düğümlere sahiptir.

2.6. Sonuç tablosuyla birlikte algoritmanın tüm adımlarını gösteren durum paneli, kullanıcıların hesaplamaların dinamiklerini görmelerini sağlar.

"Dahili PageRank Hesaplama" aracından çıkarken, son yinelemenin verileri otomatik olarak programın ana tablosuna ilgili sütuna yerleştirilecektir. Bundan önce ana tabloda zaten bazı veriler varsa, daha yeni olanlar bunların üzerine yazılacaktır.

Hesaplama algoritması

Bir kez daha, dahili PageRank'i hesaplamak için, sayfalar arasındaki tüm ilişkileri kapsayan ve temel dizin oluşturma talimatlarını, bağlantı niteliklerini ve bağlantı ağırlığı yönlendirme seçeneklerini dikkate almanıza olanak tanıyan Giden Bağlantılar parametresini etkinleştirmeniz gerekir.

Tüm süreç 2 ardışık adımdan oluşur:

1. Bir bağlantı grafiği oluşturma → bu aşamanın amacı, bağlantıların ilişkisini kurmak ve durumlarını belirlemektir:

1.2. İlk analiz → bağlantıları Tamam, Asılı Düğüm ve Yeniden Yönlendirme durumlarına bölme (bağlantı durumları hakkında daha fazlasını aşağıda okuyun).

1.4. Gelen bağlantıları sayma.

1.5. Son analiz → giden ve gelen bağlantıların ayrıntılı analizinin yanı sıra "Bitiş Bağlantıları" tanımı ve "İlişkisiz düğüm" durumundaki bağlantılar.

2. Dahili PageRank Hesaplaması → yineleme 0'dan başlayarak ayarlarda belirtilene kadar.

Bağlantı durumları

PageRank algoritmasının en ilginç yanı, tüm bağlantıların mantıksal olarak 4 duruma bölünmesidir:

1. Tamam

Bunlar, sunucu yanıt kodu "200 OK" olan ve giden bağlantılar içeren HTML sayfalarıdır ve şunlar olabilir:

  • noindex, yani dizine eklenmemiş → evet, size öyle gelmedi: dizine eklenmemiş sayfalar da bağlantı ağırlığı taşır
  • Canonical etiketiyle kendini gösterdi
  • Yenile etiketi kendini işaret ederek

2. Asılı düğüm

0 giden bağlantıya sahip sayfalar, yani bu sayfalar bağlantı suyunu geçmez, tamamen kaybeder.

Bu tür şunları içerir:

  • Giden bağlantılar içermeyen 2xx sayfaları
  • Robots.txt'de 2xx sayfa kapatıldı
  • X-Robots-Tag veya Meta Robots talimatlarında 2xx nofollow sayfası
  • 2xx sayfaları, ancak HTML değil ve dolayısıyla giden bağlantı yok
  • Robots.txt'de 3xx bağlantı kapatıldı
  • Sonsuz yönlendirmeli 3xx bağlantıları (durum kodu "3xx Yönlendirme Döngüsü")
  • 4xx sayfa
  • 5xx sayfa
  • başka bir sunucu yanıt kodunu döndüren sayfalar
  • hedef sayfaya ulaşmayan yeniden yönlendirme sayfaları (Kanonik veya Yenileme): bu durumda, "Sonsuz Yönlendirildi" durum kodu görüntülenir, yani sonsuz bir yönlendirme
  • “Tüm sonuçlar” tablosunda olmayan giden bağlantılar → varsayılan olarak, “yalnızca dahili bağlantılar” ve “yalnızca [Tüm sonuçlar] / [Filtreler] sekmesindeki bağlantılar” onay kutuları devre dışı bırakıldığında, Netpeak Spider'ın bulmaya çalışacağını unutmayın. tarama ayarlarından bağımsız olarak sitede bulunan tüm bağlantılar - bu, bağlantı ağırlığı aktarımının tam ve doğru bir resmini elde etmek için gereklidir

3. Yönlendirme

Bu tür şunları içerir:

  • 3xx sayfa
  • Canonical etiketine sahip 2xx sayfa başka bir sayfaya işaret ediyor
  • Yenile etiketi başka bir sayfayı işaret eden 2xx sayfa

4. İlişkisiz düğüm

Gelen bağlantıları olmayan bağlantılar.

  • Dizin oluşturma talimatları devre dışı bırakılmış bir siteyi tarama (Robots.txt, Canonical, Refresh, X-Robots-Tag, Meta Robots ve bağlantılardaki nofollow özelliği) → bu talimatlar devre dışı bırakıldığında Netpeak Spider'ın siteyi bundan farklı şekilde taradığını unutmayın arama motoru robotları tarafından yapılır, ancak PageRank algoritması her zaman bu talimatlara göre çalışır, bu nedenle tarama sonucunda elde edilen bazı bağlantılara PageRank algoritması için ulaşılamayabilir.
  • kendi URL listenizi tarama → hiçbir şekilde ilgili olmayan bağlantılar.

3 yeni hata

Dahili PageRank'in otomatik veya manuel olarak hesaplanmasından hemen sonra, sitede varsa, programın ana arayüzüne 3 tür hata girecektir:

  • PageRank: sallanmak→ yukarıda belirtildiği gibi, bunlar, bağlantı ağırlığını geçmeyen, dolayısıyla bağlantı ağırlığının sitedeki doğal dağılımını ihlal eden, giden bağlantıları olmayan sayfalardır;
  • PageRank: yönlendirme→ Bağlantı suyunu yeniden yönlendiren sayfalar - bunlar, bir 3xx yönlendirmesi döndüren veya farklı bir URL'ye işaret eden Kurallı / Yenileme etiketleri içeren sayfalar olabilir.
  • PageRank: eksik bağlantılar→ bunlar, gelen bağlantıların bulunmadığı erişilemeyen sayfalardır.

Kısaca ana hakkında

Meslektaşlarım, analiz edilen site hakkında bir dizi içgörü bulmanızı sağlayan dahili PageRank'i hesaplamak için en doğru algoritmayı uygulamayı başardık: bağlantı ağırlığının sayfalara tam olarak nasıl dağıldığı, SEO için gereksiz olan sayfalar nasıl alınır? sitede hangi “sarkan düğümlerin” bulunduğu ve son olarak bu hataların nasıl düzeltileceği.

Yeni bir benzersiz özelliği deneyin, farklı ayarlarla denemeler yapın ve yeni ve daha verimli dahili bağlantı şemaları uygulayın! :)

PageRank, kaynağınızın İnternet'teki popülaritesini önemli ölçüde etkileyen ve alabileceğiniz potansiyel geliri (örneğin, sitenizin sayfalarındaki bağlantıları satarak) önemli ölçüde etkileyen sitenin ana dış göstergelerinden biridir.
Bu yazımda Google'dan PageRank ile ilgili tüm noktaları detaylıca anlatmak istiyorum.

PageRank nedir ve ne işe yarar?
Bildiğiniz gibi PageRank, bir web sitesi sayfasının, Google arama motorunun kullandığı, İnternet'teki diğer tüm sayfalar arasındaki göreli otoritesinin sayısal bir göstergesidir. PageRank, bir bilim insanının bilimsel çevrelerdeki güvenilirliğini, diğer bilim adamlarından kim ve ne sıklıkta bu bilim insanının çalışmalarına atıfta bulunarak hesaplama ilkesine dayanmaktadır.
PageRank Özellikleri:
- gösterge bir bütün olarak kaynağa değil, sitenin ayrı bir sayfasına atanır (kural olarak, ana sayfa, en fazla sayıda bağlantıdan bu yana en yüksek PageRank seviyesine sahiptir);
- sayfadan çıkan bağlantı, bu sayfanın PageRank'ini (statik ağırlık) düşürmez;
- PageRank seviyesi sayfanın alaka düzeyini etkilemez yani daha fazla ağırlığa sahip olduğu için arama sorgularında ilk sıralara çıkamaz. Bir dereceye kadar, bu kesinlikle konumu etkiler, ancak Google, arama sorgusunu karşılayan sayfanın kaliteli içeriğine öncelik verir.

PageRank ne için? Sonuçta, alaka düzeyini etkilemez.
Web yöneticileri, kaynaklarına bağlantı yerleştirme maliyetini artırmak için buna ihtiyaç duyar. PR = 0 olan bir sayfadaki (ana değil) bir bağlantının fiyatı maksimum 10 sente mal oluyorsa, PR = 4 ile çok daha pahalıya mal olur.
Ayrıca, yüksek bir PageRank seviyesi, sayfanın otoritesini, Google arama motoru tarafından tam olarak algılandığını gösterir. Bu tür sayfaların kombinasyonu, Google'ın kaynak hakkında tematik bir görüş oluşturmasını sağlar. Söylemeyeceğim, ancak Google'ın genellikle istenen belirli bilgileri bulamadığını ve benzer tematik kaynaklara cevaplar verdiğini ve buna göre PageRank seviyesine göre sıraladığını düşünüyorum. Sanki kullanıcıya ilgi duyduğu bilgileri nerede bulabileceğini soruyormuş gibi.

PageRank nasıl hesaplanır?
Bir sayfa için PageRank'i hesaplamak için, bu sayfaya giden tüm dahili ve harici bağlantıları hesaba katmanız gerekir:
- sayfaya ne kadar çok harici bağlantı olursa, bu sayfaya o kadar fazla PageRank ağırlığı aktarılır;
- sayfada ne kadar çok dahili bağlantı varsa (diğer kaynaklara harici bağlantılar dahil), her bağlantıya o kadar fazla PageRank ağırlığı eşit olarak dağıtılır. Böylece tüm linkler aynı ağırlığı alacaktır.

Buna dayanarak, PageRank'in tüm sayfalara, ancak hemen değil, bir zincir halinde aktarılması için sitenin dahili bir bağlantısını oluşturmalısınız. Ve zincir ne kadar uzunsa, içindeki sayfalar o kadar fazla ağırlık alır (bağlara rel=nofollow niteliğini ekleyerek PageRank'in bağlantılara aktarımını devre dışı bırakabilirsiniz).

Bir sayfanın PageRank değerini hesaplamak için aşağıdaki denklem kullanılabilir:

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + PR(tn)/C(tn))

PR() - Sayfanın sayısal bir sayı olarak PageRank'i (kayan noktalı sayı);
A - bizim belirlediğimiz sayfa PageRank;
t1...tn - A sayfasına bağlantı veren sayfa;
C - A sayfasından giden bağlantıların sayısı;
d, genellikle 0.85 olarak alınan sönümleme faktörüdür.

Sayfa, bağlandığı tüm sayfalara PageRank değerini iletir. Bu durumda PageRank değeri, sayfanın kendi PageRank değerinin 0.85 ile çarpımı olarak hesaplanır. Daha sonra bu değer, başvurduğu tüm sayfalara eşit olarak dağıtılır.

Tablonun yardımıyla, sayfamızın belirli sayıda bağlantıyla ne kadar PageRank alacağını yaklaşık olarak hesaplayabiliriz:

Bağlantı sayısı: Bizim sayfamıza bağlantı veren sayfaların PageRank'i:
0 1 2 3 4 5 6 7 8 9 10
1 0 0 0 +1 +2 +3 +4 +5 +6 +7 +8
4 0 0 +1 +2 +3 +4 +5 +6 +7 +8 +9
19 0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10
101 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 -
555 +2 +3 +4 +5 +6 +7 +8 +9 +10 - -
3 055 +3 +4 +5 +6 +7 +8 +9 +10 - - -
16 803 +4 +5 +6 +7 +8 +9 +10 - - - -
92 414 +5 +6 +7 +8 +9 +10 - - - - -
508 277 +6 +7 +8 +9 +10 - - - - - -
2 795 522 +6 +7 +8 +9 +10 - - - - - -
15 375 379 +7 +8 +9 +10 - - - - - - -
84 564 584 +8 +9 +10 - - - - - - - -
449 527 525 +9 +10 - - - - - - - - -

PR sayfalarının değerini şuradan kontrol edebilirsiniz:

Herkes kullanıyor, ancak çok az kişi nasıl çalıştığını biliyor. Google PageRank, web geliştiricileri için en önemli parametrelerden biridir.

Her gün oluşturulan milyarlarca mevcut ve milyonlarca sayfa arasında arama yapmak, hayal edebileceğinizden daha zordur. PageRank, Google'ın arama kalitesini iyileştirmek için kullandığı yüzlerce faktörden yalnızca biridir. Ancak nasıl çalışır ve hangi faktörler onu etkiler ve ne yapmaz ve PageRank hakkında ne biliyoruz?

Bu yazıda sadece gerçekleri sunuyoruz.

Geçen hafta boyunca, bize gerçekçi görünen birçok gerçek ve varsayıma baktık. Ayrıca, arama ve 16 faydalı PageRank aracı hakkında bazı akademik araştırmalar derledik.

En önemli gerçekler, makalenin başında kısaca açıklanmıştır.

PageRank nasıl çalışır?

  1. Sayfa Sıralaması Google tarafından kullanılan birçok yöntemden biri sayfanın alaka düzeyini ve önemini belirlemek için.
  2. Google, A sayfasından B sayfasına bir bağlantıyı şu şekilde yorumlar: ses A'nın B lehine, elbette sadece oy sayısı değil, aynı zamanda oylama sayfalarının kalitesi de dikkate alınır.
  3. Sayfa Sıralaması gelen bağlantıların sayısına göre, ancak sadece üzerinde değil, alaka düzeyi ve kalite de önemlidir.
  4. Tüm bağlantılar PageRank'e eşit olarak katkıda bulunmaz.
  5. PR8'li bir sayfada yalnızca bir bağlantı varsa, bağlantı verdiği site iletebileceği tüm PR'ları alacaktır, ancak 100 bağlantı varsa, her bağlantı bu PR'nin yalnızca bir kısmını iletecektir.
  6. Kötü gelen bağlantılar PR'ı etkilemez.
  7. PR, sitenin ömrünü, gelen bağlantıların alaka düzeyini ve varlık zamanlarını dikkate alır.
  8. PR hesaplanırken içerik dikkate alınmaz.
  9. PR, sitenin tamamı için değil, her sayfa için ayrı ayrı hesaplanır.
  10. Yasaklı sitelerden gelen bağlantılar hariç, her gelen bağlantı önemlidir.
  11. PR sadece 0'dan 10'a kadar tamsayı değerleri değil, gerçek bir sayıdır.
  12. Her bir sonraki PR seviyesine ulaşmak giderek daha zor hale geliyor, muhtemelen logaritmik bir ölçek kullanılıyor.
  13. PR sürekli olarak yeniden hesaplanır, ancak araç çubuğu verileri birkaç ayda bir güncellenir.
  14. Google, aynı zamanda sağlam ve alakalı sayfaları bulmaya çalışır.

PageRank'i Etkileyen Faktörler

  1. Sık site güncellemeleri PR'yi otomatik olarak artırmaz.
  2. Yüksek PR, arama sonuçlarında yüksek konumları garanti etmez.
  3. DMOZ ve Yahoo! PR'yi otomatik olarak artırmaz.
  4. .edu ve .gov siteleri PR'yi otomatik olarak artırmaz.
  5. Dahili sayfaların mutlaka ana sayfadan daha düşük bir PR'si yoktur.
  6. Wikipedia'dan gelen bağlantılar PR'yi otomatik olarak artırmaz.
  7. Nofollow özniteliğine sahip bağlantılar PR'ı etkilemez.
  8. Etkili iç bağlantılar PR'ı etkiler.
  9. Tematik sitelerden gelen bağlantılar daha güçlü bir etkiye sahiptir.
  10. Bir bağlantıda kullanılan metin, genellikle bağlantı veren sayfanın PR'sinden daha önemli olabilir.
  11. Yüksek kaliteli tematik sitelere giden ve gelen bağlantılar PR üzerinde olumlu bir etkiye sahiptir.
  12. Bir sayfadan birkaç özdeş bağlantı tek olarak kabul edilir.
  13. Site, yasaklı sitelere bağlantılar için yasaklanabilir.

1.1 PageRank nedir?

  • Halkla İlişkiler, Google tarafından kullanılan yöntemlerden yalnızca biridir. sayfanın alaka düzeyini ve önemini belirlemek için. [PageRank Doğru Açıklandı 6 ]
  • Google, sayfaları sıralamak için birçok faktör kullanır, PageRank en iyilerinden biridir. PR iki önemli noktayı yansıtır, belirli bir sayfaya kaç sayfanın bağlandığını ve hangi sayfaların bu sayfaya bağlandığını. www.cnn.com 7 veya www.nytimes.com 8 gibi sitelerden alınan beş ila altı bağlantı, daha az yerleşik sitelerden gelen çok sayıda bağlantıdan daha faydalı olabilir. [ Google Kütüphaneci Merkezi 9 ]
  • PR yalnızca bir sayfanın yaklaşık kalitesini yansıtabilir, ancak yalnızca bağlantıların bağlamı ve anahtar kelime yoğunluğu, sayfa başlığı vb. faktörler dikkate alınarak belirlenebilen güncel alaka düzeyi ile ilgisi yoktur. [PageRank: Bir Deneme 10 ]

1.2 PageRank nasıl çalışır?

  • Google'ın PR'ı nasıl hesapladığını kimse tam olarak bilmiyor.[Google PageRank Açıklaması 11]
  • PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). PR'yi hesaplamak için yaklaşık formül böyle görünür, burada A'ya bağlanan t1-tn sayfalar, C(tn) karşılık gelen sayfaya giden bağlantıların sayısıdır, d katsayısı genellikle 0.85'e eşittir.
  • PR'nin PR = 0.15 + 0.85 * formülüyle hesaplandığını varsayabiliriz (bizim tarafımızdan iletilen her bağlantı sayfasının PR kısmı). Bir sayfanın başkalarına oy vermek için kullanabileceği PR miktarı, kendi PR'sinden biraz daha azdır, tam olarak 0.85 * PR ve bağlantı verdiği sayfalar arasında bölünür. [Google'ın PageRank 12)
  • PR hesaplama algoritması, sayfanın kendi PR'sinin bağlantı verdiği sayfalar arasındaki dağılımına dayanır. Örneğin, PR8'li bir sayfada yalnızca bir bağlantı varsa, bağlantı verdiği sayfa mevcut tüm PR'yi alacaktır, ancak bu sayfada 100 bağlantı varsa, her biri mevcut PR'nin yalnızca yüzde birini alacaktır. . [PageRank 13'ün Önemi]
  • Bu PR hesaplama algoritması sonucunda PR4 ve 5 harici link içeren bir sayfadan gelen link, PR8 ve 100 harici link içeren bir sayfadan gelen linkten daha etkilidir. Bağlantı veren sayfaların PR'ı önemlidir, ancak içerdikleri giden bağlantıların sayısı kadar önemli olan, ne kadar çok giden bağlantı o kadar az PR üzerinden geçer. [Google'ın PageRank 12)
  • PR, gelen bağlantıları sayfanın öneminin bir göstergesi olarak kullanır. Google, A sayfasından B sayfasına giden bir bağlantıyı A sayfasının B sayfasının oyu olarak yorumlar. Yalnızca oy sayısı değil, oylama sayfalarının kalitesi de dikkate alınır. Bir sayfanın PR'ı ne kadar yüksekse, oyu o kadar önemlidir. [ Google: Teknoloji 14 ]
  • Tüm bağlantılar eşit derecede yararlı değildir. Bağlantı veren sayfanın PR'ı ne kadar yüksekse, o kadar fazla PR iletir, ancak bu PR'nin bağlandığı tüm sayfalar arasında eşit olarak paylaşıldığını hesaba katmanız gerekir. Bu nedenle, PR4 ve tek bir giden bağlantı içeren bir sayfadan gelen bir bağlantı, PR5 ve 100 giden bağlantı içeren bir sayfadan gelen bir bağlantıdan daha fazlasını verebilir. Milyon dolarlık iyi bilinen ana sayfaların tipik bir örneği, PR7 ve yüzlerce giden bağlantı içeren bir sayfa, önemine rağmen önemsiz PR'yi diğer sayfalara geçirir. [Google PageRank Açıklaması 11]
  • Her bir sonraki PR seviyesi, bir öncekinden çok daha zor elde edilir. PR'nin hesaplanması logaritmik bir ölçek kullanır, yani PR0'dan PR1'e gitmek bir adım alır, PR3'ü puanlamak biraz daha zordur, PR4 daha da zordur ve PR5 önemli ölçüde daha zordur. [Google Sayfa Sıralaması SSS 15]
  • PR bir bütün olarak site için değil, her bir sayfa için hesaplanır ve kendisine bağlanan sayfaların PR'ına yinelemeli olarak bağlanır. [Page Rank algoritması 17 ]
  • Google, Halkla İlişkileri gelişmiş metin arama teknikleriyle birleştirir, sayfanın içeriğinin birçok yönü ve ona bağlanan sayfalar, kullanıcının sorgusuna uyan diğerlerinden daha iyi sayfalar bulmak için analiz edilir. [Google PageRank Nedir? on sekiz ]
  • PR sürekli olarak yeniden hesaplanır, ancak araç çubuğu verileri birkaç ayda bir güncellenir, yeni sitelere PR0 atanır. [Google PageRank Açıklaması 11]
  • PR sadece 0'dan 10'a kadar tam sayı değerler değildir, PR gerçek bir sayıdır. PR'yi gerçek bir sayı olarak düşünmek doğrudur, çünkü dahili hesaplamalarda sadece araç çubuğunda görüntülenen 0'dan 10'a kadar olan değerleri değil, birçok derecelendirme kullanırız. [Mat Kesikler 19]
  • Robot siteleri anında analiz etmez. Tüm gelen bağlantıların algılanması, sayılması ve gelen bağlantılar olarak görüntülenmesi için genellikle iki tam güncelleme gerekir. [Google SSS 20]

1.3 PageRank'i Etkileyen Faktörler

  • Yasaklı sitelerden gelen bağlantılar hariç, her gelen bağlantı önemlidir. PR bir tür oylama sistemidir, bir sayfaya verilen her bağlantı, kendi lehine bir oylamadır. Yüksek PR sayfaları daha önemli olarak kabul edilir ve bazı durumlarda oyları daha önemlidir, ancak genellikle daha fazla gelen bağlantı daha iyidir. [Google PageRank SSS 21]
  • Yeni sayfalar eklemek PR'yi azaltabilir. Bu etki, sitenin toplam PR'sinin artmasıdır, ancak bir veya daha fazla eski sayfa PR'nin bir kısmını kaybeder, hangi yenileri alırsa, ne kadar çok sayfa eklenirse, mevcut olanlar o kadar fazla PR kaybeder. Büyük sitelerde bu etki görünmez, ancak küçük sitelerde bazen gözlemlenebilir. [PageRank Açıklaması 12 ]
  • Azaltılmış PR. Bir sayfanın PR'si, ona PR veren bazı önemli bağlantıların kaybolması veya ona bağlanan sayfaların PR'sinde bir düşüş nedeniyle düşebilir. [Google PageRank SSS 22]
  • Başlıklar (h1, … , h6) ve güçlü etiketler önemlidir ancak PR'ı etkilemez. Meta etiketleri, başlıkları ve b, güçlü etiketleri kullanın, ancak içeriği okunabilir ve kullanışlı tutun. Anahtar kelimeleri çevreleyen metne dikkat edin, arama motorları anlambilimde daha iyi hale geliyor, bu nedenle anahtar kelimelerin bağlamı çok önemlidir.
  • Büyük önem taşıyan, sitenin iç yapısının etkinliğidir. Sitedeki sayfalara mümkün olan en basit şekilde bağlantı verilmeli, ideal olarak ana sayfadan üç tıklamadan daha uzakta hiçbir sayfa olmamalıdır. [ 23 ]
  • Yüksek PR ile ilgili sitelerden gelen ve bu sitelere verilen bağlantılar çok önemlidir. Sayfaların teması ne kadar yakınsa, bağlantı o kadar fazla PR iletir. Benzer konulara sahip saygın sitelere bağlantılar, arama motorlarına sitenin ziyaretçiler için yararlı olduğunu gösterir, bu, birkaç yıldır var olan ve Google sıralamasında yüksek olan siteler için her zaman doğru değildir. Yalnızca yüksek kaliteli sitelere atıfta bulunarak, rakiplerinize göre bir miktar avantaj elde edebilirsiniz. [Google'ın Algoritması Trafiği Size Göstersin 23 , SSS 15 ]
  • Bağlantı metni önemlidir. Bağlantı metni ne kadar spesifik olursa, Google onu kullanıcı sorgularıyla o kadar iyi ilişkilendirebilir.
  • Bağlantı çiftlikleri (bağlantı temizleme istasyonları) cezalandırılır. Google, 100'den az giden bağlantı içeren sayfalarla ilgilenir, çok sayıda bağlantı içeren sayfalar bağlantı çiftlikleri olarak kabul edilir ve cezalandırılır. [Google SSS 24]
  • Popüler sitelerden gelen linkler çok önemlidir. Bir sayfaya yüksek PR sayfaları tarafından bağlanırsa, itibarlarının bir kısmını alır.
  • Bir site, yasaklı sitelere bağlantı veriyorsa yasaklanabilir. Giden bağlantılara çok dikkat edin, şüpheli sitelere bağlantı vermeyin (bağlantı dolandırıcılığı, yasaklı siteler vb.), Google bu tür bağlantılar için sitenizi cezalandırabilir, her zaman bağlantı verdiğiniz sitelerin PR'larını kontrol edin. [SiteProNews 25]
  • Dolandırıcılık, halkla ilişkiler cezası ile cezalandırılabilir ve yasakla sonuçlanabilir. Gizli metin, yönlendirmeler, gizleme, otomatik bağlantı değişimi ve birbiriyle çelişen diğer eylemler Google'ın kalite yönergeleri 26, bir sitenin Google tarafından yasaklanmasına neden olabilir.
  • Google, sitenin ömrünü, gelen bağlantıların alaka düzeyini ve varlık zamanlarını dikkate alır. gelen bağlantı alakalı değilse çok fazla PR oluşturmaz.
  • Efsane: PR ne kadar yüksek olursa, arama sonuçlarındaki konum o kadar yüksek olur. Elbette, arama sonuçlarında PR değeri yüksek olan sayfalar, daha düşük PR değerine sahip rakiplerden daha yüksekte yer alır, ancak Google'ın gelen bağlantıların bağlamını ve yalnızca kelimelerle ilgili bağlantıları dikkate aldığını unutmamalıyız. sorgu, bu sorgu için arama sonuçlarında üst sıralarda yer alabilir. [