Metode corecte pentru eliminarea foilor de pagini. Cum să scapi de paginile postului potrivit cu paginile duplicate

Motivul pentru scrierea acestui articol a fost următorul apel al unui contabil cu o panică înainte de a renunța la rapoartele privind TVA. Ultimul trimestru a cheltuit mult timp curățând contrapartidele duble. Și din nou, aceleași și cele noi. Unde?

Am decis să-mi petrec timpul și să mă ocup de cauza, nu o consecință. Situația este în principal relevantă cu descărcarea automată personalizată prin planurile de schimb din programul de control (în cazul lui UT 10.3) în departamentul de contabilitate al companiei (în cazul meu 2.0).

Cu câțiva ani în urmă, aceste configurații au fost instalate, iar schimbul automat între ele este configurat. Sa confruntat cu problema particularității cărții de referință a contrapartidelor către departamentul de vânzări, care a început să înceapă handlogul de contrapartide (cu același han / cat / nume) pentru unul sau alte motive (aceeași contrapartidă pe care o răspândesc în diferite grupuri) . Contabilitatea și-a exprimat "fi" și a decis - nu contează că au, combină cărți când se încarcă într-una. A trebuit să intervin în procesul de transfer de obiecte prin regulile de schimb. Eliminat pentru căutări de contrapartide prin identificatorul intern și a lăsat o căutare de către INN + GPP + nume. Cu toate acestea, iar apoi au existat capcanele lor sub forma fanilor pentru a redenumi numele contrapartidelor (ca rezultat, dupilele din BP sunt deja create de reguli). Toți s-au adunat, au discutat, au decis, au convins că în URTI am avut duplicat, le-au scos, au revenit la regulile standard.

Aceasta este doar după dublu dublu de "pieptănat" în UT și în BP - identificatori interni din multe contrapartide diferă. Și de atunci reguli tipice Schimbul caută obiecte exclusiv de identificatorul intern, apoi cu următoarea parte a documentelor din BP, noua dublă contrapartidă (în cazul în care aceste identificatori diferă). Dar schimbul universal datele XML. Nu ar fi universal dacă era imposibil să ajungi în jurul acestei probleme. pentru că Este imposibil să se schimbe identificatorul obiectului existent prin mijloace standard, atunci puteți ocoli această situație utilizând un registru special de conformitate "conformitatea obiectelor pentru schimb", care este disponibil în toate configurațiile standard de la 1c.

Pentru a nu avea noile duble, algoritmul de curățare al dublelor a devenit după cum urmează:

1. În BP utilizând "Căutarea și înlocuirea elementelor duplicate" (este tipică, poate fi preluată din configurație. Controlul comerțului sau pe discul său sau selectați cel mai potrivit dintre setul de variații ale InfoStarului în sine ) Mi se pare un dublu, eu definesc elementul credincios, faceți clic pe Executare Înlocuire.

2. Obțin identificatorul intern al singurii (după înlocuire) a obiectului dublu (prelucrarea specifică special simplă pentru acest lucru, astfel încât identificatorul intern să fie copiat automat în clipboard).

3. Deschideți "conformitatea obiectelor pentru schimb" în UT, fac o selecție prin propria mea legătură.

Lupta împotriva paginii duble

Proprietarul nu poate suspecta că pe site-ul său site-ul său unele pagini au copii - cel mai adesea se întâmplă. Paginile sunt deschise, conținutul lor sunt toate în ordine, dar dacă doar să acorde atenție, atunci se poate observa că, cu același conținut al adresei diferite. Ce înseamnă? Pentru utilizatorii live, nimic, deoarece sunt interesați de informații despre pagini, dar motoarele de căutare fără suflet percep un astfel de fenomen complet diferit - pentru ei este complet pagini diferite cu același conținut.

Sunt pagini duble sunt dăunătoare? Deci, dacă utilizatorul obișnuit nu poate observa nici măcar prezența unui dublu pe site-ul dvs., atunci motoarele de căutare vor determina imediat. Ce reacție de la ei să aștepte? Deci, de fapt, copiile sunt văzute ca pagini diferite, apoi conținutul pe ele încetează să fie unic. Și acest lucru afectează deja negativ clasamentul.

De asemenea, prezența unui dublu este blocată, pe care optimizatorul a încercat să se concentreze pe pagina țintă. Din cauza dublei, el nu poate fi deloc pe acea pagină că dorea să se miște. Adică efectul transfinei interioare și referințe externe Acesta poate fi redus în mod repetat.

În majoritatea covârșitoare a cazurilor în apariția dublei - datorită nu setări corecte Iar lipsa unei atenții corecte a optimizatorului este generată de copii clare. Cu aceasta, multe CMS sunt păcătoși, de exemplu, Joomla. Pentru a rezolva problema, este dificil să alegeți o rețetă universală, dar puteți încerca să utilizați unul dintre plug-in-urile pentru a șterge copiile.

Apariția dublelor fuzzy, în care conținutul nu este pe deplin identic, apare de obicei datorită defectării webmasterii. Astfel de pagini sunt adesea găsite pe site-urile web online, unde paginile cu mărfuri sunt caracterizate de doar câteva propoziții cu o descriere, iar restul conținutului constând din blocuri și alte elemente este același.

Mulți specialiști susțin că o cantitate mică de dublu nu va răni un site, dar dacă mai mult de 40-50% mai mult de 40-50%, atunci resursa poate aștepta dificultăți serioase. În orice caz, chiar dacă copiile nu sunt atât de mult, merită să faceți cu eliminarea lor, deci sunteți garantat pentru a scăpa de problemele cu DUM-urile.

Pagina de căutare Copii Există mai multe modalități de a căuta pagini duplicate, dar mai întâi trebuie să contactați mai multe motoare de căutare și să vedeți cum văd site-ul dvs. - trebuie doar să comparați numărul de pagini din indexul fiecăruia. Acest lucru este destul de simplu, fără a recurge niciun mijloc suplimentar: în Yandex sau Google suficient în șirul de căutare, introduceți gazda: yourite.ru și uitați-vă la numărul de rezultate.

Dacă, după o verificare simplă, cantitatea va fi foarte diferită, de 10-20 ori, atunci acest lucru este cu unele mai multe șanse de a vorbi despre conținutul dublei în unul dintre ele. Copiile de pagină pot fi de vină pentru o astfel de diferență, dar totuși oferă un motiv pentru o căutare mai detaliată. Dacă site-ul este mic, puteți calcula manual numărul de pagini reale și apoi puteți compara cu indicatorii de la motoare de căutare.

Căutați pagini duplicate Puteți căuta o adresă URL în emiterea motorului de căutare. Dacă trebuie să fie CNC, atunci paginile cu o adresă URL de caractere incomprehensabile, cum ar fi "index.php? S \u003d 0F6B2903D", vor fi imediat jenat din lista generală.

O altă modalitate de a determina prezența unui duplicat prin intermediul motoarelor de căutare este o căutare pe fragmente de text. Procedura pentru o astfel de inspecție este simplă: trebuie să introduceți un fragment de text din 10-15 cuvinte din fiecare pagină din șirul de căutare, apoi analizați rezultatul. Dacă vor exista două sau mai multe pagini în extrădare, există copii, dacă rezultatul este doar unul, atunci nu există duble de pe această pagină și nu vă puteți îngrijora.

Este logic că dacă site-ul constă un numar mare Pagini, un astfel de cec se poate transforma într-o rutină impracticabilă pentru un optimizator. Pentru a minimiza costurile de timp, puteți utiliza programe speciale. Unul dintre aceste instrumente, care este probabil un semn al specialiștilor cu experiență, este link-ul lui Xenu Sleuth.

Pentru a verifica site-ul, trebuie să deschideți un nou proiect selectând meniul "Fișier" "Verificați adresa URL", introduceți adresa și faceți clic pe "OK". După aceasta, programul va începe procesarea oricărei adrese URL a site-ului. La sfârșitul cecului, trebuie să exportați datele primite către orice editor convenabil și să începeți să căutați un dublu.

În plus față de metodele de mai sus din instrumentele panourilor Yandex.vebmaster și instrumentele Google Webmaster, există mijloace pentru verificarea paginilor de indexare care pot fi utilizate pentru a căuta un dublu.

Metode de rezolvare a problemei După ce se găsesc toate duplicele, va fi necesară eliminarea acestora. Acest lucru se poate face și în mai multe moduri, dar pentru fiecare caz specific aveți nevoie de propria dvs. metodă, este posibil ca toată lumea să trebuiască să utilizeze.

Paginile de copiere pot fi șterse manual, dar această metodă este destul de potrivită numai pentru acele duble, care au fost create prin mod manual la inconsecvența webmasterii.
Redirecționarea 301 este excelentă pentru paginile de lipire - copiile a căror URL se distinge prin prezența și absența www.
Rezolvarea problemelor cu duble utilizând eticheta canonică poate fi utilizată pentru copiile fuzzy. De exemplu, pentru categoriile de bunuri din magazinul online, care au un duplicat, distins prin sortarea în diverși parametri. Canonical este, de asemenea, potrivit pentru versiuni de pagini de imprimare și în alte cazuri similare. Este folosit destul de simplu - pentru toate copiile, atributul Rel \u003d "canonic" este indicat și pentru pagina principală care este cea mai relevantă - nr. Codul ar trebui să arate așa ceva: link rel \u003d "canonic" href \u003d "http://yourste.ru/stranica-kopiya" / și stați în cadrul etichetei capului.
În lupta împotriva dublelor poate ajuta la configurarea fișierului robots.txt. Directiva privind interzicerea vă va permite să închideți accesul la DUM-uri pentru roboții de căutare. Puteți citi mai multe despre sintaxa acestui fișier în corespondența noastră.

Duplicas sunt pagini din același domeniu cu conținut identic sau foarte similar. Cel mai adesea apar datorită caracteristicilor lucrării CMS, erorilor în directivele Robots.txt sau în setarea 301 de redirecționare.

Care este pericolul dublei

1. Identificarea incorectă a paginii relevante căutați robotul. Să presupunem că aveți una și aceeași pagină disponibilă pe două adrese URL:

Https://site.ru/kepki/

Https://site.ru/catalog/kepki/

Ați investit bani în promovarea paginii https://site.ru/kepki/. Acum se referă la resursele tematice și se clasifică poziții în top 10. Dar, la un moment dat, robotul îl elimină din index și în schimb adaugă https://site.ru/catalog/kepki/. Firește, această pagină este clasată mai rău și atrage mai puțin trafic.

2. Creșterea timpului necesar pentru trecerea site-ului de către roboți. Pe scanarea fiecărui roboți site-uri alocate timp limitat. Dacă o mulțime de duble, robotul nu poate ajunge la conținutul principal, din cauza căruia indexarea va fi întârziată. Această problemă este deosebit de relevantă pentru site-urile cu mii de pagini.

3. Impunerea de sancțiuni din partea motoarelor de căutare. Prin ele însele, duplicele nu sunt un motiv pentru pesimizarea site-ului - atâta timp cât algoritmii de căutare nu se iau în considerare că creați o luptă intenționată în scopul de a manipula emiterea.

4. Probleme pentru webmasteri. Dacă lucrările privind eliminarea dublelor pentru a amâna într-o cutie lungă, ele pot fi acumulate de o astfel de cantitate pe care webmasterul este pur fizic, va fi dificil de procesat rapoartele, sistematizarea motivelor pentru DUM-uri și face ajustări. Lucrările mari măresc riscul de erori.

Dupilele sunt împărțite convențional în două grupe: explicit și implicit.

Explicit duplicas (pagină disponibilă pe două sau mai multe URL)

Există multe opțiuni pentru astfel de duble, dar toți sunt ca esența lor. Iată cele mai frecvente.

1. URL-ul cu o slash la capăt și fără ea

Https://site.ru/list/

Https://site.ru/list.

Ce trebuie să faceți: Configurați răspunsul serverului "HTTP 301 Mutat permanent" (301-a redirecționare).

Cum să o facă:

- găsiți în dosarul rădăcină al fișierului site.htaccess și deschideți (dacă nu există nici o înregistrare în format TXT, apel.htaccess și pus în rădăcina site-ului);
- prescrieți în fișierul de fișier pentru redirecționarea cu adresa URL cu o slash pe adresa URL fără o slash:

RescriereCOND% (solicitare_filename)! -D
REWRITECOND% (solicitare_uri) ^ (. +) / $
ReWriterule ^ (. +) / $ 1

- operațiunea inversă:

RescriereCOND% (solicitare_filename)! -F
REWRITECOND% (solicitare_uri)! (. *) / $
Rewriterule ^ (. * [^ /]) $ 1 /

- dacă fișierul este creat de la zero, toate redirecțiile trebuie să fie prescrise în interiorul unor astfel de linii:

…

Configurarea redirecționării 301 cu .htaccess este potrivită numai pentru locurile Apache. Pentru Nginx și alte servere, redirecționarea este configurată în alte moduri.

Ce URL este preferată: cu sau fără Slam? Pur și din punct de vedere tehnic - nici o diferență. Uită-te în situație: dacă mai multe pagini sunt indexate cu o slash, lăsați această opțiune și invers.

2. URL cu www și fără www

Https://www.site.ru/1.

Https://site.ru/1.

Ce trebuie să faceți: Specificați oglinda principală a site-ului în panoul Webmaster.

Cum să faceți acest lucru în Yandex:

- du-te la yandex.vebmaster.

- selectați site-ul din panou de la care va fi redirecționarea (cel mai adesea redirecționată către adresa URL fără www);
- accesați secțiunea "Indexing / Site Mower", scoateți caseta de selectare din fața elementului "Adăugați www" și salvați modificările.

În termen de 1,5-2 săptămâni de yandex, oglinzile vor relua paginile și numai adresa URL fără WWW va apărea în căutare.

Important! Anterior, pentru a specifica oglinda principală în fișierul robots.txt, a fost necesar să se prescrie o directivă gazdă. Dar nu mai este acceptată. Unii webmasteri "pentru siguranță" indică încă această directivă și pentru setul de încredere mai mare 301 Redirect - acest lucru nu este necesar, este suficient să ajustați lipirea în webmaster.

Cum să lipiți oglinzile în Google:

- mergi la Consola de căutare Google. și adăugați 2 versiuni ale site-ului - cu www și fără www;

- selectați site-ul din care redirecționarea va trece de la consola de căutare;
- faceți clic pe pictograma angrenaj din colțul din dreapta sus, selectați elementul "Setări site" și selectați domeniul principal.

Ca și în cazul lui Yandex, nu sunt necesare manipulări suplimentare cu 301 de redirecționare, deși este posibilă implementarea lipirii cu aceasta.

Ce ar trebui făcut:

- descărcați o listă de adrese URL indexate de la Yandex.Webmaster;
- descărcați această listă în instrumentul de listă Seopult sau utilizând fișierul XLS (instrucțiuni detaliate pentru utilizarea instrumentului);

- rulați analiza și descărcați rezultatul.

În acest exemplu, pagina de faginare este indexată de Yandex, iar Google nu este. Motivul este că acestea sunt închise de la indexarea în robots.txt numai pentru botul yandex. Soluție - Configurați canonizarea pentru paginile de paginare.

Folosind parser de la seopult, veți înțelege, duplicați paginile din ambele motoare de căutare, fie numai într-una. Acest lucru vă va permite să alegeți instrumente optime de rezolvare a problemelor.

Dacă nu aveți timp sau experiență pentru a vă ocupa de dublu, ordonați un audit - în plus față de a avea un dublu pe care îl obțineți foarte mult informatii utile Despre resursa dvs .: prezența erorilor în codul HTML, titlurile, etichetele meta, structura, trecerea internă, gradul de utilizare, optimizarea conținutului etc. Ca rezultat, veți avea recomandări gata pe mâini, ceea ce va face site-ul mai mult atractiv pentru vizitatori și își sporesc poziția în căutare.

Picături pagini pe site-uri sau bloguriDe unde provin și ce probleme pot crea.
Este vorba de acest lucru că vom vorbi despre acest post, vom încerca să ne ocupăm de acest fenomen și vom găsi modalități de a minimiza aceste probleme potențiale care ne pot aduce pagini duplicate pe site.

Deci, va continua.

Ce este paginile duplicate?

Pagini olandeze pe orice resursă web înseamnă acces la aceleași informații la adrese diferite. Astfel de pagini sunt numite și momentele interne ale site-ului.

Dacă textul de pe pagină este complet identic, atunci un astfel de duplicat este numit complet sau clar. Cu o coincidență parțială duplicat se numește incompletă sau fuzzy.

Duplicare incompletă - Acestea sunt pagini ale categoriilor, lista de pagini de bunuri și paginile similare care conțin anunțurile materialelor site-ului.

Pagini complete duplicate- Acestea sunt versiuni pentru imprimare, pagini cu extensii diferite, pagini de arhivare, căutați pe site, pagini cu comentarii așa mai departe.

Surse de pagini duble.

În prezent, cele mai multe pagini duplicate sunt generate când folosind CMS moderne. - Sisteme de gestionare a conținutului, ele sunt numite și motoare ale site-urilor.

Acesta sunt eu. WordPress, și Joomla, și dle Și alte CM-uri populare. Acest fenomen depune serios optimizatorii site-urilor și webmasterii și le oferă probleme suplimentare.

În magazinele online Dupile pot apărea atunci când mărfurile sunt afișate cu sortarea pe diverse detalii (producător de mărfuri, numirea de bunuri, data fabricării, prețul etc.).

De asemenea, trebuie să vă amintiți notatorii consola www.Și pentru a determina dacă este în numele domeniului atunci când creați, dezvoltați, promovarea și promovarea site-ului.

După cum puteți vedea, sursele apariției unui dublu pot fi diferite, am enumerat doar principalele, dar toate sunt bine cunoscute specialiștilor în domeniu.

Pagini olandeze, negative.

În ciuda faptului că mulți la apariția dublelor nu plătesc o atenție deosebită, acest fenomen poate crea gravă probleme la promovarea site-urilor.

Motorul de căutare poate considera duci ca spamȘi, ca rezultat, este serios să reduceți poziția atât a acestor pagini, cât și a site-ului în ansamblu.

La promovarea site-ului pot apărea legăturile după cum urmează. La un moment dat, motorul de căutare este considerat cel mai mult pagina relevantă dublăȘi nu cea pe care o promovezi legături și toate eforturile și costurile dvs. vor fi zadarnice.

Dar există oameni care încearcă utilizați greutatea duplicată Pe paginile dorite, cele mai importante, de exemplu, sau oricare altul.

Metode de tratare a paginilor Dubs

Cum să evitați un dublu sau cum să reduceți momentele negative atunci când apar?
Și, în general, merită să se ocupe oarecum cu acest lucru sau de a oferi mila motoarelor de căutare. Lăsați-i să dezasambleze, deoarece sunt atât de inteligenți.

Folosind roboți.txt.

Robots.txt.- Acesta este un fișier plasat în directorul rădăcină al site-ului nostru și care conține directive pentru roboții de căutare.

În aceste directive, indicăm ce pagini de pe indicele site-ului nostru și care nu este. De asemenea, putem specifica numele domeniului principal al site-ului și fișierul care conține harta site-ului.

Pentru a interzice paginile de indexare directiva utilizată interzice. Este că webmasterii o folosesc, pentru a se închide de la indexarea paginilor duplicate și nu numai duplicat, ci orice alte informații care nu sunt legate direct de conținutul paginilor. De exemplu:

Nu permiteți: / Căutare / - Închideți paginile de căutare a site-ului
Nu permiteți: / *? - Închideți paginile care conțin semnul de întrebare "?"
Dezactivați: / 20 * - Închideți pagina de arhivă

Folosind fișierul.htaccess.

File.htaccess.(fără extindere) este plasată și în directorul rădăcină al site-ului. Pentru a combate duplicatele în acest fișier, personalizați utilizarea 301 Redirecționați.
Această metodă ajută la menținerea indicatorilor site-ului atunci când site-ul CMS se schimbă sau își schimbă structura. Rezultatul este redirecționarea corectă fără pierderea greutății de referință. În același timp, greutatea paginii de la vechea adresă va fi transmisă paginii la o nouă adresă.
301 Redirecționarea se aplică și la determinarea domeniului principal al site-ului - cu www sau fără www.

Utilizarea etichetei Rel \u003d "Cannonic"

Cu această etichetă, webmasterul indică motorul de căutare al sursei originale, adică pagina care ar trebui să fie indexată și să participe la clasamentul motoarelor de căutare. Pagina este numită canonică. Intrarea în codul HTML va arăta astfel:

Când utilizați CMS WordPress, acest lucru se poate face în setările unui astfel de util. pluginul ca toate într-un pachet SEO.

Măsuri suplimentare de combatere duble pentru CMS WordPress

Aplicând toate metodele de mai sus de a face referire la paginile duplicate de pe blogul dvs., am avut un sentiment tot timpul că nu am făcut tot ce poți. Prin urmare, luptând pe Internet, consultând cu profesioniști, am decis să fac altceva. Acum o voi descrie.

Am decis să elimini dupilele create pe blog, când Utilizați ancore Le-am spus despre articolul "ancore HTML". Pe blogurile care rulează CMS WordPress ancore sunt formate când eticheta "# Mai mult" și când utilizați comentarii. Fezabilitatea aplicației lor este destul de controversată, dar Ducky sunt în mod clar fructe.
Acum, cum am eliminat această problemă.

În primul rând, vom lua eticheta #More.

A găsit un fișier în care se formează. Mai degrabă, am sugerat.
Acest lucru ../ wp-include / post-template.php
Apoi am găsit un fragment al programului:

ID) \\ "CLASS \u003d \\" More-Link \\ "\u003e $ more_link_text", $ More_link_text);

Fragmentul marcat în roșu eliminat

#More - ($ post-\u003e id) \\ "clasa \u003d

Și a primit în final șirul de acest fel.

$ Ieșire. \u003d Aplicații_filters ('the_content_more_link ",' $ more_link_text.", $ More_link_text);

Scoateți comentariile ancorelor #comment

Acum ne întoarcem la comentarii. Acest lucru este deja dodumal însuși.
De asemenea, determinat cu fișierul ../wp-includes/comment-template.php.
Găsiți fragmentul dorit al codului programului

return Apply_Filters ('get_comment_link', $ link . '# COMETARIU-'. $ comentariu-\u003e comment_id, $ comentariu, $ args);)

În mod similar, un fragment marcat roșu îndepărtat. Foarte frumos, cu atenție, până la fiecare punct.

. '# COMETARIU-'. $ comentariu-\u003e comment_id

Noi, ca rezultat al următoarei rânduri a codului programului.

return Apply_Filters ('get_comment_link', $ link, $ comentariu, $ args);
}

Bineînțeles, toate acestea au făcut acest lucru, după copierea fișierelor de program specificate pe computer, astfel încât, în caz de eșec, este ușor să restaurați starea la modificări.

Ca urmare a acestor schimbări, atunci când faceți clic pe text "Citiți restul înregistrării ..." Am o pagină cu o adresă canonică și fără a adăuga la adresa coada în formularul "More- .. .. ". De asemenea, atunci când faceți clic pe comentarii, am o adresă canonică normală fără un prefix sub formă de "Comentariu # ...".

Astfel, numărul de pagini duble de pe site ușor scăzut ușor. Dar ce altceva va forma WordPress acum nu pot spune. Vom urmări mai mult problema.

Și în concluzie, vă aduc la cunoștința dvs. un videoclip foarte bun și informativ pe această temă. Vă recomandăm cu tărie.

Toate sănătatea și succesul. Până la următoarele întâlniri.

Materiale utile:

Paginile duplicate sunt unul dintre multe motive pentru scăderea pozițiilor în rezultatele căutării și chiar introducerea filtrului. Pentru a preveni acest lucru, trebuie să le avertizați în indicele motorului de căutare.

Determinați prezența unui dublu pe site și scăpați de ele căi diferiteDar gravitatea problemei este că duplicatul nu este întotdeauna inutil Pagini, pur și simplu nu ar trebui să fie în index.

Vom rezolva această problemă acum, doar pentru ca un început să afle ce este un duplicat și cum apar ei.

Ce este paginile duplicate

Paginile elevilor sunt o copie a conținutului paginii canonice (principale), dar cu o altă adresă URL. Este important aici să rețineți că acestea pot fi complete și parțiale.

Duplicare completă Este o copie exactă, dar cu adresa sa, diferența dintre care se poate manifesta în slash, abrevierea www, substituirea parametrilor Index.php?, Pagina \u003d 1, pagina / 1 etc.

Duplicare parțială Se manifestă în copierea incompletă a conținutului și asociată cu structura site-ului, atunci când anunțurile articolelor, arhivele, conținutul de la bara laterală, pagina pagină și alte elemente ale resurselor conținute pe pagina canonică sunt indexate. Acest lucru este inerent în majoritatea magazinelor CMS și online în care catalogul este o parte integrantă a structurii.

Am vorbit deja despre consecințele apariției de stejar, ceea ce se datorează distribuției masei de referință între duplicate, submenirea paginilor în index, pierderea unicității conținutului etc.

Cum să găsiți pagini de ducky pe site

Următoarele metode pot fi utilizate pentru a căuta un dublu:

Șir de căutare Google. Cu proiectarea site-ului: myblog.ru, unde sunt detectate Myblog.ru dvs. URL-ul dvs., sunt detectate paginile din indexul principal. Pentru a vedea Dupile, trebuie să mergeți la ultima pagina rezultatele cautarii și faceți clic pe linia "Afișați rezultatele ascunse";
echipa "Căutare avansată" în Yandex. Poziționarea într-o adresă specială de fereastră a site-ului dvs. și intrarea în citate una dintre propunerile unui articol indexat expus la verificare, trebuie să obținem un rezultat. Dacă este mai mult un duplicat;
bara de instrumente Pentru webmasterii în PS;
manual, Înlocuindu-se în bara de adrese, slash, www, HTML, ASP, PHP, literele din registrele superioare și inferioare. În toate cazurile, redirecționarea trebuie să apară pe pagină cu adresa principală;
programe și servicii speciale: Xenu, megaindex etc.

Îndepărtați foile de pagini

Îndepărtarea dublelor are, de asemenea, mai multe. Fiecare dintre ele are impactul și consecințele salePrin urmare, nu este necesar să vorbim despre cea mai eficientă. Trebuie amintit că distrugerea fizică a unui duplicat indexat nu este o ieșire: motoarele de căutare vor mai aminti. Prin urmare, cea mai bună metodă de abordare a DUS - preveni apariția lor Utilizând setările potrivite ale site-ului.

Iată câteva dintre modalitățile de a elimina dublele:

Setarea robots.txt.. Acest lucru va permite pagini specifice de indexare. Dar dacă roboții Yandex sunt susceptibili la acest fișier, Google captează chiar paginile închise, fără a lua în considerare în mod special recomandările sale. În plus, cu ajutorul Robots.txt, eliminați duplicele indexate este foarte dificil;
301 Redirecționați. Contribuie la lipirea unui dublu cu o pagină canonică. Metoda este valabilă, dar nu întotdeauna utilă. Nu se poate utiliza în cazul în care duplicatele trebuie să rămână pagini independente, dar nu ar trebui indexate;
Alocarea a 404 de erori Infectate. Metoda este foarte bună pentru îndepărtarea lor, dar va necesita ceva timp înainte ca efectul să se manifeste.

Când nimic de aderat și nu șterge nimic, dar nu vreau să pierd greutatea paginii și să obțin o pedeapsă din motoarele de căutare, este folosit rel atribut href canonic.

Rel atribut canonic asupra luptei împotriva dublelor

Voi începe cu exemplul. În magazinul online există două pagini cu carduri de conținut identice, dar pe aceleași mărfuri sunt în ordine alfabetică și pe de altă parte a costurilor. Ambele sunt necesare și redirecționate nu sunt permise. În același timp, pentru motoarele de căutare este un dublu clar.

În acest caz, utilizarea rațională a etichetei link Rel canonicindicând pagina canonică care este indexată, dar pagina principală rămâne disponibilă utilizatorilor.

Acest lucru se face după cum urmează: În blocul de pagini-duplicat, este specificat referința. "Link rel \u003d" canonic "href \u003d" http://site.ru/osnovnaya stranitsa "/"unde Stranitsa este adresa paginii canonice.

Cu această abordare, utilizatorul poate vizita liber orice pagină a site-ului, dar un robot, citirea codului atributelor Canonical Rel, va merge index numai despre care este listată în link.

Acest atribut poate fi util și pentru paginile de pagutare. În acest caz, creați o pagină "Afișați tot" (astfel de "portiere") și luați pentru paginile canonice și paginile de paginare trimit un robot către acesta prin intermediul Rel canonic.

Astfel, alegerea metodei de combatere a duplicării paginilor depinde de natura lor emergence și necesitate Prezența pe site.