Continutul duplicat este unul dintre cele mai frecvente probleme de optimizare SEO si, in mod interesant, unul dintre cele mai neglijate.

De multe ori vorbim despre modul cum sa optimizam o pagina, cum sa obtinem backlinkuri, dar  foarte putin se mentioneaza despre enervantele continuturi duplicate.

Problema este ca, in cazul in care site-ul dvs. este inundat de pagini duplicate, pentru motoarele de cautare este difícil sa le dea imporanta pe care o merita. In acest post voi explica tot ce trebuie sa stiti despre continutul duplicat:

Ce este, unde trebuie cautat si cum sa scapam de el.

Ce este continutul duplicat

Continutul duplicat este orice text repetat in mai mult de o pagina web, fie pe site-ul dvs., fie in afara lui. Este ceea ce se intampla cand o pagina web apare cu diferite URL-uri. Dar si cand un spammer copie textul de pe pagina dvs o modifica usor si o posteaza pe site-ul lui.

La prima vedere poate aparea ca continutul duplicat nu are o mare imporanta, dar adevarul este ca reprezinta o problema foarte serioasa. Utilizatorii motorului de cautare Google se asteapta la rezultate diferite, nu aceleasi rezultate repetate. Deci pentru a evita acest aspect, fíltrele de cautare previn aparitia continutului duplicat.

Consecintele continutului duplicat

Acum, ca stiti de ce este atat de important  sa evitati continutul duplicat, ar trebui sa stiti si problemele care pot aparea in site-ul dvs. Unele dintre cele mai importante sunt:

  • Pagini incorecte – Avand diferite pagini cu acelasi continut semnifica sa lasam motorul de cautare sa faca alegerea cea mai buna. Aceasta nu este o alegere buna pentru ca browser-ul poate alege o varianta pe care nu o dorim.
  • O vizibilitate scazuta – Ca urmare a acestui fapt, motorul de cautare poate arata o varianta cu o optimizare mai proasta si prin urmare o pozitionare inferioara.
  • O deficienta indexare – indexarea paginilor dvs. poate fi afectata ca urmare a faptului ca motorul de cautare cauta in paginile duplícate in loc de paginile care  cu adevarat au o importanta. In multe cazuri continutul duplicat ajunge sa fie o parte semnificativa din paginile indexate.
  • Linkuri pierdute – paginile duplícate pot primi link-uri si puterea acestora se dilueaza.

Mai mult de atat, ar trebui sa stiti ca Google respinge continutul duplicat, nu penalizeaza; doar il filtreaza pentru a nu fi afisat si aceasta este o pedeapsa suficienta.

Cauzele continutului duplicat

Principala sursa de continut duplicat este propriul site si nu conteaza cat de bine l-ai optimizat din punct de vedere SEO. Dupa cum veti vedea exista destule motive pentru care puteti avea o multime de copii fara sa stiti.

Acestea sunt principalele motive:

  • Domenii necanonice – Site-ul dvs. poate functiona cu sub domeniu care incepe cu prefix-ul “www”… si cu domeniul care nu incepe cu acest prefix. Versiunea buna este canonica si daca nu o stabiliti in mod corect acesta apare in ambele variante.
  • Pagini HTTPS – similar cu ce se intampla cu domeniul canonic, in cazul in care site-ul utilizeaza criptare SSL, puteti avea o copie exacta a site-ului dvs. pe versiunea securizata ( https)
  • Continut dinamic – Exista site-uri care atribuie parametrii url-ului pentru a controla continutul. Ca si cu ID-urile de sesiune, motoarele de cautare interpreteaza asta ca duplícate.
  • Arhive – O problema tipica blog-urilor este faptul ca acelasi continut poate aparea pe diferite pagini, cum ar fi categorii si tag-uri.
  • Paginare – Orice site care foloseste paginare poate avea aceasta problema, mai ales daca paginile impartasesc acelasi titlu si descriere.

Continut duplicat off-site :

  • Syndication – Consta in a trimite continutul dvs. la alte site-uri pentru a genera trafic, cum ar fi prin RSS. Problema poate aparea atunci cand aceste site-uri publica o copie completa a continutului, in locul unui fragment.
  • Localizare – Pentru a te directiona la mai multe tari ar putea fi folosit acelasi continut( sau aproape) in mai multe domenii, cum ar fi .ro  si . md
  • Scraping – Scapers sunt persoane ce copiaza cu ajutorul unui software tot continutul si il publica intr-un alt domeniu.
  • Plagiatul – Oricine ce copie o parte din text si il publica in site-ul lui. Uneori se intampla in mod intentionat.

Cum putem detecta continutul duplicat

In principal Google identifica continutul duplicat prin pagini cu titluri, descrieri, continut, identice sau foarte asemanatoare. Prin urmare, daca doriti sa gasiti continut duplicat de pe site-ul dvs.  ar trebui sa incepeti pe aici.

Va voi arata cele mai eficiente metode:

  • Google Webmaster Tools – Daca ati inregistrat site-ul in instrumente Google pentru webmasteri, acesta este cu siguranta cel mai bun punct de plecare. Accesul la “ Aspectul site-ului in cautare – > Imbunatatiri pentru HTML si sa acordati atentie la duplícate etichete titlu si descrieri meta. Instrumentul va arata cantitatea de duplicate astfel incat le puteti revizui.
  • Comanda “ site” – este o metoda eficienta, dar necesita ceva de munca. Consta in a cauta in site-ul web anumite cuvinte sau fraze, cum ar fi produse, in cazul unui magazin online( ex: site:exemplu.com” un produs al magazinului”) In rezultat se poate vedea daca titlurile si descrierile sunt duplicate.
  • Screaming Frog este un instrument puternic ce va permite sa urmariti site-ul dvs. pentru continut duplicat, printre altele. Ce va intereseaza sunt Page Title, Meta Description si H1 cu filtru Duplicate.
  • Google Analytics– puteti gasi, de asemenea, pagini duplicate prin raportul Content -> continutul site-ului – > pagini de destinatie. Cheia este sa va uitati la URL-urile si paginile care primesc mai putin trafic decat ar fi trebuit.

In cazul in care continutul duplicat este in afara site-ului dvs.  Puteti utiliza comanda “ site” pentru a detecta, totusi recomand instrumentul Copyscape. Alte instrumente SEO care ajuta la detectarea de continut duplicat sunt Duplichecker, Plagiarisma si Plagium.

Elimina continutul duplicat

In mod evident, motoarelor de cautare nu le place continutul duplicat, deoarece duce la o experienta slaba a utilizatorului. Deci, daca site-ul dvs.  are continut duplicat, trebuie sa faceti tot posibilul sa-l eliminati.

Acestea sunt principalele optiuni  pentru rezolvarea problemei:

  • Utilizeaza Rel Canonical – Eticheta “rel = canonical” a fost conceputa tocmai pentru a aborda aceasta problema, asa ca este cea mai buna solutie. Se compune dintr-o linie de cod in sectiunea <head> a codului HTML a paginii.
  • Redirectioneaza 301 – Este cel mai bun lucru atunci cand nu puteti utiliza tag-ul canonic, atunci cand mutati continutul de la o pagina la alta.
  • Interzice accesul robotilor – Pentru a evita ca motoarele de cautare sa gaseasca pagini duplícate puteti ajuta robotii prin fisierul robots.txt

In cazul de continut duplicat in afara site-ului dvs.  Cel mai bine este sa solicitati prin email, cu educatie, sa elimine acest continut. Daca acesta nu functioneaza cereti ca cel putin sa puna un link directionat spre pagina de unde este copiat, asa va ajuta motorul de cautare sa identifice originalul.

Ca ultima optiune, puteti solicita la Google sa elimine pagina in cauza din rezultatele de cautare prezentand o solicitare bazata pe legea USA de protectia drepturilor de autor( DMCA). Mai puteti ajuta motorul de cautare prin a imbunatati detectarea de continut duplicat prin a trimite cazul dvs. ca exemplu.

In continuare concluzia si cateva sfaturi:

  • Nu folositi niciodata aceeasi descriere/ titlu in mai mult de o pagina
  • Textul din fiecare pagina trebuie sa fie unic
  • Nu uitati de canonical
  • Cand copiati un citat dintr-un alt loc includeti intotdeauna un link directionat catre original
  • In cazul cand copiati o pagina intreaga, cere permisiunea inainte de a include un link catre sursa.

LĂSAȚI UN MESAJ

Please enter your comment!
Please enter your name here