Duplicate content to w dużym skrócie identyczna treść znajdująca się na co najmniej dwóch stronach internetowych. Innymi słowy, jeśli ten sam tekst pojawia się pod różnymi adresami URL, mamy wówczas do czynienia z powielaniem tej samej treści. Co istotne, może ona być również skopiowana w obrębie jednej domeny, ale wtedy mówi się o duplikacji wewnętrznej. Jaki wpływ na SEO ma duplicate content?
Przeczytaj także:
Spis treści
Czym jest duplikacja treści?
Duplicate content, czyli duplikacja treści jest powielaniem tekstu pod więcej niż jednym adresem URL w obrębie jednej domeny lub co najmniej dwóch serwisów. Ze względu na typ powielania treści można wyróżnić duplicate content zewnętrzny i wewnętrzny.
Czym jest wewnętrzna duplikacja treści?
Duplikacja wewnętrzna tekstu polega na zduplikowaniu treści w obrębie jednej witryny. Aby uniknąć takiego problemu, właściciele domen najczęściej skupiają się na tym, aby nie dublować treści na różnych podstronach. Jednak samo tworzenie unikalnych opisów kategorii czy produktów nie oznacza, że problem znika. Dlaczego? Otóż samo pojęcie duplikacji nie musi konkretnie oznaczać celowego skopiowania opisu, ale może dotyczyć na przykład błędów w zakresie optymalizacji technicznej:
- jeden produkt jest w dwóch kategoriach produktowych i ma różne adresy URL, podczas gdy powinien mieć jeden,
- generowanie różnych adresów URL dla każdego wariantu kolorystycznego oferowanego produktu
Czym jest duplicate content zewnętrzny?
Duplikacja zewnętrzna jest powielaniem treści pochodzących z innych serwisów na własnej domenie. Może to być wynikiem wykorzystania treści należącej do innych twórców i publikowania ich jako autorskiej, własnej, a także może być skutkiem nadmiernej inspiracji. Jeśli znajdzie się na czyimś blogu interesujący temat i chce się go poruszyć u siebie, należy zadbać o oryginalność i unikalność. Duplikacja zewnętrzna to także często wynik powielania na wielu stronach tych samych opisów produktów od producenta. Niestety jest to często spotykany problem w e-commerce.
Jaki poziom powielania treści jest akceptowalny przez algorytmy Google? Nie ma określonych widełek przez amerykańskiego giganta, dlatego wielu ekspertów SEO próbowało samodzielnie to sprawdzić. Na przykład Tony Wright w swoim artykule dla Search Engine Journal sugeruje, aby wszystkie treści różniły się co najmniej o 30% od innych treści. Oczywiście, celem każdego twórcy powinno być osiągnięcie 100% unikalności tekstu, ale czasami jest to trudne do osiągnięcia, jeśli porusza się dokładnie taki sam temat.
Często spotykaną sytuacją jest powielanie treści przez copywriterów. Taka sytuacja ma miejsce, gdy firma zrezygnuje ze współpracy z agencją SEO i podejmie ją z freelancerem. Później zaczynają pojawiać się problemy z zewnętrzną duplikacją treści. Na szczęście w sieci dostępnych jest wiele programów zarówno płatnych, jak i darmowych, z których można wyciągnąć raport na temat unikalności danego tekstu.
Duplikacja contentu a SEO
Czy duplikat treści wpływa na pozycjonowanie i widoczność strony w wynikach wyszukiwania? Powielenie treści jest czynnikiem, który negatywnie wpływa na SEO. Taka sytuacja wprowadza w błąd algorytmy Google. Wówczas nie wiedzą one, który adres URL powinien wyświetlać się wyżej w SERPach. W związku z tym najczęściej pojawiającą się konsekwencją duplikacji treści jest spadek ruchu i widoczności strony internetowej.
Często można spotkać się ze stwierdzeniem, że duplicate content może skutkować karą od Google. Narosło wiele mitów na ten temat. W przypadku takich wątpliwości zawsze zaleca się sprawdzenie wytycznych od Google. Na swojej oficjalnej stronie (https://developers.google.com/search/docs/advanced/guidelines/duplicate-content?visit_id=638055727535838033-3077750636&rd=1) poinformowało ono, że zduplikowane teksty mogą przyczyniać się do nałożenia kary lub całkowitego usunięcia witryny internetowej z wyników wyszukiwania. Taka sytuacja ma miejsce jednak bardzo rzadko. Dzieje się tak z reguły wtedy, gdy witryna celowo kopiuje identyczne treści z innych stron.
Jak wykryć duplikację treści?
Szybkie znalezienie źródła problemu pozwala go usunąć bez większych strat dla pozycjonowania. Wykrycie wszystkich duplikatów na stronie nie jest łatwe i wymaga sporo pracy. Zadaniem administratora witryny jest niedoprowadzenie do takiej sytuacji. Najlepiej więc stosować wszystkie niżej przedstawione praktyki.
Ręczna analiza strony pod kątem duplicate content
Ręczna analiza strony internetowej jest rozwiązaniem bardzo czasochłonnym, więc sprawdzi się jedynie w małych serwisach, ale nawet dla nich niekiedy może okazać się niewystarczająca. Należy pamiętać, że roboty Google przechodzą po wszystkich linkach wewnętrznych, czyli nawet tych, które znajdują się w kodzie strony, a są niewidoczne dla użytkownika. Takie linki również trzeba sprawdzić.
Szukanie duplikacji przez site: w Google
Wpisanie polecenia site:domena.pl w wyszukiwarce Google pozwala wyświetlić wszystkie zaindeksowane podstrony w wynikach wyszukiwania z danej domeny. W ten sposób można przejrzeć witryny, które widzi Google. Aby ułatwić sobie przeglądanie ręcznie wszystkich podstron zaindeksowanych przez Google, można wykorzystać ograniczenie wyników poleceniem inurl. Dzięki temu wyświetlą się wyniki zawierające wybrany wyraz w adresie URL. Należy jednak pamiętać, że strony, które będą się wyświetlać po wpisaniu tej komendy to strony zaindeksowane przez Google. W serwisie mogą istnieć duplikaty, których Google jeszcze nie zaindeksowało lub takie, które Google wykryło jako duplikaty i już nadało im jakiś priorytet – nie ma jednak pewności, że zrobiło to tak, jakby się chciało.
Szukanie duplikacji crawlerami internetowymi
Crawlery internetowe to narzędzia-roboty, które zostały stworzone po to, aby analizować strony internetowe. Do najpopularniejszych należą Screaming Frog, DeepCrawl, Sitebulb i NetPeak. Wiele crawlerów pozwala wygenerować raporty dotyczące duplikacji contentu, w których znajduje się lista podstron, które mogą być duplikatami. Analizując swoją stronę nie należy opierać się na jednym raporcie. W celu pełnego wyeliminowania duplicate content, należy sprawdzić listę podstron, które widoczne są w raportach dotyczących takich elementów jak zduplikowane meta tagi. Duplikacja znaczników meta jest bardzo często widoczna w sklepach internetowych, gdzie nie tylko znajdują się identyczne opisy kategorii produktów jak u konkurencji, ale także meta tytuły i meta opisy w obrębie produktów na danej domenie.
Szukanie duplikacji w Google Search Console
Narzędzie Google Search Console znacznie ułatwia wykrycie powielania treści w internecie na Twojej stronie. W tym celu należy wejść w zakładkę „Stan” i sprawdzić komunikaty w kategoriach:
- błąd
- prawidłowe z ostrzeżeniem,
- wykluczono
Szukanie duplikacji w Google
Do sprawdzenia tego, czy content się duplikuje można wykorzystać także wyszukiwarkę Google. Ten sposób jest jednak bardzo czasochłonny, więc lepiej wykorzystać go do sprawdzenia tylko najważniejszych podstron, takich jak strona główna, podstrony ofertowe, wybrane kategorie lub blogi. Wystarczy skopiować krótki fragment treści i wkleić go w okno wyszukiwarki, aby zobaczyć, czy na stronie występuje duplikacja. Google wtedy pokaże wszystkie strony, które zawierają dokładnie taki sam tekst. Najlepiej wybrać fragment o długości ok. 50-100 zzs bez nazw własnych takich jak nazwa firmy, marki, produktu, aby nie był zbyt indywidualny.
Sprawdzanie duplikacji w programie antyplagiatowym
Jeśli ma się wątpliwości, czy copywriter szukający informacji na różnych stronach, aby stworzyć tekst, dostarcza wartościowe i oryginalne treści, można skorzystać z narzędzi i zweryfikować ich poziom duplikacji. Wśród najpopularniejszych rozwiązań wymienia się Grammarly, Semrush, Copyscape.
Jakie są przyczyny problemów z duplicate content i jak je wyeliminować?
Rozwiązanie tego problemu nie należy do najtrudniejszych ani też do najłatwiejszych. Należy pamiętać, że dotyczy on duplikacji treści w sklepach internetowych, ale także na blogach. Temat jest bardzo złożony i może dotyczyć również samych opisów oraz kwestii technicznych.
Duplikacja pierwszej strony paginacji kategorii
Często zdarza się, że linki paginacji są zrobione w nieprzemyślany sposób, np. link do strony 1 prowadzi do URL ze zmienną paginacji. Na stronie jest taka sama zawartość, która znajduje się na stronie bez zmiennej paginacji, co powoduje duplikację całej strony. Rozwiązaniem będzie poprawa linku wewnętrznego w nawigacji stronicowania, a także wprowadzenie przekierowania 301 z powielonego adresu na prawidłowy link.
Duplikacja opisów kategorii i produktów
Bardzo często zdarza się, że opis kategorii powielany jest na stronicowaniu, filtrowaniu lub sortowaniu kategorii. Chociaż w opinii administratorów wydawać się może, że tekst jest bardzo pomocny, np. przy wyborze produktów, to należy pamiętać, że jest to duplicate content i negatywnie wpływa na pozycjonowanie. Rozwiązaniem jest poprawienie systemu w taki sposób, aby opis kategorii pojawiał się tylko na stronie głównej kategorii.
Powielone opisy różnych produktów, najczęściej podobnych do siebie, jest częstym problemem duplikacji treści w e-commerce, zarówno jeśli chodzi o opisy w obrębie tej samej witryny, jak i różnych. Najlepszym rozwiązaniem będzie zoptymalizowanie opisów, aby nie były one takiej samej treści.
Duplikacja strony głównej
Często system strony internetowej pozwala na otworzenie strony głównej pod różnymi adresami – /pl, /index.php, /index.html. Należy takie zjawisko wyeliminować występowanie takich odnośników w obrębie serwisu i wprowadzić przekierowanie 301 z błędnych stron na poprawny adres URL.
Strona dostępna pod różnymi adresami
Ta sama strona dostępna jest pod różnymi adresami. Powody tego mogą być różne, np.:
- linki w menu górnym są z „.html” a w menu dolnym bez i obie wersje działają,
- dwa razy została dodana ta sama strona blogowa,
- ta sama podstrona ofertowa znajduje się w różnych zakładkach menu,
- ta sama kategoria znajduje się w wielu różnych miejscach w strukturze sklepu,
- system generuje adresy produktów w zależności od kategorii, w jakiej się znajdują.
W tym przypadku należy wyeliminować występowanie linków prowadzących do powielonych adresów i wprowadzić przekierowanie 301.
Nieprawidłowe wdrożenie SSL
Podczas wprowadzania certyfikatu SSL nie zostało ustawione dobrze przekierowanie z HTTP na HTTPS albo wprowadzono je tylko na stronę główną lub kilka wybranych adresów. Rozwiązanie jest proste – należy wprowadzić globalne przekierowanie dla wszystkich stron.
Nieprawidłowe wdrożenie wersji językowej
Nie wszystkie strony są przetłumaczone na inne języki, a jednak pod danym adresem strona działa i pokazuje zduplikowany tekst. W takim przypadku należy albo przetłumaczyć wszystkie strony na wskazany język, albo, jeśli nie chce się niektórych stron tłumaczyć, wyłączyć dostęp pod danym językiem
Zaindeksowanie wersji deweloperskiej strony
Problemem jest zaindeksowanie przez Google strony deweloperskiej. Jeśli indeksacja miała miejsce przed wdrożeniem witryny to należy wprowadzić przekierowanie 301 z wersji deweloperskiej na wersję online.
Najczęstsze rozwiązania powielania treści
Aby rozwiązać problem duplikacji treści na własnej stronie, można zastosować kilka działań:
- wspomniane przekierowanie 301,
- rel=”canonical”,
- blokowanie przed indeksowaniem.
Nie ma jednak jednego i uniwersalnego rozwiązania, które sprawdzi się w każdym przypadku. Każdy z nich wymaga indywidualnej interpretacji i rozważenia wielu kwestii. Według Google kluczem do sukcesu nie jest usuwanie problemów, ale zapobieganie im. Google przygotowało nawet specjalny poradnik na ten temat: https://developers.google.com/search/docs/advanced/guidelines/duplicate-content?visit_id=638055727535838033-3077750636&rd=1.
Duplikacja treści a SEO – podsumowanie
Duplikacja treści pod różnymi adresami to złożony temat, który wymaga działa u podstaw i szukania źródła problemu. Mając wiedzę, czym jest duplicate content i jak mu zapobiegać, można swobodniej działać i wprowadzać treści na stronie. W kontekście pozycjonowania najlepszym rozwiązaniem dla przypadków duplicate content jest praca webmasterów na etapie tworzenia witryny. Musi ona być poprawna technicznie, dzięki czemu będzie miała dobre podstawy do działań SEO.