Duplicate Content vermeiden

Duplicate Content - Doppelte Seiteninhalte auf unterschiedlichen URLs

Wenn derselbe Inhalt auf mehreren Webseiten veröffentlicht wird, spricht man von Dupliate Content. Dabei kann es sich um kopierte Einzelseiten oder größere Content-Blöcke handeln.

Liegt doppelter Inhalt an mehreren Orten vor, haben die Suchmaschinen mit ihrem Algorhythmus Schwierigkeiten.

Sie können nicht entscheiden, welche der Versionen für den Nutzer am relevantesten ist. Dies stellt ein ernstes Problem für Dein Ranking dar.

Du solltest als Webmaster Duplicate Content also sehr ernst nehmen.

Duplicate Content - Doppelte Seiteninhalte auf unterschiedlichen URLs

Was genau ist Duplicate Content?

Nicht jeder gleiche Satz gilt sofort als Kopie. Wenn Du aber größere Abschnitte einer Seite kopierst und auf einer anderen Seite veröffentlichst, zählt das als Duplikat. Eine Besonderheit sind Zitate. Wenn Du Zitate anwendest, gib diese semantisch im Quelltext an, damit Google sie nicht als Dopplung erkennt. Auch Texte in mehreren Übersetzungen gelten nicht als Duplicate Content, wenn sie sich auf einer Domain befinden. Übrigens reicht es nicht aus, jeden Satz ein wenig umzuschreiben. Google wird das mit Sicherheit bemerken.

Unter Duplicate Content (engl. für „doppelter Inhalt“) werden identische Inhalte verstanden, die auf mehreren Websites vorkommen. Bei Duplicate Content handelt es sich somit sowohl um Kopien von Textbausteinen als auch um komplett identische Einzelseiten. Das Gegenteil von Duplicate Content ist der sogenannte „Unique Content“ (engl. für „einzigartiger Inhalt“), der nur auf einer Website vorkommt.

Was ist interner und externer Duplicate Content?

Duplicate Content kann in zwei Formen vorkommen: Als interner oder als externer Duplicate Content.

Intern bedeutet, dass sich identische Inhalte innerhalb einer Domain, also beispielsweise seo-doktor.de, befinden. Extern bedeutet, dass der gleiche Inhalt auf unterschiedlichen Domains vorkommt, also zum Beispiel auf seo-doktor.de und auf wikipedia.de.

Interner Duplicate Content kann sowohl durch Textkopien auf verschiedenen Unterseiten entstehen als auch durch das Vorhandensein identischer Inhalte unter mehreren URLs. In Online-Shops sind Produktseiten häufig direkt oder über eine bestimmte Produktkategorie abrufbar. Dabei können zwei verschiedene URLs mit gleichem Inhalt entstehen, die von Suchmaschinen als Inhaltsduplikate erkannt werden.

Externer Duplicate Content ist domainübergreifend und entsteht, wenn ein Text von einer anderen (externen) Website kopiert wurde. Als Betreiber einer Webseite musst Du jedoch auch in einem weiteren Fall auf die Entstehung von externem Duplicate Content achten. Wenn eine Website über mehrere Domainnamen erreichbar ist (z.B. seo-doktor.net und seo-doktor.info), sollten alle Domainvarianten mittels einer 301-Weiterleitung auf die entsprechende Hauptdomain (z.B. seo-doktor.de) verweisen. Sofern dies nicht geschieht, erkennen die Bots der Suchmaschinen Inhaltsduplikate auf den verschiedenen Domainvarianten.

Wobei handelt es sich nicht um Duplicate Content?

Website-Betreiber wollen ihre Seite häufig in mehrere Sprachen übersetzen und online stellen. Eine häufig in diesem Zusammenhang auftretende Frage ist, ob ein identischer Inhalt in mehreren Sprachen als Duplikat gewertet wird. Die Antwort darauf ist ein klares Nein. Übersetzte Inhalte werden von Suchmaschinen-Bots als solche erkannt und nicht als doppelte Inhalte gewertet.

Aus Sorge vor Duplicate Content vermeiden Website-Betreiber vielmals auch die Zitierung von Inhalten anderer Websites. Auch diese Sorge ist unbegründet, denn solange bei der Zitierung auf die korrekte semantische Auszeichnung geachtet wird, werden Zitate und zitierte Textpassage nicht als doppelte Inhalte gewertet.

Wie schädlich ist Duplicate Content?

Über kaum ein Thema wird im Internet so viel berichtet und diskutiert wie über die Frage, wie schädlich Duplicate Content für eine Website ist. Da niemand die genaue Funktionsweise der Algorithmen von Suchmaschinen kennt (vor allem jener von Google), ranken sich viele Mythen um diese Frage.

Die Fachwelt ist sich einig, dass Doppelungen von Inhalten generell schädlich für eine Website sind. Das zugrundeliegende Problem ist, dass Google und andere Suchmaschinen bestrebt sind, ihren Nutzern die besten und passendsten Resultate zu einer bestimmten Suchanfrage zu liefern. Wenn der Google-Bot identische Inhalte im Internet findet, steht Google vor der Frage, welcher der Inhalte wichtiger und authentischer ist.

Websites, auf denen doppelte Inhalte vorkommen, sind grundsätzlich anfälliger für Schwankungen in den Suchergebnissen. Für Google ist nicht ersichtlich, ob der doppelte Inhalt für den Nutzer einen Mehrwert bietet oder nicht. Im schlimmsten Fall kann das Vorhandensein von Inhaltsduplikaten von Google als Betrugsversuch gewertet und die Website im Ranking abgestraft werden. Als Website-Betreiber solltest Du dem Thema ein hohes Maß an Aufmerksamkeit widmen und Dir regelmäßig bewusst machen, dass eine perfekte Website zu 100 Prozent aus Unique Content besteht.

User Experience geht vor: Warum Google Probleme mit Duplicate Content hat

Der Google Algorithmus geht nach bestimmten Regeln vor, um Suchergebnisse zu ranken. Identischer Inhalt auf mehreren Seiten wird hart bestraft. Eine Suchmaschine verfolgt das Ziel, den Nutzern eine perfekte User Experience zu liefern. Stößt Google auf Duplicate Content, löst das Probleme aus. Welche der Versionen am relevantesten für den Nutzer ist, versteht die Suchmaschine nicht. Wenn zwei verschiedene URLs zum identischen Inhalt führen, erschwert dies die Verleihung der Link Authority. Ein wichtiger Grundsatz im Content-Marketing ist Einzigartigkeit. Duplicate Content bietet den Nutzern keinen Mehrwert und beeinflusst zugleich das Suchmaschinen-Ranking negativ. Es lohnt sich also, in Unique Content zu investieren.

Google bestraft Duplicate Content

Mit Duplicate Content kann es zu Indexierungsproblemen kommen. Wenn es für Google nicht klar ersichtlich ist, ob es sich um Original-Inhalt handelt, verliert Deine Seite organischen Traffic. Gleichzeitig nimmt sie eine schlechtere Position im Ranking ein. Es ist sogar möglich, dass Duplicate Content als Betrugsversuch interpretiert wird. Beachte dabei: Google akzeptiert doppelten Content, wenn Du ihn als solchen ausweist. Hält die Suchmaschine den Duplicate Content für einen Betrugsversuch, besteht die Gefahr, dass Deine Webseite aus den Suchergebnissen verschwindet. Google legt Wert darauf, den Nutzern ausschließlich relevante Ergebnisse anzuzeigen. Dies macht deutlich, wie wichtig es ist, Duplicate Content ausfindig zu machen, ihn zu vermeiden oder ihn transparent auszuweisen.

Wie findest Du Duplicate Content?

Der einfachste Weg, Inhaltsduplikate auf Deiner Website festzustellen, ist, die Inhalte Deiner Seite in Form von Textbausteinen in der Suchfunktion von Google einzugeben. Wenn Du den Textbaustein in Anführungszeichen setzt, erhältst Du über die Google-Suche alle Websites, die einen identischen Text enthalten.

Für eine Website mit viel Text wäre diese Methode jedoch zugegebenermaßen etwas umständlich. Schneller kommst Du mit der Search Console von Google ans Ziel. Dort gibt es einen Report namens „Indexabdeckung“. Wenn Du darin auf „Ausgeschlossen“ klickst, bekommst Du eine Liste derjenigen URLs Deiner Website geliefert, die aus unterschiedlichen Gründen von der Indexierung durch Google ausgeschlossen wurden. Dazu zählen auch Seiten, die von Google als Duplikat einer anderen URL eingestuft wurden.

Neben der Google Search Console kannst Du alternativ eine Vielzahl von Onpage-Optimierungstools verwenden. Wenn Du einen Suchbegriff wie „Duplicate Content Check“ bei Google eingibst, findest Du Dutzende von Anbietern, die Dich beim Auffinden von doppelten Inhalten unterstützen.

So findest Du Duplicate Content mit der Google Search Console

Die Google Search Console findet schnell die Seiten, die als Duplikate verdächtigt werden. Klicke dazu unter der Spalte „Index“ auf „Abdeckung“. Nun siehst Du, welche Seiten Google indexiert, welche nicht und aus welchem Grund. Unter dem Reiter „Ausgeschlossen“ listet Google alle Seiten auf, die es nicht indexiert hat. Eine andere Methode, Duplicate Content zu finden, ist die direkte Suche durch Eingabe von Texten oder prägnanten Abschnitten. Dazu brauchst Du sie nur mit Anführungszeichen in die Suchmaske einzugeben. Liegt Duplicate Content vor, zeigt Google mehrere Suchtreffer an. Dir ist sicherlich schon aufgefallen, dass Google doppelte Suchergebnisse größtenteils ausblendet. Es erscheint der Hinweis, dass nur die relevantesten Treffer angezeigt werden. Du kannst auch kostenlose Tools wie den Duplicate-Content-Checker verwenden, um doppelten Content aufzuspüren. Siteliner ist ein Tool, das Wiederholungen auf Deiner eigenen Domain überprüft und aufzeigt. Über Canonical Tags kannst Du der Suchmaschine bei mehreren Versionen des selben Inhalts mitteilen, welcher der wichtigere ist. Kennzeichne dazu im Backend die kanonische Seite und alle Variationen durch das Linkelement rel=“canonical“. Die genaue Erklärung zu Canonical URLs und weitere Hilfestellungen findest Du auf Google Supportseite.

Wie kannst Du Duplicate Content vermeiden?

Die einfachste Antwort auf diese Frage ist, doppelte Inhalte erst gar nicht entstehen zu lassen. Manche Websites sind jedoch aufgrund ihrer URL-Struktur auf doppelte Inhalte angewiesen. In diesem Fall solltest Du als Website-Betreiber darauf achten, dass die Seiten mit dem Duplikat per 301-Weiterleitung auf die gewollte Original-URL weiterleiten.

Wie bereits zuvor dargestellt, kann interner Duplicate Content auch durch bestimmte Sortierungen, Affiliate-Links und Navigationsstrukturen entstehen. In diesen Fällen solltest Du unbedingt mittels Canonical-Link auf die Original-URL verweisen. Suchmaschinen verstehen dann, dass es sich um eine gewollte Doppelung eines Inhalts handelt.

Häufige Ursachen: So entsteht Duplicate Content

Doppelter Inhalt entsteht sowohl intern als auch extern, manchmal sogar unbewusst. Interner Duplicate Content: Wenn Nutzer den selben Inhalt über mehrere URLs ansteuern können, ist das aus Sicht der Suchmaschinen eine Duplizierung. Dazu gehören druckfreundliche Seiten, PDF-Unterseiten und Variationsseiten. Bei Online-Shops mit einer Vielzahl von Unter- und Kategorieseiten beispielsweise führen verschiedene Linkstrukturen zum selben Artikel.

Beispiel:

https://www.exampleshop.de/category1/productpage/product1
https://www.exampleshop.de/product1

Google indexiert dies als Duplicate Content. Externer Duplicate Content hat mehrere Ursachen: Betreibst Du als Unternehmer ähnliche Online-Projekte auf unterschiedlichen Webseiten, besteht die Gefahr des Duplicate Contents. Ein häufiges Problem stellen wortgleiche Pressemitteilungen dar, die sowohl auf Deiner als auch auf anderen Seiten veröffentlicht werden. Wenn Du mit einem Partner eine Content-Kooperation eingehst, besteht die Gefahr einer völlig rechtmäßigen Duplizierung der Inhalte. Immer wieder passieren Content-Diebstähle. Wenn Dein Unique Content auf einer fremden Webseite auftaucht, erkennt Google unter Umständen das Original nicht mehr.

Einzigartiger Content ist König

Beschäftigt man sich intensiv mit dem Thema Duplicate Content, wird deutlich: Einzigartiger Content hat einen positiven Einfluss auf das Ranking Deiner Seite. Er bietet Deinen Kunden einen Mehrwert und ermöglicht Dir, Dich positiv von Deinen Wettbewerbern zu unterscheiden. Ist Duplicate Content auf Deiner eigenen Seite nicht zu vermeiden, versehe ihn mit Canonical-Tags. Auch andere Seitenbetreiber oder Kooperationspartner, die nach Absprache Deine Inhalte duplizieren, sollten die entsprechenden Inhalte modifizieren oder mit einem Canonical-Tag versehen.

Häufige Fragen und Antworten

Was ist Duplicate Content?
Unter Duplicate Content versteht man doppelte Inhalte, die über mehrere URLs erreichbar sind.
Ist Duplicate Content ein Problem?
Duplicate Content verursacht Suchmaschinen wie Google massive Probleme. Diese Probleme schlagen sich in häufig in wechselnden Rankings nieder.
Wie beeinflusst Duplicate Content das Ranking?
Duplicate Content schlägt sich in häufig in wechselnden Rankings nieder und kann zum Ausschluss einer URL führen.