SEO: Was man über Duplicate Content wissen sollte

By 23. Dezember 2013SEO

Spricht man über Suchmaschinen-Optimierung, dann fällt früher oder später der Begriff Duplicate Content. Was hat es damit auf sich – und wie wichtig ist dieses Thema im Vergleich zu anderen SEO-Massnahmen?

Was ist Duplicate Content?

Duplicate Content liegt immer dann vor, wenn derselbe Inhalt über unterschiedliche URLs gefunden wird. Im wesentlichen kann man dabei zwei Fälle unterscheiden:

  • Fall A: mehrere unterschiedliche URLs zeigen auf dieselbe Webpage
  • Fall B: mehrere unterschiedliche Webpages verwenden eine Kopie desselben Contents

Da es nicht im Interesse eines Suchmaschinen-Benutzers ist, dieselbe Information mehrfach in der Trefferliste zu sehen, werden Webpages mit Duplicate Content von Suchmaschinen nach Möglichkeit ausgeblendet. In der Regel betrachtet Google die zuerst gecrawlte Page als das Original, alle später gefundenen Pages als Kopien.

Wie entsteht Duplicate Content?

Betrachten wir zunächst den Fall A: Wie kann es sein, dass dieselbe Webpage über unterschiedliche URLs erreichbar ist?

Beispiel 1: Während früher das „www“ am Anfang einer Web-Adresse fast zwingend war, geben heute viele Benutzer URLs ohne dieses führende „www“ ein. In aller Regel sind Webserver deshalb so konfiguriert, dass sie sowohl www.example.com als auch example.com verarbeiten können. Die entscheidende Frage ist aber, ob einfach beide Schreibweisen akzeptiert werden oder ob eine Weiterleitung von example.com auf www.example.com stattfindet. Fehlt die Weiterleitung, dann sind example.com/products/model-123.html und www.example.com/products/model-123.html zwei unterschiedliche URLs, die jedoch Duplicate Content zurückliefern.

Beispiel 2: Besitzt man mehrere Domains, aber nur eine einzige Website, dann werden diese Domains in der Regel derselben Website zugewiesen. Dies führt dazu, dass beim Aufruf der drei folgenden URLs immer dieselbe Webpage ausgeliefert wird und Google folglich Duplicate Content feststellt:

  • www.example.com/products/model-123.html
  • www.example.net/products/model-123.html
  • www.example-germany.de/products/model-123.html

Beispiel 3: Dynamische Websites (und das sind heutzutage die meisten) ergänzen URLs mit Parameterwerten (sog. Query String). Unter Umständen führen aber unterschiedliche Query Strings zu denselben Resultaten. Ein sehr einfaches Beispiel mag dies illustrieren: Bereits eine Veränderung der Parameterreihenfolge erzeugt unterschiedliche URLs – die Website liefert aber trotzdem dieselbe Page aus (und generiert damit in den Augen einer Suchmaschine Duplicate Content):

  • www.example.com/index.php?a=1&b=2
  • www.example.com/index.php?b=2&a=1

Selbst wenn die Parameter im Query String unterschiedlich sind, kann es durchaus sein, dass die resultierende Webpage inhaltlich identisch ist:

  • www.example.com/index.php?category=smartphones
  • www.example.com/index.php?category=smartphones&sortorder=default
  • www.example.com/index.php?category=smartphones&session-id=h37ekojpf4432c93

Beispiel 4: Sprechende URLs – also nicht-technische, aussagekräftige und gut memorisierbare Web-Adressen – sind sowohl für die Usability als auch für die Suchmaschinen-Optimierung von Vorteil. Fast alle Content-Management-Systeme bieten deshalb die Möglichkeit, jeder Webpage manuell eine sprechende URL zuzuweisen. Technisch gesehen ist dies aber nichts anderes als eine Umleitung, und somit ist eine solche Webpage über zwei unterschiedliche URLs erreichbar:

  • www.example.com/shop.php?productid=123
  • www.example.com/apple/iphone/5c

Sofern man nicht aktiv verhindert, dass der Google Bot beide URLs findet, wird man auch hier mit der Duplicate-Content-Problematik konfrontiert.

Wie problematisch ist Duplicate Content?

Wenden wir uns nun dem Fall B zu: Wie kann es sein, dass derselbe Content auf unterschiedlichen Webpages auftaucht? Natürlich kann es sich um unerlaubte Kopien handeln – aber in der Regel sind Plagiatoren und Content-Piraten das kleinere Problem. Viel häufiger werden dieselben Texte von den Urhebern selbst mehrfach eingesetzt: Betreibt ein Unternehmen beispielsweise je eine Länder-Website für Deutschland, Österreich und die Schweiz, dann sind die deutschen Produktbeschreibungen in aller Regel identisch. Zudem gibt es auch erwünschte Formen von Inhaltskopien auf Dritt-Websites – bespielsweise wenn PR-Portale eine Medienmitteilung wörtlich wiedergeben.

Insgesamt gibt es also viele Möglichkeiten, wie Duplicate Content entsteht. Und in den meisten Fällen steht keine böse Absicht dahinter, die Google als Missbrauch werten und abstrafen müsste. In diesem Sinne hat sich auch Googles SEO-Spezialist Matt Cutts in seinem jüngsten Video geäussert: „Duplicate content does happen.“ Solange nicht ein klarer Fall von Spamming vorliege, werde Google zwar die Kopien aus dem Suchresultat ausblenden, die Websites deswegen aber nicht abstrafen.

Fazit: Die Problematik des Duplicate Content wird tendenziell überbewertet. Zumindest ist die Befürchtung, sein Ranking durch die mehrfache Verwendung derselben Texte zu verschlechtern, meist unbegründet. Trotzdem sollte man im Rahmen der Suchmaschinen-Optimierung Duplicate Content soweit möglich verhindern oder – falls er sich nicht verhindern lässt – Google zumindest mitteilen, wo das Original zu finden ist (auch dazu gibt es ein ausführliches Video von Matt Cutts).

Leave a Reply