Porträt von Michael Kienzler

Über den Autor: Michael Kienzler

Michael Kienzler ist Partner und Gründer von OLDSCHOOLSEO. Seine Arbeit beginnt bei der Analyse der technischen Architektur und der Daten, um daraus die Potenziale für die redaktionelle und strategische Weiterentwicklung abzuleiten.

Umgang mit Duplicate Content: Ursachen und technische Lösungen

Was ist Duplicate Content?

Antwort: Duplicate Content (doppelter Inhalt) bezeichnet Inhalte, die auf mehreren URLs entweder identisch oder in wesentlichen Teilen ähnlich sind. Suchmaschinen haben Schwierigkeiten zu entscheiden, welche der URLs die maßgebliche Version ist, die in den Suchergebnissen angezeigt werden soll.

Was ist der Unterschied zwischen Duplicate Content und Boilerplate Content?

Antwort: Duplicate Content bezieht sich auf den Hauptinhalt (main content) einer Seite, der auf mehreren URLs identisch ist. Boilerplate Content bezeichnet wiederkehrende Inhaltsblöcke, die auf vielen Seiten einer Website identisch sind, wie Header, Footer oder Navigationsmenüs. Suchmaschinen erkennen Boilerplate Content und ignorieren ihn bei der Bewertung des einzigartigen Hauptinhalts einer Seite. Boilerplate Content ist normal und kein technisches Problem, solange der Hauptinhalt der Seite einzigartig ist.

Warum ist Duplicate Content ein Problem für SEO?

Antwort: Duplicate Content ist aus zwei Gründen problematisch:

  1. Verwässerung von Ranking-Signalen: Wenn externe Links auf verschiedene Versionen desselben Inhalts verweisen, verteilen sich die Ranking-Signale auf mehrere URLs, anstatt sich auf eine URL zu konzentrieren.
  2. Ineffiziente Nutzung des Crawl-Budgets: Suchmaschinen-Bots verwenden Ressourcen, indem sie mehrfach dieselben Inhalte crawlen, anstatt neue Inhalte zu entdecken. Google straft Duplicate Content nicht aktiv ab, es sei denn, es liegt eine manipulative Absicht vor.

Was sind häufige technische Ursachen für Duplicate Content?

Antwort: Duplicate Content entsteht oft unbeabsichtigt durch technische Konfigurationen:

  • Protokoll- und Subdomain-Varianten: Die Website ist unter http://, https://, www. und non-www erreichbar.
  • URL-Parameter: Tracking-Parameter, Session-IDs oder Filter- und Sortierfunktionen erzeugen neue URLs mit identischem Kerninhalt.
  • Index-Dateien: Die Startseite ist unter domain.de/ und domain.de/index.html erreichbar.
  • Druckversionen: Separate, für den Druck optimierte URLs.
  • Content-Syndication: Inhalte werden auf externen Websites erneut veröffentlicht.

Wie wird Duplicate Content behandelt, der über mehrere Domains hinweg entsteht?

Antwort: Wenn Inhalte absichtlich auf mehreren Domains veröffentlicht werden (Cross-Domain Duplicate Content ), muss Google die Originalquelle mitgeteilt werden:

  • Canonical Tag: Die Domain, die den Inhalt wiederveröffentlicht, sollte einen Cross-Domain Canonical Tag implementieren, der auf die URL des Originalartikels verweist.
  • 301-Weiterleitung: Bei einem permanenten Domain-Umzug ist eine domainweite 301-Weiterleitung von allen alten URLs auf die neuen URLs die korrekte Methode.

Wie wird der Canonical Tag zur Lösung von Duplicate Content eingesetzt?

Antwort: Der Canonical Tag (rel="canonical") ist ein HTML-Element im <head>-Bereich einer Seite. Er signalisiert Suchmaschinen, welche URL die bevorzugte (kanonische) Version eines Inhalts ist. Alle anderen Versionen sollten einen Canonical Tag enthalten, der auf diese bevorzugte URL verweist. Dadurch werden die Ranking-Signale auf die kanonische URL konsolidiert.

Wann sind 301-Weiterleitungen die korrekte Lösung?

Antwort: Eine permanente 301-Weiterleitung ist die Lösung, wenn eine URL dauerhaft durch eine andere ersetzt wird und der Nutzer ebenfalls zur neuen URL geleitet werden soll. Dies ist der Standardfall bei der Konsolidierung von Protokoll- und Subdomain-Varianten. Im Gegensatz zum Canonical Tag, der nur ein Hinweis für Bots ist, leitet eine 301-Weiterleitung sowohl Bots als auch Nutzer um.

Was ist die Schlussfolgerung für eine technische SEO-Strategie?

Antwort: Eine proaktive Strategie zur Vermeidung von Duplicate Content ist ein Bestandteil des technischen SEO. Die erste Maßnahme ist die serverseitige Konfiguration, um sicherzustellen, dass die Website nur unter einer Protokoll- und Domain-Variante erreichbar ist (mittels 301-Weiterleitungen). Für andere Fälle von unvermeidbarem Duplicate Content ist der Canonical Tag das primäre Instrument zur Konsolidierung von Ranking-Signalen.

Integration in die technische SEO-Strategie

Die Vermeidung von Duplicate Content sorgt für Klarheit in der Kommunikation mit Suchmaschinen.