XML-Sitemaps: Erstellung, Einreichung und Best Practices
Was ist eine XML-Sitemap?
Antwort: Eine XML-Sitemap ist eine Datei im XML-Format, die für die Indexierung relevante URLs einer Website auflistet. Sie dient Suchmaschinen als "Inhaltsverzeichnis" und unterstützt sie dabei, alle Seiten einer Domain zu entdecken. Dies ist für große Websites, neue Websites mit wenigen externen Links oder Websites mit komplexen Linkstrukturen von Bedeutung.
Welche Informationen enthält eine XML-Sitemap?
Antwort: Jede URL wird in einem <url>-Block definiert, der ein obligatorisches <loc>-Tag für die URL selbst enthält. Optional können weitere Tags hinzugefügt werden:
- →
<lastmod>: Das Datum der letzten Änderung der Seite imYYYY-MM-DD-Format. Dies hilft Crawlern, aktualisierte Inhalte zu priorisieren. - →
<changefreq>: Ein Hinweis, wie häufig sich der Inhalt ändert. Google ignoriert dieses Tag mittlerweile. - →
<priority>: Gibt die relative Wichtigkeit einer URL an. Auch dieses Tag wird von Google ignoriert.
Wie werden XML-Sitemaps dynamisch generiert und aktuell gehalten?
Antwort: Bei Websites mit sich ändernden Inhalten ist eine manuelle Pflege nicht praktikabel. Die Generierung erfolgt automatisiert:
- →CMS-Plugins: Content-Management-Systeme (z.B. WordPress, Shopify) und SEO-Plugins generieren und aktualisieren die XML-Sitemap automatisch, wenn Inhalte erstellt, geändert oder gelöscht werden.
- →Server-Skripte: Bei Eigenentwicklungen werden oft ereignisgesteuert oder in Intervallen Skripte ausgeführt, die die Datenbank abfragen und die Sitemap-Datei neu erstellen. Eine dynamische Sitemap stellt sicher, dass Suchmaschinen über den aktuellen Stand der indexierbaren Inhalte informiert sind.
Was sind die Best Practices für die Erstellung von XML-Sitemaps?
Antwort:
- →Nur indexierbare URLs aufnehmen: Die Sitemap sollte ausschließlich URLs enthalten, die einen HTTP-Statuscode 200 (OK) zurückgeben und nicht per
robots.txtgesperrt oder pernoindex-Tag von der Indexierung ausgeschlossen sind. - →Absolute URLs verwenden: Alle URLs im
<loc>-Tag müssen vollständig und absolut sein. - →UTF-8-Kodierung verwenden: Die Datei muss UTF-8-kodiert sein.
- →Größenbeschränkungen einhalten: Eine Sitemap-Datei darf nicht größer als 50 MB sein und nicht mehr als 50.000 URLs enthalten.
- →Sitemap-Indexdateien verwenden: Bei Überschreitung der Limits werden mehrere Sitemaps erstellt und in einer Sitemap-Indexdatei zusammengefasst.
Welche spezialisierten Sitemap-Typen gibt es?
Antwort: Neben der Standard-Sitemap für Webseiten gibt es Formate für bestimmte Inhaltstypen:
- →Bilder-Sitemap: Enthält URLs von Bildern zur Förderung deren Indexierung in der Bildersuche.
- →Video-Sitemap: Enthält Informationen zu Videoinhalten wie Titel, Dauer und Vorschaubild-URL.
- →Nachrichten-Sitemap (Google News Sitemap): Speziell für Nachrichten-Publisher, um neue Artikel in Google News zu bekommen. Sie dürfen nur Artikel der letzten 48 Stunden enthalten.
Wie wird eine XML-Sitemap bei Suchmaschinen eingereicht?
Antwort: Es gibt zwei Methoden, um Suchmaschinen auf eine Sitemap aufmerksam zu machen:
- →Einreichung in der Google Search Console: Dies ist die empfohlene Methode. Google gibt hier Feedback zum Verarbeitungsstatus und zu Fehlern.
- →Referenz in der
robots.txt-Datei: Durch Hinzufügen der ZeileSitemap: https://www.domain.de/sitemap.xmlin derrobots.txt-Datei können alle Suchmaschinen-Bots den Speicherort der Sitemap finden.
Wie kann eine XML-Sitemap zur Diagnose von Indexierungsproblemen genutzt werden?
Antwort: Die Google Search Console bietet einen "Seiten"-Bericht, der die Indexierung der eingereichten Sitemap-URLs analysiert. Durch den Vergleich der "eingereichten und indexierten" URLs mit den "eingereichten, aber nicht indexierten" URLs lassen sich Probleme identifizieren. Häufige Gründe für die Nicht-Indexierung sind noindex-Tags, Blockaden durch die robots.txt, die Einstufung als Duplikat oder Qualitätsprobleme ("Gecrawlt – zurzeit nicht indexiert" ). Die Sitemap dient somit als Referenzliste zur gezielten Fehleranalyse.
Was ist die Schlussfolgerung für eine technische SEO-Strategie?
Antwort: Eine XML-Sitemap ist ein Werkzeug der technischen Suchmaschinenoptimierung. Sie beschleunigt den Prozess der Entdeckung von Inhalten durch Suchmaschinen. Eine fehlerfreie und dynamisch aktualisierte Sitemap ist ein Merkmal einer technisch gepflegten Website. Die Überprüfung der Sitemap-Berichte in der Google Search Console ist zur Fehlererkennung erforderlich.
Integration in die technische SEO-Strategie
XML-Sitemaps sind ein proaktives Kommunikationsmittel mit Suchmaschinen-Crawlern.
- →Crawling und Indexierung – Die Sitemap ist eine der Säulen der Crawl-Steuerung, neben der
robots.txtund den Meta-Tags. - →Umgang mit Duplicate Content – In die Sitemap gehören ausschließlich die kanonischen Versionen der URLs.
- →hreflang-Tags für mehrsprachige Websites – Die XML-Sitemap ist eine Methode zur Implementierung von
hreflang-Annotationen.
Mit Thematischem Bezug
- →Erstellung von lokalen Landingpages für verschiedene Standorte
- →Programmatic SEO: Massenhafte Erstellung von Content
