Sitemaps

XML-Sitemap

Eine Sitemap fungiert quasi als Inhaltsverzeichnis, in dem alle verfügbaren URLs einer Domain sowie deren Hierarchie untereinander aufgelistet sind. Sie hilft Suchmaschinen-Crawlern bei ihrem Weg durchs Internet dabei, sich einen Überblick über Struktur und Inhalte einer Seite zu verschaffen und ansonsten schwer erreichbare Unterseiten zu erfassen. Vor allem bei Webseiten mit einer unübersichtlichen, tiefgehenden Seitenarchitektur ist die Implementierung einer Sitemap daher sehr sinnvoll.

Verschiedene Sitemap-Typen

Grundsätzlich wird zwischen zwei verschiedenen Arten von Sitemaps unterschieden: HTML- und XML-Sitemaps. Während erstere den (menschlichen) Website-Besuchern einen guten Überblick über eine Seite verschafft, ist letztere die bessere Lösung für die Suchmaschinenoptimierung. Bei XML-Sitemaps (XML = Extensible Markup Language, z. Dt. „erweiterbare Auszeichnungssprache“) handelt es sich um standardisierte Textdateien, mit denen neben den obligatorischen Informationen über alle in der Sitemap enthaltenen URLs (<urlset>, <url>, <loc>) weitere Daten wie beispielsweise das Datum der letzten Aktualisierung sowie Änderungsfrequenz oder Priorisierung der Seiteninhalte übermittelt werden können. Folgende Regeln sind dabei zu beachten:

  • Eine XML-Sitemap beginnt mit dem <urlset>-Tag und endet dementsprechend mit </urlset>
  • Die einzelne URLs werden durch ein übergeordnetes <url>-Tag markiert
  • In dem untergeordneten <loc>-Eintrag wird die URL der jeweilige Zielseite definiert
  • Optionale Tags innerhalb eines <url>-Eintrages sind:
    • <lastmod> (gibt das Datum der letzten Änderungen einer URL an)
    • <changefreq> (verweist auf die zu erwartende Änderungsfrequenz (z. B. „hourly“, „weekly“, „yearly“))
    • <priority> (beschreibt auf einer Skala von 0.1 bis 1 die Wichtigkeit einer URL gegenüber den anderen URLs der Website)

Erstellung und Implementierung einer XML-Sitemap

Eine XML-Sitemap muss nicht manuell erstellt werden. Im Internet stehen zahlreiche, teils kostenlose Tools und Plugins zur Verfügung, mit denen sich eine Sitemap automatisch erzeugen lässt. Nach der Erstellung wird die Sitemap mit einem möglichst eindeutigen Namen (z. B. sitemap.xml) in das Stammverzeichnis der eigenen Seite hochgeladen und zusätzlich in der robot.txt vermerkt (Sitemap: http://domain.de/sitemap.xml). Der einfachste Weg, Google über die neue Sitemap zu informieren, findet sich in der Google Search Console unter „Crawling“ > „Sitemaps“. Dort steht Nutzern unter anderem die Option „Sitemap hinzufügen/testen“ zur Verfügung.

Sitemap-Index

Eine Sitemap fungiert quasi als Inhaltsverzeichnis, in dem alle verfügbaren URLs einer Domain hierarchisch aufgelistet sind. Google und andere Suchmaschinen erkennen an der Sitemap, wie die Inhalte einer Website strukturiert sind. Dies erleichtert den Suchmaschinen die Indexierung der Website-Inhalte. Eine Sitemap darf nicht mehr als 50.000 URLs enthalten und im unkomprimierten Zustand maximal 50 MB groß sein. Bei einer größeren Seitenzahl müssen mehrere Sitemap-Dateien erstellt werden, die dann gemeinsam in einer Sitemap-Indexdatei aufgeführt werden können.

Aufbau einer Sitemap-Indexdatei

Das Format einer solchen Datei ist dem Format einer XML-Sitemap sehr ähnlich. Folgende Tags werden verwendet: Die Datei beginnt mit einem öffnenden <sitemapindex>-Tag und schließt mit </sitemapindex> Jede Sitemap eines Index benötigt einen <sitemap>-Eintrag als übergeordnetes XML-Tag Das <sitemap>-Tag wird mit einem untergeordneten <loc>-Eintrag versehen, der den Speicherort der Sitemap angibt.

Vergleichbar mit einer XML-Sitemap steht zusätzlich das optionale <lastmod>-Tag zur Verfügung, über das sich das Datum der letzten Änderung des Sitemap-Index angeben lässt. Grundsätzlich können nur Sitemaps aufgeführt werden, die sich auf derselben Domain wie die Sitemap-Indexdatei befinden. So wie die XML-Sitemap muss auch die Indexdatei in UTF-8 codiert sein.

Sitemaps in Search Console einreichen

XML Sitemap einreichen
Sitemaps-Menü in der Search Console mit der Option eine Sitemap zu testen bzw. einzureichen

Sitemaps sind Dateien, die quasi als Inhaltsverzeichnis einer Domain fungieren, in dem alle verfügbaren URLs aufgelistet werden. Sie sind der einfachste Weg, Suchmaschinen wie Google mitzuteilen, wie die Inhalte einer Website strukturiert sind. Eine Sitemap bietet den Webcrawlern eine gute Gelegenheit, auch schwer erreichbare Unterseiten zu erfassen und zu kategorisieren. Eine Sitemap sollte alle Seiten eines Projektes beinhalten, die in den Suchmaschinenindex aufgenommen werden sollen. Fehler in Sitemaps können dafür verantwortlich sein, dass die Crawler auf Seiten gesteuert werden, die eigentlich nicht indexiert werden sollen, aber in der Sitemap technisch ausgegeben werden.

Google das Crawling erleichtern

Um Google das Crawling der eigenen Domain zu erleichtern, kann man eine oder mehrere Sitemaps, die im XML-Format vorliegen sollten, in der Google Search Console einreichen. Folgende Schritte sind dazu nötig:

  • Gewünschte Seite auf Search Console-Startseite auswählen
  • Im Menü den Punkt Crawling und anschließend Sitemaps anklicken
  • Oben rechts erscheint dort der Button Sitemap hinzufügen/testen
  • In dem Eingabefeld URL-Pfad der Sitemap (z. B. sitemap.xml) angeben
  • Den Prozess mit einem Klick auf Sitemap einreichen abschließen

Sitemaps-Menü in der Search Console mit der Option eine Sitemap zu testen bzw. einzureichen

Nachdem die Sitemap eingereicht wurde, kann es einige Zeit dauern, bis Google sie verarbeiten und die URLs in der Sitemap crawlen und indexieren kann. Anschließend erhält man unter Sitemaps eine Übersicht der Daten, die Google der Sitemap entnommen hat, sowie etwaiger Probleme mit der Sitemap.