StrategieVier - Die Agentur für Webentwicklung, SEO & Businessfotografie

XML-Sitemap für SEO: was sie bringt und worauf du achten musst

XML-Sitemaps spielen bei der technischen Suchmaschinenoptimierung oft eine zentrale Rolle: Sie stellen Google und anderen Suchmaschinen alle URLs einer Website im maschinenlesbaren XML-Format zur Verfügung, so dass die Suchmaschinen die URLs nur noch crawlen und indexieren müssen.

Was du bei der Erstellung einer XML-Sitemap beachten solltest, warum sie aus SEO-Sicht oft überschätzt wird und warum du sie trotzdem verwenden solltest, erfährst du in diesem Artikel.

Das Wichtigste in Kürze

  • XML-Sitemaps helfen Google und anderen Suchmaschinen neue URLs zu erkennen, um diese zu crawlen und zu indexieren
  • Eine Sitemap kann Informationen zu Seiten, Bildern oder Videos beinhalten.
  • Das Ranking wird durch eine Sitemap nicht beeinflusst

Was ist eine Sitemap?

Wie der Name schon sagt, ist eine Sitemap eine „Karte“ oder besser ein Plan einer Website. Es gibt zwei Arten von Sitemaps:

HTML-Sitemaps und XML-Sitemaps

  • HTML-Sitemap: Sie stellt die Struktur einer Website in Form eines HTML-Dokuments dar, so dass sie sowohl von Suchmaschinen als auch von Menschen gelesen werden kann.
  • XML-Sitemap: Sie werden im maschinenlesbaren XML-Format aufbereitet und können so vor allem von Suchmaschinen und anderen Website-Crawlern verarbeitet werden.
Das Bild zeigt eine HTML-Sitemap der Website zeit.de
HTML Sitemap auf zeit.de

Google hat 2005 damit begonnen, Webmastern die Möglichkeit zu geben, die Struktur ihrer Website als XML-Datei bei Google einzureichen, um das Crawling der Website zu beschleunigen. Neben Links sind XML-Sitemaps also ein weiteres Mittel, um eine URL von Google indizieren zu lassen.

Seit 2007 bietet auch Microsoft Bing an, die Struktur der Website als XML-Datei zu übermitteln.

Nachdem die Sitemap bei Google oder Bing eingereicht wurde, werden die darin enthaltenen URLs in die Liste der zu crawlenden URLs aufgenommen und gecrawlt, sobald sie an der Reihe sind.

Auf dem Bild ist ein lächelnder Mann, der ein Smartphone in der Hand hält.

Du willst SEO lernen und verständlich erklärt bekommen?

Website-Potentiale erkennen, Keywords recherchieren, SEO-Texte schreiben: Wir zeigen Marketing-Abteilungen, wie sie ihre Websites systematisch bei Google nach oben bekommen.

Auswirkungen von Sitemaps auf das Crawling, Indexierung und Ranking

Damit sind wir beim Punkt, warum Sitemaps oft überschätzt werden: Sie können zwar das Crawling beschleunigen, haben aber keinen positiven Einfluss auf das Ranking der Website in den Suchergebnissen. Dies hat Gary Illyes von Google 2019 auf Twitter bestätigt:

Twitter

Mit dem Laden des Tweets akzeptieren Sie die Datenschutzerklärung von Twitter.
Mehr erfahren

Inhalt laden

Auch wenn der Einsatz einer XML-Sitemap kein Rankingfaktor ist, können sie trotzdem einiges an Mehrwert bringen:

  • Auffindbarkeit: Suchmaschinen können Unterseiten, die schlecht verlinkt sind, über die XML-Sitemap leicht auffinden und crawlen
  • Alternative Content-Formate: Sitemaps sind nicht darauf begrenzt, Verweise auf HTML-Seiten zu enthalten. Sie können auch Links zu Bildern und Videos enthalten
  • Sprachsteuerung: als Alternative zu hreflang-Attributen im HTML können auch XML-Sitemaps verweise auf alternative Sprachen der Website beinhalten

Auch wenn die Verweise in einer Sitemap keinen Page Rank vererben und auch sonst keinen Rankingvorteil bringen, können sie sich dennoch positiv auf das Abschneiden einer Website in den Suchergebnissen auswirken. Denn je schneller und umfangreicher eine Website indexiert wird, desto höher sind ihre Rankingchancen.

Darüber hinaus sind Sitemaps eine gute Möglichkeit, sich einen Überblick über alle relevanten URLs einer Website zu verschaffen. Das macht sie auch für kleinere Websites wertvoll.

Mit Hilfe einer Sitemap kann z.B. in der Search Console überprüft werden, wie viele der an Google über die Sitemap gesendeten URLs indiziert sind. Auch Crawler wie Screaming Frog können auf die Sitemap zugreifen, um beim Crawlen der Website alle wichtigen Seiten zu finden.

Das Bild zeigt eine grafische Benutzeroberfläche der Search Console mit Statistiken zur Seitenindexierung einer Sitemap und Impressionen über einen Zeitraum.

Das bringt uns zum nächsten Punkt:

Was sollte in einer XML-Sitemap enthalten sein (und was nicht)?

Grundsätzlich sollte jede URL, die indexiert werden soll, auch in der XML-Sitemap enthalten sein. Da Sitemaps in der Regel automatisiert erstellt werden, können folgende Anforderungen an die Entwickler gestellt werden:

Die Sitemap sollte Seiten beinhalten, die alle dieser Punkte erfüllen:

  • Alle URLs, die eine Meta Robots Angabe index haben
  • Alle URLs, die über ein selbst referenzierendes Canonical Tag verfügen
  • Alle URLs, die mit einem Status Code 200 antworten

Nicht enthalten sein sollten URLs, die nicht alle der oben genannten Punkte erfüllen oder

  • per Robobts.txt vom Crawling ausgeschlossen sind

💡 Sitemaps manuell erstellen
Wenn dein System nicht in der Lage ist, Sitemaps automatisch zu erstellen, findest du weiter unten einige Empfehlungen für Sitemap-Generatoren.

Aufbau einer XML-Sitemap

Der Aufbau einer einfachen XML-Sitemap ist relativ simpel: Am Anfang steht immer ein XML-Tag, das die XML-Version und den Zeichensatz (Encoding) enthält:

<?xml version="1.0" encoding="UTF-8"?>

Gemäß den Spezifikationen von sitemaps.org muss der Zeichensatz UTF-8 sein.

Anschließend folgt ein urlset-Tag, das alle weiteren Inhalte umschließt und außerdem einen Verweis auf das Sitemap-Protokolls (den Namespace) enthält (in der Regel: https://www.sitemaps.org/schemas/sitemap/0.9/)

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
</urlset> 

In dieses urlset-Tag eingebettet werden nun die eigentlichen Verweise auf die in der Sitemap enthaltenen URLs. Diese wiederum sind in ein url bzw. loc-Tag eingebettet:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
  </url>
</urlset>

Für jeden weiteren Eintrag folgt eine weiteres url und loc-Tag innerhalb des urlset-Tags:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
  </url>
  <url>
    <loc>http://www.domain.de/unterseite-2.html</loc>
  </url>
</urlset>

Damit ist die Sitemap bereits einsatzfähig.

Es können auch zusätzliche informationen über einzelne URLs per Sitemap an Suchmaschinen übergeben werden:

  • lastmod: Das Datum der letzten Aktualisierung der URL im Format YYYY-MM-DD.
  • changefreq: Wie häuifig die URL aktualisiert wird, z. B. hourly oder daily
  • priority: Die Priorität der URL im Verlgleich zu den restlichen URLs der Website.

💡 Attribute und ihre Bedeutung
In welcher Form diese Tags von Google verwendet werden, ist umstritten. bzw. es kursieren widersprüchliche Aussagen im Netz. Im Podcast “Search off the Record” vom Mai 2022 sagt Gary Illyes, dass Google keines dieser Tags verwendet. Zwei Jahre zuvor meinte John Mueller noch, dass Google bei korrekter Verwendung das lastmod-Tag zur Priorisierung des Crawlings nutzen könne. (Quelle). Grundsätzlich kann davon ausgegangen werden, dass alle Angaben in der Sitemap durch Crawling überprüft werden.

Wie bereits angedeutet, können Sitemaps weit mehr als nur Verweise auf HTML-Dokumente enthalten:

Bilder-Sitemap

Sehr hilfreich für die Verschlagwortung von Bildern ist die Verwendung einer Image Sitemap. Diese muss nicht separat erstellt werden, sondern kann die Bilder, die zu einer bestimmten Seite gehören, strukturiert auflisten.

Dazu muss die Sitemap lediglich um ein öffnendes image:image und ein schließendes -Tag erweitert werden. Dieses Tag enhält dann in einem image:loc-Tag den Verweis auf die URL des Bildes:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
    <image:image>
      <image:loc>http://www.domain.de/bild.jpg</image:loc>
    </image:image>
  </url>
</urlset>

Wichtig ist, dass das urlset-Tag um den Bilder-Sitemap-Namespace “xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1” erweitert wird.

Pro Sitemap können bis zu 1.000 Bilder an Google übermittelt werden. Auch Bilder, die nicht auf der eigenen Domain liegen, können auf diese Weise in die Sitemap eingebunden werden. Davon profitieren Websites, die ihre Bilder auf einer externen Domain (z.B. einem CDN) abgelegt haben.

Video-Sitemap

Bei Video-Sitemaps besteht die Möglichkeit eine separate Sitemap zu erstellen, oder die Videos in der „normalen“ Sitemap zu verlinken. Auch hier gibt es ein öffnendes und schließendes Tag, in das die Verlinkung zur Video-URL eingebettet ist: video:video und /video:video

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
    <image:image>
      <image:loc>http://www.domain.de/bild.jpg</image:loc>
    </image:image>
    <video:video>
      <video:content_loc>http://www.domain.de/video.mp4</video:content_loc>
      <video:thumbnail_loc>http://www.domain.de/videovorschaubild.jpg</video:thumbnail_loc>
      <video:title>Titel des Videos</video:title>
      <video:description>Beschreibung des Videos</video:description>
    </video:video>
  </url>
</urlset>

Auch für Video-Sitemaps gibt es zusätzliche Attribute, die ebenfalls von Google ausgelesen und benötigt werden:

  • video:thumbnail_loc Ein Verweis auf ein Vorschaubild des Videos
  • video:title Für den Titel des Videos
  • video:description Für eine kurze Beschreibung des Videos
  • video:content_loc Der Link zur Mediendatei des Videos. Bei Videos, die per embed-Tag eingebunden werden, kann video:player_loc verwendet werden, das auf den Wert im src-Element des embed-Tags verweist

Darüber hinaus gibt es eine Vielzahl an optionalen Informationen, die in der Video-Sitemap an Google geschickt werden können. Dieser findest du auf der Google-Seite zum Thema Video-Sitemaps.

💡 Restriktionen
Laut Google darf eine Sitemap nicht mehr als 50.000 URLs enthalten und nicht größer als 50 MB sein. Außerdem muss immer auf die kanonische URL verwiesen werden. Wenn für Desktop und Mobile unterschiedliche URLs verwendet werden, sollte es nur eine Sitemap für eine der beiden Versionen geben.

Index-Sitemap

Die Beschränkung auf maximal 50.000 URLs ist für große Websites (für die Sitemaps besonders wichtig sind) nicht ausreichend. Daher können mehrere Sitemaps bei Google eingereicht werden. Diese einzelnen Sitemaps können in einer einzigen Index-Sitemap verlinkt werden.

Die Index-Sitemap ist wie folgt aufgebaut:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.domain.de/sitemap1.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/sitemap2.xml</loc>
  </sitemap>
</sitemapindex>

Dieses Prinzip kann genutzt werden, um Teilbereiche der Website in einzelnen Sitemaps abzubilden. So kann man in der Google Search Console sehen, wie es um die Indexierung dieser Bereiche bei Google bestellt ist:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.domain.de/kategorien.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/produktseiten.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/content-seiten.xml</loc>
  </sitemap>
</sitemapindex>

Sitemap Generatoren

Wenn dein CMS nicht in der Lage ist, automatisiert Sitemaps zu generieren zu lassen diese sich auch manuell erstellen und (beispielsweise per FTP) auf den Server deiner Website hochladen.

Für das Erstellen der Sitemaps gibt es zahlreiche kostenlose Dienste, die deine Website crawlen und daraus eine XML-Sitemap erstellen. Diese sind jedoch häufig limitiert, so kann oft nur eine bestimmte Anzahl an URLs in die Sitemap aufgenommen werden.

Wenn auf ein kostenpflichtiges Tool gesetzt werden kann, empfehle ich den Screaming Frog SEO Spider. Er ist im Preis-Leistungs-Verhältnis unschlagbar und kann weit mehr als nur bei der Sitemap-Generierung helfen. Auch bei der Sitemap-Generierung besticht Screaming Frog durch zahlreiche Features:

  • hreflang-Unterstützung
  • Integration von Bildern
  • Manuelles ausschließen von einzelnen URLs aus der Sitemap
  • Zusatzinformationen wie lastmod, changefreq und priority

Außerdem ist es bei Screaming Frog möglich eine eigene Liste an URLs zu crawlen und daraus eine Sitemap erstellen zu lassen.

Das Bild zeigt einen Screenshot von Screaming Frog für Sitemap-Exportkonfiguration mit verschiedenen Optionen für die Ausgabe.
XML-Sitemap Erstellung mit dem Screaming Frog

Sitemap für WordPress-Seiten

Viele Webseiten sind auf Basis von WordPress erstellt. Umso erstaunlicher ist es, dass WordPress trotz Ankündigung im Jahr 2020 nativ keine XML-Sitemaps erstellen kann. Das ist aber auch nicht schlimm, denn: Solange WordPress keine Möglichkeit bietet, Seiten auf den Noindex zu setzen oder mit Canonicals zu arbeiten, ist man ohnehin auf eine SEO-Erweiterung angewiesen.

Für WordPress-Nutzer ist es daher ohnehin sinnvoll, auf ein SEO-Plugin zu setzen, das auch die Erstellung der Sitemap übernimmt. Erweiterungen, die das können, gibt es wie Sand am Meer. Ich habe sowohl mit Yoast als auch mit RankMath in Sachen Sitemaps gute Erfahrungen gemacht.

Sitemap bei Google Anmelden

Ist eine Sitemap generiert, muss diese noch bei Suchmaschinen bekannt gemacht werden. Dazu gibt es zwei simple Wege:

  1. Ein Verweis in der Robots.txt auf die Sitemap reicht aus, um die meisten Suchmaschinen zu triggern, die Sitemap zu crawlen
  2. Außerdem kann die Sitemap in der Google Search Console und den Bing Webmater Tools manuell einreicht werden

Ich empfehle immer, beide Wege zu gehen.Der Eintrag in die Robots.txt ist in der Regel schnell gemacht, die meisten SEO-Plugins für WordPress machen das automatisch.

Der Eintrag in der Robots.txt erfolgt nach diesem Muster:

sitemap: http://www.domain.de/sitemap.xml

Der manuelle Eintrag in der Search Console ist wichtig, um die Sitemap auch in der Console sehen zu können. Wenn Google die Sitemap über die Robots.txt findet, wird sie nicht in der Search Console angezeigt, auch wenn sie Google bekannt ist.

Hier findest du eine schnelle Anleitung, die Sitemap in der Search Console anzumelden.

Sitemaps können auch manuell mit einem sogenannten Ping an Google gesendet werden.Dazu muss folgende URL im Browser aufgerufen werden:

http://www.google.com/ping?sitemap=http://www.domain.de/sitemap.xml

Google News Sitemaps

Eine weitaus größere Rolle spielt die Sitemap im Bereich News.Wer in Google News gefunden werden will, kommt um eine News-Sitemap nicht herum. Daher sind die Anforderungen an eine News-Sitemap höher:

  • Sie darf nur URLs zu Artikeln beinhalten, die in den letzten 48 Stunden veröffentlicht wurden
  • Eine einzelne News-Sitemap kann maximal 1.000 URLs enthalten. Bei einer größeren Anzahl von News-Artikeln kann die Sitemap in mehrere Sitemaps aufgeteilt werden.

Auch bei der Syntax müssen einige Dinge beachtet werden. Innerhalb des url-Tags folgt ein news:news-Tag, das zusätzliche Informationen an Google News übermittelt:

Innerhalb des Tags news:publication werden mit weiteren Tags Informationen über den Publisher an Google News übermittelt.

  • news:name: Name des Publishers
  • news:language: Sprache, in der der Content veröfentlicht wurde als zwei oder dreistelliger Sprachcode (nach ISO 639).

Desweiteren gibt es noch die Tags

  • news:publication_date: Das Datum, an dem der Artikel veröffentlicht wurde im Format YYYY-MM-DD
  • news:title: Der Titel des News-Artikels

Beispiel für eine News-Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
   <loc>http://www.domain.de/newsArtikel.html</loc>
   <news:news>
   <news:publication>
     <news:name>Deine Zeitung</news:name>
     <news:language>de</news:language>
   </news:publication>
   <news:publication_date>2022-11-03</news:publication_date>
     <news:title>Alles wichtige zur Bundestagswahl</news:title>
    </news:news>
  </url>
</urlset>

Auch die Google News Sitemap sollte in der Google Search Console eingereicht werden.

💡 Anmeldung bei Google News nicht vergessen
Eine News-Sitemap reicht alleine nicht aus, um bei Google News gelistet zu werden. Zusätzlich benötigt es eine Anmeldung im Google Publisher Center.

Alternative Sitemap-Formate

Was oft übersehen wird: Google unterstützt auch andere Formate als XML als Sitemap. Dazu gehören:

  • RSS & mRSS
  • Atom 1.0
  • Text (.txt)

Diese alternativen Sitemap-Formate sind jedoch nur eine B-Lösung. Viele Informationen, die eine XML-Sitemap übermitteln kann (Bilder, Videos etc.), können nicht per RSS-Feed oder txt-Datei übermittelt werden. Außerdem enthält der RSS-Feed oft nur die neuesten Artikel, so dass die Anzahl der übermittelten URLs nicht vollständig ist.

Das Bild zeigt die Google Search Console mit einer Liste von eingereichten Sitemaps, deren Typen: RSS und XML
Unvollständig: RSS Feed als Sitemap in der Google Search Console

Darüber hinaus stellt ein guter Sitemap-Mechanismus sicher, dass nur die URLs an Suchmaschinen gesendet werden, die auch indiziert werden sollen.

Fazit

Auch wenn XML-Sitemaps kein Ranking-Faktor sind, haben sie ihre Berechtigung. Vor allem Websites mit mehr als 10.000 URLs und News-Publisher können von Sitemaps bei der Indizierung profitieren.

Für kleinere Websites sind Sitemaps ein praktisches Werkzeug, um die Website zu überwachen und den Überblick über die wichtigsten URLs zu behalten.

Ein Mann sitzt lächelnd auf einem Stuhl und hebt seine Hand zum Gruß.

Hol dir unser Wissen direkt in dein Postfach!

Einmal pro Woche schicken wir dir Wissenswertes rund um WordPress, SEO, KI, Datenschutz, Sicherheit, Texte, Bilder und Webdesign – verständlich aufbereitet, ergänzt um spannende Einblicke in den StrategieVier-Allltag. Trag dich direkt hier in unseren Newsletter ein!

Du meldest dich zu unserem Newsletter an. Macht vier Mal Website-Wissen pro Monat. Dafür nutzen wir Active Campaign. Du kannst dich jederzeit per Klick abmelden. Datenschutz.

Michael Hohenleitner

Michael ist S4-Mitgründer. Als technischer SEO-Berater entwickelt er Gesamtstrategien als Basis unserer Projekte. Denn die Websites unserer Kunden sollen ja nicht nur schön sein, sondern erstens auch im Web gefunden werden und das zweitens von der passenden Zielgruppe.

Auf dem Bild ist ein lächelnder Mann in lässiger Kleidung, der auf dem Boden sitzt. Michael Hohenleitner

Weitere Beiträge von uns

Willst du KI-Fotos für SEO einsetzen? Lerne, wann sie nützlich sind und wann echte Fotos bevorzugt werden sollten. Authentizität kann den Unterschied machen!...
In diesem Artikel lernst du, wie du mit Google Search Console und Looker Studio ein effizientes und kostenloses Keyword Monitoring Tool erstellst. Erhalte tiefe Einblicke in deine Rankings und visualisiere die Leistung deiner Keywords über...
Entdecke, wie du mit Python auf die Google Search Console API zugreifst – ganz ohne Programmierkenntnisse! Unsere Anleitung und ein kostenloses Python-Skript ermöglichen es dir, alle wichtigen Keyword- und URL-Daten unkompliziert zu extrahieren. Wir führen...
Entdecke die Geheimnisse semantischer Suchmaschinenoptimierung! Erfahre, wie Google funktioniert, warum jedes einzelne Wort zählt und wie du deine SEO-Strategie darauf anpasst....
Hol dir unser Wissen
in dein Postfach!
Mit unserem Newsletter bekommst du regelmäßig relevante Updates rund um Websites, SEO, Content, WordPress, KI, Datenschutz und Cyber-Sicherheit.

Du meldest dich mit deiner Anfrage zum Website-Audit auch zu unserem Newsletter an. Wir schicken dir nach unseren Willkommens-E-Mails bis zu vier Mal im Monat unser Website-Wissen! Für den Versand der Mails verwenden wir Active Campaign. Du kannst dich jederzeit mit nur einem Klick wieder abmelden. Datenschutz.