- Michael Hohenleitner
- am
- aktualisiert 22. Januar 2024
XML-Sitemaps spielen bei der technischen Suchmaschinenoptimierung oft eine zentrale Rolle: Sie stellen Google und anderen Suchmaschinen alle URLs einer Website im maschinenlesbaren XML-Format zur Verfügung, so dass die Suchmaschinen die URLs nur noch crawlen und indexieren müssen.
Was du bei der Erstellung einer XML-Sitemap beachten solltest, warum sie aus SEO-Sicht oft überschätzt wird und warum du sie trotzdem verwenden solltest, erfährst du in diesem Artikel.
Das Wichtigste in Kürze
- XML-Sitemaps helfen Google und anderen Suchmaschinen neue URLs zu erkennen, um diese zu crawlen und zu indexieren
- Eine Sitemap kann Informationen zu Seiten, Bildern oder Videos beinhalten.
- Das Ranking wird durch eine Sitemap nicht beeinflusst
Inhalt
Was ist eine Sitemap?
Wie der Name schon sagt, ist eine Sitemap eine „Karte“ oder besser ein Plan einer Website. Es gibt zwei Arten von Sitemaps:
HTML-Sitemaps und XML-Sitemaps
- HTML-Sitemap: Sie stellt die Struktur einer Website in Form eines HTML-Dokuments dar, so dass sie sowohl von Suchmaschinen als auch von Menschen gelesen werden kann.
- XML-Sitemap: Sie werden im maschinenlesbaren XML-Format aufbereitet und können so vor allem von Suchmaschinen und anderen Website-Crawlern verarbeitet werden.
Google hat 2005 damit begonnen, Webmastern die Möglichkeit zu geben, die Struktur ihrer Website als XML-Datei bei Google einzureichen, um das Crawling der Website zu beschleunigen. Neben Links sind XML-Sitemaps also ein weiteres Mittel, um eine URL von Google indizieren zu lassen.
Seit 2007 bietet auch Microsoft Bing an, die Struktur der Website als XML-Datei zu übermitteln.
Nachdem die Sitemap bei Google oder Bing eingereicht wurde, werden die darin enthaltenen URLs in die Liste der zu crawlenden URLs aufgenommen und gecrawlt, sobald sie an der Reihe sind.
Du willst SEO lernen und verständlich erklärt bekommen?
Website-Potentiale erkennen, Keywords recherchieren, SEO-Texte schreiben: Wir zeigen Marketing-Abteilungen, wie sie ihre Websites systematisch bei Google nach oben bekommen.
Auswirkungen von Sitemaps auf das Crawling, Indexierung und Ranking
Damit sind wir beim Punkt, warum Sitemaps oft überschätzt werden: Sie können zwar das Crawling beschleunigen, haben aber keinen positiven Einfluss auf das Ranking der Website in den Suchergebnissen. Dies hat Gary Illyes von Google 2019 auf Twitter bestätigt:
Auch wenn der Einsatz einer XML-Sitemap kein Rankingfaktor ist, können sie trotzdem einiges an Mehrwert bringen:
- Auffindbarkeit: Suchmaschinen können Unterseiten, die schlecht verlinkt sind, über die XML-Sitemap leicht auffinden und crawlen
- Alternative Content-Formate: Sitemaps sind nicht darauf begrenzt, Verweise auf HTML-Seiten zu enthalten. Sie können auch Links zu Bildern und Videos enthalten
- Sprachsteuerung: als Alternative zu hreflang-Attributen im HTML können auch XML-Sitemaps verweise auf alternative Sprachen der Website beinhalten
Auch wenn die Verweise in einer Sitemap keinen Page Rank vererben und auch sonst keinen Rankingvorteil bringen, können sie sich dennoch positiv auf das Abschneiden einer Website in den Suchergebnissen auswirken. Denn je schneller und umfangreicher eine Website indexiert wird, desto höher sind ihre Rankingchancen.
Darüber hinaus sind Sitemaps eine gute Möglichkeit, sich einen Überblick über alle relevanten URLs einer Website zu verschaffen. Das macht sie auch für kleinere Websites wertvoll.
Mit Hilfe einer Sitemap kann z.B. in der Search Console überprüft werden, wie viele der an Google über die Sitemap gesendeten URLs indiziert sind. Auch Crawler wie Screaming Frog können auf die Sitemap zugreifen, um beim Crawlen der Website alle wichtigen Seiten zu finden.
Das bringt uns zum nächsten Punkt:
Was sollte in einer XML-Sitemap enthalten sein (und was nicht)?
Grundsätzlich sollte jede URL, die indexiert werden soll, auch in der XML-Sitemap enthalten sein. Da Sitemaps in der Regel automatisiert erstellt werden, können folgende Anforderungen an die Entwickler gestellt werden:
Die Sitemap sollte Seiten beinhalten, die alle dieser Punkte erfüllen:
- Alle URLs, die eine Meta Robots Angabe
index
haben - Alle URLs, die über ein selbst referenzierendes Canonical Tag verfügen
- Alle URLs, die mit einem Status Code
200
antworten
Nicht enthalten sein sollten URLs, die nicht alle der oben genannten Punkte erfüllen oder
- per Robobts.txt vom Crawling ausgeschlossen sind
💡 Sitemaps manuell erstellen
Wenn dein System nicht in der Lage ist, Sitemaps automatisch zu erstellen, findest du weiter unten einige Empfehlungen für Sitemap-Generatoren.
Aufbau einer XML-Sitemap
Der Aufbau einer einfachen XML-Sitemap ist relativ simpel: Am Anfang steht immer ein XML-Tag, das die XML-Version und den Zeichensatz (Encoding) enthält:
<?xml version="1.0" encoding="UTF-8"?>
Gemäß den Spezifikationen von sitemaps.org muss der Zeichensatz UTF-8 sein.
Anschließend folgt ein urlset
-Tag, das alle weiteren Inhalte umschließt und außerdem einen Verweis auf das Sitemap-Protokolls (den Namespace) enthält (in der Regel: https://www.sitemaps.org/schemas/sitemap/0.9/)
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
</urlset>
In dieses urlset
-Tag eingebettet werden nun die eigentlichen Verweise auf die in der Sitemap enthaltenen URLs. Diese wiederum sind in ein url
bzw. loc
-Tag eingebettet:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.domain.de/unterseite.html</loc>
</url>
</urlset>
Für jeden weiteren Eintrag folgt eine weiteres url
und loc
-Tag innerhalb des urlset
-Tags:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.domain.de/unterseite.html</loc>
</url>
<url>
<loc>http://www.domain.de/unterseite-2.html</loc>
</url>
</urlset>
Damit ist die Sitemap bereits einsatzfähig.
Es können auch zusätzliche informationen über einzelne URLs per Sitemap an Suchmaschinen übergeben werden:
lastmod
: Das Datum der letzten Aktualisierung der URL im Format YYYY-MM-DD.changefreq
: Wie häuifig die URL aktualisiert wird, z. B. hourly oder dailypriority
: Die Priorität der URL im Verlgleich zu den restlichen URLs der Website.
💡 Attribute und ihre Bedeutung
In welcher Form diese Tags von Google verwendet werden, ist umstritten. bzw. es kursieren widersprüchliche Aussagen im Netz. Im Podcast “Search off the Record” vom Mai 2022 sagt Gary Illyes, dass Google keines dieser Tags verwendet. Zwei Jahre zuvor meinte John Mueller noch, dass Google bei korrekter Verwendung das lastmod-Tag zur Priorisierung des Crawlings nutzen könne. (Quelle). Grundsätzlich kann davon ausgegangen werden, dass alle Angaben in der Sitemap durch Crawling überprüft werden.
Wie bereits angedeutet, können Sitemaps weit mehr als nur Verweise auf HTML-Dokumente enthalten:
Bilder-Sitemap
Sehr hilfreich für die Verschlagwortung von Bildern ist die Verwendung einer Image Sitemap. Diese muss nicht separat erstellt werden, sondern kann die Bilder, die zu einer bestimmten Seite gehören, strukturiert auflisten.
Dazu muss die Sitemap lediglich um ein öffnendes image:image
und ein schließendes -Tag erweitert werden. Dieses Tag enhält dann in einem image:loc
-Tag den Verweis auf die URL des Bildes:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>http://www.domain.de/unterseite.html</loc>
<image:image>
<image:loc>http://www.domain.de/bild.jpg</image:loc>
</image:image>
</url>
</urlset>
Wichtig ist, dass das urlset-Tag um den Bilder-Sitemap-Namespace “xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1” erweitert wird.
Pro Sitemap können bis zu 1.000 Bilder an Google übermittelt werden. Auch Bilder, die nicht auf der eigenen Domain liegen, können auf diese Weise in die Sitemap eingebunden werden. Davon profitieren Websites, die ihre Bilder auf einer externen Domain (z.B. einem CDN) abgelegt haben.
Video-Sitemap
Bei Video-Sitemaps besteht die Möglichkeit eine separate Sitemap zu erstellen, oder die Videos in der „normalen“ Sitemap zu verlinken. Auch hier gibt es ein öffnendes und schließendes Tag, in das die Verlinkung zur Video-URL eingebettet ist: video:video
und /video:video
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>http://www.domain.de/unterseite.html</loc>
<image:image>
<image:loc>http://www.domain.de/bild.jpg</image:loc>
</image:image>
<video:video>
<video:content_loc>http://www.domain.de/video.mp4</video:content_loc>
<video:thumbnail_loc>http://www.domain.de/videovorschaubild.jpg</video:thumbnail_loc>
<video:title>Titel des Videos</video:title>
<video:description>Beschreibung des Videos</video:description>
</video:video>
</url>
</urlset>
Auch für Video-Sitemaps gibt es zusätzliche Attribute, die ebenfalls von Google ausgelesen und benötigt werden:
video:thumbnail_loc
Ein Verweis auf ein Vorschaubild des Videosvideo:title
Für den Titel des Videosvideo:description
Für eine kurze Beschreibung des Videosvideo:content_loc
Der Link zur Mediendatei des Videos. Bei Videos, die perembed
-Tag eingebunden werden, kannvideo:player_loc
verwendet werden, das auf den Wert imsrc
-Element desembed
-Tags verweist
Darüber hinaus gibt es eine Vielzahl an optionalen Informationen, die in der Video-Sitemap an Google geschickt werden können. Dieser findest du auf der Google-Seite zum Thema Video-Sitemaps.
💡 Restriktionen
Laut Google darf eine Sitemap nicht mehr als 50.000 URLs enthalten und nicht größer als 50 MB sein. Außerdem muss immer auf die kanonische URL verwiesen werden. Wenn für Desktop und Mobile unterschiedliche URLs verwendet werden, sollte es nur eine Sitemap für eine der beiden Versionen geben.
Index-Sitemap
Die Beschränkung auf maximal 50.000 URLs ist für große Websites (für die Sitemaps besonders wichtig sind) nicht ausreichend. Daher können mehrere Sitemaps bei Google eingereicht werden. Diese einzelnen Sitemaps können in einer einzigen Index-Sitemap verlinkt werden.
Die Index-Sitemap ist wie folgt aufgebaut:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.domain.de/sitemap1.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.domain.de/sitemap2.xml</loc>
</sitemap>
</sitemapindex>
Dieses Prinzip kann genutzt werden, um Teilbereiche der Website in einzelnen Sitemaps abzubilden. So kann man in der Google Search Console sehen, wie es um die Indexierung dieser Bereiche bei Google bestellt ist:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.domain.de/kategorien.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.domain.de/produktseiten.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.domain.de/content-seiten.xml</loc>
</sitemap>
</sitemapindex>
Sitemap Generatoren
Wenn dein CMS nicht in der Lage ist, automatisiert Sitemaps zu generieren zu lassen diese sich auch manuell erstellen und (beispielsweise per FTP) auf den Server deiner Website hochladen.
Für das Erstellen der Sitemaps gibt es zahlreiche kostenlose Dienste, die deine Website crawlen und daraus eine XML-Sitemap erstellen. Diese sind jedoch häufig limitiert, so kann oft nur eine bestimmte Anzahl an URLs in die Sitemap aufgenommen werden.
Wenn auf ein kostenpflichtiges Tool gesetzt werden kann, empfehle ich den Screaming Frog SEO Spider. Er ist im Preis-Leistungs-Verhältnis unschlagbar und kann weit mehr als nur bei der Sitemap-Generierung helfen. Auch bei der Sitemap-Generierung besticht Screaming Frog durch zahlreiche Features:
hreflang
-Unterstützung- Integration von Bildern
- Manuelles ausschließen von einzelnen URLs aus der Sitemap
- Zusatzinformationen wie
lastmod
,changefreq
undpriority
Außerdem ist es bei Screaming Frog möglich eine eigene Liste an URLs zu crawlen und daraus eine Sitemap erstellen zu lassen.
Sitemap für WordPress-Seiten
Viele Webseiten sind auf Basis von WordPress erstellt. Umso erstaunlicher ist es, dass WordPress trotz Ankündigung im Jahr 2020 nativ keine XML-Sitemaps erstellen kann. Das ist aber auch nicht schlimm, denn: Solange WordPress keine Möglichkeit bietet, Seiten auf den Noindex zu setzen oder mit Canonicals zu arbeiten, ist man ohnehin auf eine SEO-Erweiterung angewiesen.
Für WordPress-Nutzer ist es daher ohnehin sinnvoll, auf ein SEO-Plugin zu setzen, das auch die Erstellung der Sitemap übernimmt. Erweiterungen, die das können, gibt es wie Sand am Meer. Ich habe sowohl mit Yoast als auch mit RankMath in Sachen Sitemaps gute Erfahrungen gemacht.
Sitemap bei Google Anmelden
Ist eine Sitemap generiert, muss diese noch bei Suchmaschinen bekannt gemacht werden. Dazu gibt es zwei simple Wege:
- Ein Verweis in der Robots.txt auf die Sitemap reicht aus, um die meisten Suchmaschinen zu triggern, die Sitemap zu crawlen
- Außerdem kann die Sitemap in der Google Search Console und den Bing Webmater Tools manuell einreicht werden
Ich empfehle immer, beide Wege zu gehen.Der Eintrag in die Robots.txt ist in der Regel schnell gemacht, die meisten SEO-Plugins für WordPress machen das automatisch.
Der Eintrag in der Robots.txt erfolgt nach diesem Muster:
sitemap: http://www.domain.de/sitemap.xml
Der manuelle Eintrag in der Search Console ist wichtig, um die Sitemap auch in der Console sehen zu können. Wenn Google die Sitemap über die Robots.txt findet, wird sie nicht in der Search Console angezeigt, auch wenn sie Google bekannt ist.
Hier findest du eine schnelle Anleitung, die Sitemap in der Search Console anzumelden.
Sitemaps können auch manuell mit einem sogenannten Ping an Google gesendet werden.Dazu muss folgende URL im Browser aufgerufen werden:
http://www.google.com/ping?sitemap=http://www.domain.de/sitemap.xml
Google News Sitemaps
Eine weitaus größere Rolle spielt die Sitemap im Bereich News.Wer in Google News gefunden werden will, kommt um eine News-Sitemap nicht herum. Daher sind die Anforderungen an eine News-Sitemap höher:
- Sie darf nur URLs zu Artikeln beinhalten, die in den letzten 48 Stunden veröffentlicht wurden
- Eine einzelne News-Sitemap kann maximal 1.000 URLs enthalten. Bei einer größeren Anzahl von News-Artikeln kann die Sitemap in mehrere Sitemaps aufgeteilt werden.
Auch bei der Syntax müssen einige Dinge beachtet werden. Innerhalb des url
-Tags folgt ein news:news
-Tag, das zusätzliche Informationen an Google News übermittelt:
Innerhalb des Tags news:publication
werden mit weiteren Tags Informationen über den Publisher an Google News übermittelt.
news:name
: Name des Publishersnews:language
: Sprache, in der der Content veröfentlicht wurde als zwei oder dreistelliger Sprachcode (nach ISO 639).
Desweiteren gibt es noch die Tags
news:publication_date
: Das Datum, an dem der Artikel veröffentlicht wurde im Format YYYY-MM-DDnews:title
: Der Titel des News-Artikels
Beispiel für eine News-Sitemap
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.domain.de/newsArtikel.html</loc>
<news:news>
<news:publication>
<news:name>Deine Zeitung</news:name>
<news:language>de</news:language>
</news:publication>
<news:publication_date>2022-11-03</news:publication_date>
<news:title>Alles wichtige zur Bundestagswahl</news:title>
</news:news>
</url>
</urlset>
Auch die Google News Sitemap sollte in der Google Search Console eingereicht werden.
💡 Anmeldung bei Google News nicht vergessen
Eine News-Sitemap reicht alleine nicht aus, um bei Google News gelistet zu werden. Zusätzlich benötigt es eine Anmeldung im Google Publisher Center.
Alternative Sitemap-Formate
Was oft übersehen wird: Google unterstützt auch andere Formate als XML als Sitemap. Dazu gehören:
- RSS & mRSS
- Atom 1.0
- Text (
.txt
)
Diese alternativen Sitemap-Formate sind jedoch nur eine B-Lösung. Viele Informationen, die eine XML-Sitemap übermitteln kann (Bilder, Videos etc.), können nicht per RSS-Feed oder txt-Datei übermittelt werden. Außerdem enthält der RSS-Feed oft nur die neuesten Artikel, so dass die Anzahl der übermittelten URLs nicht vollständig ist.
Darüber hinaus stellt ein guter Sitemap-Mechanismus sicher, dass nur die URLs an Suchmaschinen gesendet werden, die auch indiziert werden sollen.
Fazit
Auch wenn XML-Sitemaps kein Ranking-Faktor sind, haben sie ihre Berechtigung. Vor allem Websites mit mehr als 10.000 URLs und News-Publisher können von Sitemaps bei der Indizierung profitieren.
Für kleinere Websites sind Sitemaps ein praktisches Werkzeug, um die Website zu überwachen und den Überblick über die wichtigsten URLs zu behalten.
Hol dir unser Wissen direkt in dein Postfach!
Einmal pro Woche schicken wir dir Wissenswertes rund um WordPress, SEO, KI, Datenschutz, Sicherheit, Texte, Bilder und Webdesign – verständlich aufbereitet, ergänzt um spannende Einblicke in den StrategieVier-Allltag. Trag dich direkt hier in unseren Newsletter ein!
Du meldest dich zu unserem Newsletter an. Macht vier Mal Website-Wissen pro Monat. Dafür nutzen wir Active Campaign. Du kannst dich jederzeit per Klick abmelden. Datenschutz.