XML-Sitemap für die Suchmaschinenoptimierung (SEO)
Eine XML-Sitemap ist eine wichtige technische Einrichtung zur Suchmaschinenoptimierung (SEO). Es handelt sich dabei um eine maschinenlesbare Auflistung aller URLs einer Webseite in einem einzigen Dokument und ist das bevorzugte Format zur Verarbeitung von Sitemaps durch Suchmaschinen wie Google.
CCDS bietet State-of-the-Art-Suchmaschinenoptimierung an und hat dafür eine Extension für das TYPO3 CMS entwickelt, durch die direkt aus dem Content Management System heraus automatisch eine immer aktuelle XML-Sitemap generiert und für Suchmaschinen zur Verfügung gestellt wird.
Third-Party-Standard-Tools, wie z.B. Screaming Frog, sind prinzipiell gut geeignet, um die grundlegenden Erfordernisse bei kleinen Webauftritten zu handhaben. Für komplexere Webseiten ergeben sich jedoch häufig einige Probleme:
- Bei multilinguale Webseiten werden Regionen und Sprachen nicht differenziert. Statt einer Reihe sprachspezifischer Sitemaps wird eine große Sitemap generiert, die sämtliche URLs aller Sprachen enthält und somit nicht unterscheiden kann, was für eine bestimmte Suchanfrage relevant ist.
- Bei Webseiten mit umfangreichen Inhalten kann der Frontend-Crawl mehrere Stunden in Anspruch nehmen, während derer die Serverlast hoch und die Performance der Webseite folglich eingeschränkt ist. Werden in einem Webshop z.B. häufig neue Produkte eingestellt oder aus dem Sortiment genommen, oder auf einer Webseite regelmäßig redaktionelle Updates vorgenommen, so verstärkt sich dieses Problem, da jede neu hinzugekommene URL einen neuen Frontend-Crawl erfordert.
- Der Crawl muss manuell angestoßen werden, so dass zwischen der Veröffentlichung neuer Inhalte und Ihrer Verfügbarkeit für Suchmaschinen in der XML-sitemap eine mehr oder weniger große Latenzzeit entsteht. Außerdem muss diese Aufgabe personell abgedeckt werden.
Die Custom-Lösung von CCDS basiert auf der TYPO3-Extension DD Google Sitemap. Sieberücksichtigt darüber hinaus die sprachabhängige Relevanz von URLs bei multilingualen Webseiten, wie sie bei internationalen Webauftritten üblicherweise vorkommen und erstellt sprachspezifische XML-Sitemaps für die verschiedenen Bereiche der Webseite. Diese sind dadurch kleiner und strukturierter. Statt des Frontends der Webseite wird direkt die Datenbankstruktur gecrawlt. Für den Webserver entstehen so keine Last und es ergeben sich keine Einbußen bei der Performance. Die XML-Sitemap bildet innerhalb 2–3 Sekunden jede inhaltliche Aktualisierung der Webseite ab, wird also immer praktisch in Echtzeit aktualisiert.
Eingesetzt wurde die Extension z.B. bei unserem Kunden HEAD, dessen Webseite 9 Sprachen für 36 Regionen umfasst und somit besondere Anforderungen an die Indexierung durch Suchmaschinen stellt. Jede redaktionelle, inhaltliche oder strukturelle Änderung an der Webseite innerhalb des CMS wird umgehend an die Extension übergeben. Diese generiert laufend eine aktualisierte XML-Sitemap, so dass bei jeder Abfrage durch einen Suchmaschinen-Crawler immer der neueste Stand zur Verfügung steht. Die „HEAD-Edition” unserer Extension erlaubt es Gruppen von URLs oder einzelne Webadressen von der Sitemap auszuschließen. Alle relevanten URLs werden als sprach- und regionsspezifische XML-Sitemap ausgegeben.
Neben der eigentlichen Adresse werden auch die Hierarchie und Verschachtelung innerhalb der Webseitenstruktur ausgegeben. Außerdem werden Meta-Informationen aus der Datenbank des TYPO3 CMS eingebunden, wie das letzte Änderungsdatum, die Häufigkeit der Änderungen und die Priorität der Inhalte. Das hilft den Crawlern der Suchmaschinen, die Struktur der einzelnen Seiten einzuschätzen und entsprechend zu indizieren.
Die Ausgabe entspricht dem gängigen unter www.sitemaps.org spezifizierten Format für eine XML-Sitemap und entspricht damit den Richtlinien von Google, Yahoo und Bing (Microsoft), so dass eine möglichst umfassende und Anbieterunabhängige Indizierung der Inhalte gewährleistet ist.