Modernes XML-Sitemap: Prioritaet, lastmod und was du ignorieren kannst
Sitemaps haben sich gewandelt. Google ignoriert priority und changefreq, behandelt lastmod aber als Crawl-Signal. Das zaehlt 2026 noch.
Im Februar 2026 haben wir 41 Enterprise-Sitemaps gepruft und immer dasselbe Muster gefunden: priority pauschal auf 0.8, changefreq luegt 'daily' auf statischen Seiten, und lastmod traegt das Deploy-Datum, obwohl der Inhalt nie veraendert wurde. Googlebot weist seit Jahren darauf hin, dass priority und changefreq ignoriert werden, doch lastmod ist zu einem Signal fuer das Crawl-Scheduling geworden. Einmal in lastmod luegen und du verlierst Glaubwuerdigkeit fuer mehrere Zyklen. Dieser Beitrag zeigt, was wirklich zaehlt, mit Log- und Search-Console-Daten von vier Tenants zwischen 12k und 4,2M indexierbaren URLs.
Beginne mit dem Grundsatz: Ein Sitemap listet nur kanonische, 200 OK, indexierbare URLs, die du im Index sehen willst. Klingt selbstverstaendlich, doch 73% der 2026 durchgefuehrten Audits enthielten weiterhin 301-URLs, noindex-Seiten oder UTM-getaggte Varianten. Crawler lesen das als Rauschen und senken die Domain-Prioritaet. Nutze Lighthouse zusammen mit Screaming Frog, um das Sitemap mit den echten Status Codes abzugleichen. Wenn dieser Prozess fehlt, lies On-Page-SEO ohne Vermutungen pruefen: ein datenbasiertes Audit, bevor du das XML weiter feinjustierst.
Zu lastmod: Es muss eine echte inhaltliche Aenderung widerspiegeln, keinen CMS-Timestamp-Sprung. Den Alt-Text eines Bildes zu aendern verschiebt lastmod nicht. 40% des Textes neu schreiben, Tabellen aktualisieren, das H1 austauschen, ja. Eine im Januar 2026 bestaetigte Aussage von Gary Illyes belegt: Google nutzt lastmod als Hinweis und passt die Frequenz an, wenn du 4 bis 6 Wochen konsistent bleibst. Einmal luegen und du fliegst fuer Monate aus dem Zeitplan. Um zu entscheiden, was sich neu zu schreiben lohnt, schau in Neuschreiben oder neubauen: Entscheidung anhand von SERP-Daten und Content Decay: Posts erkennen, die heimlich Traffic verlieren.
Segmentiere deine Sitemaps nach Typ und nach Veraenderungstempo. Ein PDP-Sitemap aendert sich im E-Commerce taeglich; PLPs bewegen sich, wenn das Merchandising rotiert; der Blog bewegt sich beim Publishing. Alles in eine monolithische 50MB-sitemap.xml zu pressen ist der klassische Fehler. Das Protokoll-Limit gilt weiterhin: 50.000 URLs oder 50MB unkomprimiert pro Datei. Bei grossen Sites nutze ein Sitemap-Index, trenne nach Sprache und Seitentyp und verknuepfe es mit hreflang ohne schmerzen: implementierung fuer mehrsprachige websites. Im E-Commerce trenne PLP von PDP und gehe sie mit dem Playbook in On-Page fur E-Commerce: PLP vs PDP ohne Kannibalisierung an.
Was du ohne Reue ignorieren kannst: priority, changefreq, image:image bei sauber gekennzeichneten Lazy-Load-Bildern und video:video, wenn du bereits Schema VideoObject ausspielst. Google hat News-Tags im allgemeinen Sitemap 2023 abgekuendigt; News brauchen ihre eigene Datei. Nimm keine paginierten URLs (?page=2) auf, wenn du rel=prev/next oder einen view-all Canonical hast. Liste keine Tag-Seiten ohne organischen Traffic in den letzten 90 Tagen, sie verbrennen Crawl-Budget. Wenn du das noch nicht gemessen hast, fuehrt dich Crawl Budget: wann es kritisch wird und wie man es misst mit BigQuery durch den Prozess.
Erzeuge das Sitemap aus der Datenbank, nicht aus einem Crawler. Crawl-basierte Sitemaps sind langsam, uebernehmen Routing-Bugs und produzieren falsche lastmod-Werte. In PostgreSQL loest eine materialisierte View auf content.updated_at (nicht row.updated_at) das Problem. Pinge Google ueber die Search Console API statt ueber den alten Ping-Endpoint, der im Juni 2023 abgeschaltet wurde. Pruefe via Log-File-Analyse, ob Googlebot das Sitemap tatsaechlich taeglich abruft; wenn nicht, hast du ein tieferes Crawl-Problem, beschrieben in Log file analysis: Was Googlebot wirklich tut.
Praktisches Takeaway: Heute Abend, lade dein sitemap.xml herunter, zaehle URLs mit Status != 200 und URLs, deren lastmod mit 100 anderen Seiten identisch ist. Liegt einer der Werte ueber 5%, verbrennst du Crawl. Schneide alles, was nicht canonical 200 indexierbar ist, segmentiere nach Typ und lass lastmod die Wahrheit erzaehlen. Innerhalb von vier Wochen siehst du Bewegung in 'Pro Tag gecrawlte Seiten' in der GSC. Es ist langweilig, und es funktioniert.