Een XML Sitemap is een gestructureerd bestand in XML-formaat dat fungeert als een routekaart van een website voor zoekmachines zoals Google, Bing en andere crawlers. Het bestand bevat een overzicht van alle belangrijke URL's op een website, samen met aanvullende metadata zoals de laatste wijzigingsdatum, de verwachte wijzigingsfrequentie en de relatieve prioriteit van elke pagina.
Het primaire doel van een XML Sitemap is om zoekmachines te helpen bij het efficiënt ontdekken en indexeren van alle relevante pagina's op een website. Dit is vooral waardevol voor grote websites, nieuwe websites met weinig externe backlinks, of websites met complexe navigatiestructuren waarbij sommige pagina's moeilijk te vinden zijn via interne links.
Structuur van een XML Sitemap
Een XML Sitemap volgt een specifiek protocol dat is vastgesteld door de grote zoekmachines. Het bestand begint met een XML-declaratie en bevat vervolgens een <urlset> element met daarin meerdere <url> elementen. Elk URL-element kan de volgende sub-elementen bevatten:
- <loc>: De volledige URL van de pagina (verplicht)
- <lastmod>: Datum van laatste wijziging in ISO 8601-formaat
- <changefreq>: Hoe vaak de pagina waarschijnlijk verandert (always, hourly, daily, weekly, monthly, yearly, never)
- <priority>: Relatieve prioriteit ten opzichte van andere pagina's op de site (0.0 tot 1.0)
Soorten XML Sitemaps
Er bestaan verschillende gespecialiseerde varianten van XML Sitemaps voor specifieke contenttypen:
- Standaard XML Sitemap: Voor reguliere webpagina's
- Image Sitemap: Voor afbeeldingen met extra metadata zoals licentie-informatie
- Video Sitemap: Voor video-content met details zoals duur, rating en beschrijving
- News Sitemap: Speciaal voor nieuwsartikelen met publicatiedatum en keywords
- Mobile Sitemap: Voor mobiele versies van pagina's (inmiddels minder relevant door mobile-first indexing)
Technische vereisten
Een XML Sitemap moet aan bepaalde technische eisen voldoen om correct te functioneren:
- Maximum 50.000 URL's per sitemap bestand
- Maximum bestandsgrootte van 50 MB (ongecomprimeerd)
- UTF-8 encoding
- Absolute URL's (inclusief protocol en domeinnaam)
- Escape-tekens voor speciale karakters
- Voor grotere websites: gebruik van een sitemap index bestand
