Een canonical URL is een HTML code die de hoofdversie voor dubbele of vergelijkbare pagina’s definieert. Als je dezelfde soort content beschikbaar hebt onder verschillende URL’s, dan kun je met een canonical tag aangeven welke versie moet worden geïndexeerd.
Een canonical URL of tag bestaat sinds 2009. Ze zijn gemaakt door een samenwerking van Yahoo, Microsoft en Google. Ze bieden een oplossing voor de problemen die ontstaan met dubbele content. Canonical tags gebruiken een eenvoudige en consistente syntaxis. Ze worden in de <head> sectie van een webpagina geplaatst. Dat ziet er als volgt uit:
<link rel="canonical" href="https://www.websote.nl/voorbeeld-pagina/" />
De betekenis van de code in een canonical URL of tag
Google houdt niet van dubbele content. Daardoor ervaart de zoekmachine deze problemen:
Dubbele inhoud heeft ook invloed op jouw crawl budget. Dat betekent dat Google uiteindelijk tijd verspilt aan het crawlen van meerdere versies van dezelfde pagina. Dat in plaats van het besteden van tijd aan het vinden van andere belangrijke content. Ook kan hierdoor duplicated content ontstaan.
“Als nieuwe pagina's op dezelfde dag worden gecrawld en gepubliceerd, hoeven website eigenaren zich niet te concentreren op het crawl budget. Ook als een website minder dan een paar duizend URL's heeft, wordt deze efficiënt gecrawld.”
Canonical tags lossen deze problemen op. Daardoor weet Google welke versie van een pagina moet worden geïndexeerd en gerangschikt. Dat geldt ook voor het consolideren van link equity. Als je geen canonical URL opgeeft beslist Google zelf wat de beste versie is.
Op deze manier op Google vertrouwen is helemaal geen goed idee. Zij kunnen een versie van jouw pagina selecteren die je eigenlijk niet canonical of als hoofdversie wilt hebben.
Google zegt dat ze de canonical URL die je instelt meestal respecteren. Toch is dat niet altijd het geval. Dat komt omdat canonical tags hints zijn en geen richtlijnen. Als ze worden gerespecteerd moeten alle signalen consolideren naar de canonical URL.
Het is aannemelijk om te denken dat jouw website geen dubbele content heeft. Je plaatst namelijk niet meerdere keren hetzelfde bericht op verschillende pagina's. Maar, het is goed om te weten dat de zoekmachines de URL’s crawlen in plaats van de website pagina’s.
Dit betekent dat ze example.com/product en example.com/product?color=red als unieke pagina's zien. Ook als het gaat om dezelfde pagina’s met identieke inhoud. Dit zijn de zogenaamde geparametriseerde URL's. Ze zijn een veel voorkomende oorzaak van dubbele content. Vooral op e-commerce websites met een gefilterde navigatie.
Fashion Outlet verkoopt overhemden. Dit is de URL voor de hoofdcategorie pagina:
https://www.fashionoutlet.com.nl/en-gb/kleding/shirts.html
Als je filtert op XL overhemden wordt er een parameter aan de URL toegevoegd:
https://www.fashionoutlet.com.nl/en-gb/kleding/shirts.html?Maat=XL
Als je ook filtert op blauwe overhemden wordt er nog een parameter toegevoegd:
https://www.fashionoutlet.com.nl/en-gb/kleding/shirts.html?Maat=XL&kleur=Blauw
Voor Google zijn dit allemaal aparte pagina's. Ook al verschilt de inhoud slechts marginaal. Toch hebben niet alleen e-commerce websites te maken met dubbele inhoud. Hieronder lees je andere oorzaken van dubbele content die op alle typen websites van toepassing zijn:
In deze situaties is het juiste gebruik van canonieke tags van cruciaal belang. Daarnaast zijn cross-domain duplicate content problemen ook iets om rekening mee te houden. Als je de inhoud syndiceert moet je een zelfverwijzende canonical tag gebruiken op jouw artikel.
Met een cross-domain canonical tag kun je de gesyndiceerde inhoud laten vermelden als de hoofdversie. Je voorkomt niet altijd dat de gesyndiceerde inhoud in de zoekresultaten verschijnt, maar je vermindert wel het risico dat deze hoger scoort dan het origineel.
Canonical tags zijn eenvoudig te implementeren. Dat kan op 4 verschillende manieren. Er zijn altijd een aantal regels waar jij je aan moet houden. Ongeacht de methode die je kiest.
Google stelt het gebruik van absolute URL’s voor in plaats van relative URL’s met het rel="canonical" link element. Je moet dus de volgende structuur gebruiken:
<link rel="canonical" href="https://example.com/sample-page/" />
In tegenstelling tot deze:
<link rel="canonical" href="/voorbeeld-pagina/" />
Google ziet URL’s met hoofdletters en kleine letters als 2 verschillende URL's. Zorg er daarom voor dat je kleine letters URL’s gebruikt op je server en voor je canonical tags.
Als je bent overgeschakeld op SSL moet je ervoor zorgen dat je geen HTTP URL's opgeeft in jouw canonical tags. Als je dit wel doet leidt dit mogelijk tot verwarring en onverwachte resultaten. Als je op een beveiligd SSL domein zit, gebruik dan deze versie van je URL:
<link rel="canonical" href="https://example.com/sample-page/" />
In tegenstelling tot:
<link rel="canonical" href="http://example.com/sample-page/" />
Let op! Als je geen HTTPS gebruikt is een tegenovergesteld gebruik van de URL’s correct.
Google zegt:
Zelfverwijzende canonical tags worden aanbevolen, maar dit is niet verplicht. Je gebruikt een zelfverwijzende canonical tag omdat het de zoekmachine vertelt welke pagina je geïndexeerd wilt hebben of wat de URL moet zijn als deze wordt geïndexeerd.
Ook als je één pagina hebt zijn er soms verschillende variaties van de URL die die pagina kunnen oproepen. Bijvoorbeeld met parameters, met hoofdletters en kleine letters of www en non-www. Al deze dingen kunnen worden opgeruimd met een rel canonical tag.
Weet je niet precies hoe een zelfverwijzende canonical tag werkt? Dit is in feite een canonical tag op een pagina die verwijst naar zichzelf. Als de URL bijvoorbeeld https://example.com/sample-page is, dan is een zelfverwijzende canonieke tag:
<link rel="canonical" href="https://example.com/sample-page" />
De meeste moderne CMS voegen automatisch zelfverwijzende URL's toe. Gebruik je een een gepaste CMS? Dat moeten deze worden toegevoegd met een code.
Als de pagina meerdere canonical tags heeft negeert Google ze beiden. Heb je meerdere declaraties rel=canonical, dan negeert Google waarschijnlijk alle rel=canonical hints.