Duplicate content is een belangrijk item op je SEO-lijst om te checken. Het is verwarrend voor zoekmachines en niet echt vriendelijk voor je bezoekers. Daarnaast omvat duplicate content meer dan alleen maar wat gekopieerde tekst op een pagina. Hier lees je wat duplicate content precies is, wat de nadelen zijn en hoe je kunt ontdekken of jouw website er last van heeft.
Wat is duplicate content?
Duplicate content staat letterlijk voor dubbele inhoud en betekent dat dezelfde tekst (en afbeeldingen) op verschillende url’s voorkomt. In het kort:
De inhoud is exact gelijk of voor een groot deel gelijk
Er is sprake van verschillende url’s
Duplicate content kan binnen je eigen site voorkomen, maar ook tussen verschillende websites.
Kraakt je knie? Dan krijg je op verschillende sites precies dezelfde uitleg.
“Dit kan nadelig van invloed zijn op de positie van de site of de site kan worden verwijderd uit de index van Google en daardoor niet meer in zoekresultaten worden weergegeven.”
Maar wees gerust, als je verder leest, dan geeft Google aan dat duplicate content geen aanleiding is voor een penalty. Dit gebeurt alleen bij websites die bewust proberen de zoekresultaten te manipuleren. Dit soort website zijn berucht vanwege content scraping en content spam.
De nadelen van duplicate content voor SEO
Van duplicate content krijg je dus geen penalty, maar het heeft zeker nadelen voor SEO.
Hetgrootste nadeel is dat Google bepaalt welke pagina in de zoekresultaten wordt getoond. Dat is niet altijd de pagina die jij het belangrijkste vindt.
Het kost crawlbudget. De energie die de Googlebot besteedt aan het crawlen van vrijwel identieke pagina’s kan niet meer besteed worden aan meer unieke, relevante pagina’s.
Een concurrent kan een hogere positie in de zoekresultaten pakken met jouw content.
Het gaat ten koste van de gebruikerservaring als jouw bezoeker steeds dezelfde inhoud tegenkomt.
Nu je dit weet, ben je natuurlijk benieuwd in hoeverre jouw website last heeft van duplicate content, zodat je dit kunt aanpakken. Eerst is het goed om te weten dat er verschillende soorten duplicate content zijn.
Soorten duplicate content
Bij duplicate content denk je vaak letterlijk aan gekopieerde teksten die op meerdere pagina’s terugkomen. Maar er is ook duplicate content die ‘per ongeluk’ door technische instellingen ontstaat of die op verschillende websites voorkomt.
Varianten van je URL
Je website heeft altijd een standaard URL. Er kunnen echter variaties op die standaard URL bestaan waardoor je, zonder dat je het weet, dubbele pagina’s en dus dubbele content krijgt. Je hebt dan immers exact dezelfde inhoud op verschillende URLs. Het meest zien we deze varianten:
HTTP en HTTPS; vaak als de S van ‘secure’ is toegevoegd
Met www en zonder www
Met trailing slash en zonder trailing slash (het schuine streepje aan het eind van je domeinnaam)
Parameters; een ? achter jouw url gevolgd door bijvoorbeeld een filteroptie, trackingcode of paginering.
Zo zie je dat, als je hier geen aandacht aan besteedt, je al snel 5 dezelfde pagina’s op verschillende URL’s hebt.
Technische issues zorgen voor 4 extra versies van de hoofdpagina
Sterk op elkaar lijkende pagina’s
Soms heb je dubbele content doordat de inhoud van pagina’s grotendeels gelijk is. We zien dit bijvoorbeeld bij:
Lokale pagina’s waarbij alleen de plaatsnaam anders is
Agenda items waarbij alleen de datum anders is
Varianten van producten waarbij bijvoorbeeld de kleur anders is
Langere teksten zoals een visie en missie die op iedere pagina terugkomen
Dezelfde inhoud op verschillende websites
Als copywriter wil je natuurlijk niet dat de tekst waar jij zo hard aan gewerkt hebt, ineens bij de concurrent op de site staat. Andersom doe je dat toch ook niet? Maar ook onbedoeld zie je soms dezelfde teksten op verschillende websites terugkomen. Bijvoorbeeld:
Productinformatie die door de fabrikant is aangeleverd
Persberichten die door meerdere sites worden overgenomen
Een evenement waar verschillende websites naar verwijzen
Hoe check ik op duplicate content?
Er zijn verschillende manieren om je site te checken op duplicate content. Welke manier je gebruikt, hangt af van het soort duplicate content dat je wil onderzoeken. Deze methodes gebruiken wij:
Http status code checker
Google Search Console
DeepCrawl
Siteliner
Copyscape
1. Http status code checker
Om snel te checken of er technische issues zijn met duplicate content, ga je naar httpstatus.io. Hier typ je alle varianten van een willekeurige url in het zoekveld in. Als het goed is, zie je 1 url met alleen de status code 200. Dat is de standaard URL. Bij alle overige varianten wil je een status code 301 zien. Die URL’s worden dan met een 301-redirect doorgestuurd naar de standaard URL.
2. Google Search Console
Wil je weten in hoeverre Google jouw content als duplicate behandelt? In Google Search Console ga je naar Dekking en klik je op Uitgesloten. Nu zie je een samenvatting van redenen waarom bepaalde pagina’s niet zijn geïndexeerd. Een van die redenen kan een dubbele pagina zijn. Klik op het resultaat om te zien om welke pagina’s het gaat.
In Search Console zie je dubbele pagina’s
3. DeepCrawl
Je kunt ook een tool gebruiken om te checken op duplicate content. Wij gebruiken DeepCrawl voor een uitgebreide technische check. Deze tool geeft een samenvatting van veel issues binnen een site, waaronder duplicate content. Hier kun je verder op inzoomen en ontdekken welke pagina’s aandacht nodig hebben. Deepcrawl laat zowel technische issues zien als de meer inhoudelijke.
4. Siteliner
Hoeft het van jou allemaal wat minder uitgebreid? Dan is Siteliner een fijn alternatief. Het voordeel van Siteliner is dat je een voorbeeld van je pagina kunt zien met daarop alle dubbele content gearceerd. Voeg hier vooral je eigen interpretatie aan toe. Siteliner wil bijvoorbeeld een contactformulier dat op meerdere pagina’s staat ook als duplicate content aanmerken.
5. Copyscape
Wil je juist weten of iemand anders jouw content gebruikt? Met Copyscape ontdek je welke websites dezelfde tekst gebruiken.
De gearceerde tekst is gelijk aan jouw pagina
Wordt vervolgd…
Nu weet je wat duplicate content is en hoe je het kunt opsporen. In een volgend blog laten we je zien hoe je duplicate content kunt oplossen.