Wat is duplicate content en hoe check je dat?

Duplicate content is een belangrijk item op je SEO-lijst om te checken. Het is verwarrend voor zoekmachines en niet echt vriendelijk voor je bezoekers. Daarnaast omvat duplicate content meer dan alleen maar wat gekopieerde tekst op een pagina. Hier lees je wat duplicate content precies is, wat de nadelen zijn en hoe je kunt ontdekken of jouw website er last van heeft.

Wat is duplicate content?

Duplicate content staat letterlijk voor dubbele inhoud en betekent dat dezelfde tekst (en afbeeldingen) op verschillende url’s voorkomt. In het kort:

  • De inhoud is exact gelijk of voor een groot deel gelijk
  • Er is sprake van verschillende url’s
  • Duplicate content kan binnen je eigen site voorkomen, maar ook tussen verschillende websites.
Dubbele content op verschillende sites
Kraakt je knie? Dan krijg je op verschillende sites precies dezelfde uitleg.

Hoe erg is duplicate content?

Als je nagaat wat Google over duplicate content zegt, dan schrik je wel even: 

“Dit kan nadelig van invloed zijn op de positie van de site of de site kan worden verwijderd uit de index van Google en daardoor niet meer in zoekresultaten worden weergegeven.”

Maar wees gerust, als je verder leest, dan geeft Google aan dat duplicate content geen aanleiding is voor een penalty. Dit gebeurt alleen bij websites die bewust proberen de zoekresultaten te manipuleren. Dit soort website zijn berucht vanwege content scraping en content spam.

De nadelen van duplicate content voor SEO

Van duplicate content krijg je dus geen penalty, maar het heeft zeker nadelen voor SEO.

  1. Het grootste nadeel is dat Google bepaalt welke pagina in de zoekresultaten wordt getoond. Dat is niet altijd de pagina die jij het belangrijkste vindt.
  2. Het kost crawlbudget. De energie die de Googlebot besteedt aan het crawlen van vrijwel identieke pagina’s kan niet meer besteed worden aan meer unieke, relevante pagina’s.
  3. Een concurrent kan een hogere positie in de zoekresultaten pakken met jouw content.
  4. Het gaat ten koste van de gebruikerservaring als jouw bezoeker steeds dezelfde inhoud tegenkomt.

Nu je dit weet, ben je natuurlijk benieuwd in hoeverre jouw website last heeft van duplicate content, zodat je dit kunt aanpakken. Eerst is het goed om te weten dat er verschillende soorten duplicate content zijn.

Soorten duplicate content

Bij duplicate content denk je vaak letterlijk aan gekopieerde teksten die op meerdere pagina’s terugkomen. Maar er is ook duplicate content die ‘per ongeluk’ door technische instellingen ontstaat of die op verschillende websites voorkomt.

Varianten van je URL

Je website heeft altijd een standaard URL. Er kunnen echter variaties op die standaard URL bestaan waardoor je, zonder dat je het weet, dubbele pagina’s en dus dubbele content krijgt. Je hebt dan immers exact dezelfde inhoud op verschillende URLs. Het meest zien we deze varianten:

  • HTTP en HTTPS; vaak als de S van ‘secure’ is toegevoegd
  • Met www en zonder www
  • Met trailing slash en zonder trailing slash (het schuine streepje aan het eind van je domeinnaam)
  • Parameters; een ? achter jouw url gevolgd door bijvoorbeeld een filteroptie, trackingcode of paginering.

Zo zie je dat, als je hier geen aandacht aan besteedt, je al snel 5 dezelfde pagina’s op verschillende URL’s hebt.

Illustratie technische duplicate content
Technische issues zorgen voor 4 extra versies van de hoofdpagina

Sterk op elkaar lijkende pagina’s

Soms heb je dubbele content doordat de inhoud van pagina’s grotendeels gelijk is. We zien dit bijvoorbeeld bij:

  • Lokale pagina’s waarbij alleen de plaatsnaam anders is
  • Agenda items waarbij alleen de datum anders is
  • Varianten van producten waarbij bijvoorbeeld de kleur anders is
  • Langere teksten zoals een visie en missie die op iedere pagina terugkomen

Dezelfde inhoud op verschillende websites

Als copywriter wil je natuurlijk niet dat de tekst waar jij zo hard aan gewerkt hebt, ineens bij de concurrent op de site staat. Andersom doe je dat toch ook niet? Maar ook onbedoeld zie je soms dezelfde teksten op verschillende websites terugkomen. Bijvoorbeeld:

  • Productinformatie die door de fabrikant is aangeleverd
  • Persberichten die door meerdere sites worden overgenomen
  • Een evenement waar verschillende websites naar verwijzen
 

Hoe check ik op duplicate content?

Er zijn verschillende manieren om je site te checken op duplicate content. Welke manier je gebruikt, hangt af van het soort duplicate content dat je wil onderzoeken. Deze methodes gebruiken wij:

  1. Http status code checker
  2. Google Search Console
  3. DeepCrawl
  4. Siteliner
  5. Copyscape

1. Http status code checker

Om snel te checken of er technische issues zijn met duplicate content, ga je naar httpstatus.io. Hier typ je alle varianten van een willekeurige url in het zoekveld in. Als het goed is, zie je 1 url met alleen de status code 200. Dat is de standaard URL. Bij alle overige varianten wil je een status code 301 zien. Die URL’s worden dan met een 301-redirect doorgestuurd naar de standaard URL.

2. Google Search Console

Wil je weten in hoeverre Google jouw content als duplicate behandelt? In Google Search Console ga je naar Dekking en klik je op Uitgesloten. Nu zie je een samenvatting van redenen waarom bepaalde pagina’s niet zijn geïndexeerd. Een van die redenen kan een dubbele pagina zijn. Klik op het resultaat om te zien om welke pagina’s het gaat.

Duplicate content checken Search Console
In Search Console zie je dubbele pagina’s

3. DeepCrawl

Je kunt ook een tool gebruiken om te checken op duplicate content. Wij gebruiken DeepCrawl voor een uitgebreide technische check. Deze tool geeft een samenvatting van veel issues binnen een site, waaronder duplicate content. Hier kun je verder op inzoomen en ontdekken welke pagina’s aandacht nodig hebben. Deepcrawl laat zowel technische issues zien als de meer inhoudelijke.

4. Siteliner

Hoeft het van jou allemaal wat minder uitgebreid? Dan is Siteliner een fijn alternatief. Het voordeel van Siteliner is dat je een voorbeeld van je pagina kunt zien met daarop alle dubbele content gearceerd. Voeg hier vooral je eigen interpretatie aan toe. Siteliner wil bijvoorbeeld een contactformulier dat op meerdere pagina’s staat ook als duplicate content aanmerken.

5. Copyscape

Wil je juist weten of iemand anders jouw content gebruikt? Met Copyscape ontdek je welke websites dezelfde tekst gebruiken.

Duplicate content in Copyscape
De gearceerde tekst is gelijk aan jouw pagina

Wordt vervolgd…

Nu weet je wat duplicate content is en hoe je het kunt opsporen. In een volgend blog laten we je zien hoe je duplicate content kunt oplossen.

Share on facebook
Share on twitter
Share on linkedin
Share on pinterest
Share on skype

Leave a Reply

Your email address will not be published. Required fields are marked *

Categories
Scroll to Top

Deze website gebruikt cookies om je de best mogelijke ervaring te bieden.