Duplicate content

Is de ophef rond duplicate content gegrond?

Je hebt een SEO test gerund en de uitkomst is schokkend: je hebt wel meer dan 200 duplicate content fouten! 

Je kijkt beduusd naar je website en vraagt je af hoe je al deze fouten gaat wegwerken. Alleen van de gedachte word je al moe. 

De vraag is echter, is deze reden tot onrust gegrond? Heel kort en krachtig: nee. Over het algemeen heeft duplicate content geen grote invloed op SEO. Enkele uitzonderingen daargelaten. 

Over duplicate content bestaan heel veel misverstanden. Tijd om deze voor eens en voor altijd uit de lucht te halen. In dit artikel tackelen we de vijf volgende topics:

1. Wat is duplicate content nu eigenlijk? 

2. Hoe duplicate content ontstaat 

3. Duplicate content is slecht voor SEO 

4. Duplicate content opsporen

5. Duplicate content oplossen 

Wat is duplicate content nu eigenlijk? 

Duplicate content is een term die je vaak tegenkomt in SEO-land. Maar wat is het eigenlijk? 

Duplicate content, ook wel dubbele inhoud genoemd, is website content die op meer dan één plaats op het internet zichtbaar is. Met andere woorden, content die op meerdere webpagina’s of URLs staat. Duplicate content wordt ook wel dubbele content of dubbele inhoud genoemd.

De vraag die vaak wordt is gesteld is waar nu de grens ligt. Oftewel, wanneer is iets duplicate content en wanneer niet? Google zegt dat het gaat om “substantiële blokken inhoud” die ofwel volledig gelijk zijn of aanzienlijk veel op elkaar lijken. 

Wat dit betekent: enkele gekopieerde teksten van een website zijn dus nog geen duplicate content. Het moet écht gaan om grote substantiële blokken. Je kunt dus kleine stukjes tekst kopiëren en herschrijven, zonder hier gestraft voor te worden. 

Er heerst echter nog wel veel onduidelijkheid over of het nu precies om dezelfde inhoud gaat, of om inhoud die een voor een bepaald percentage overeenkomt. Google laat ons met deze kwestie in het duister. 

Soorten duplicate content 

Er zijn grofweg twee soorten duplicate content te onderscheiden. Twee identieke stukken content die te vinden zijn op twee verschillende websites, worden externe duplicate content genoemd. Gekopieerde content binnen één domein, wordt interne duplicate content genoemd. 

Externe duplicate content 

Omdat er heel wat content gestolen en herbruikt wordt op het internet, is dit een vorm van duplicate content die regelmatig voorkomt. Veel ‘copy pasters’ denken: “als ik dit stuk content kopieer, dan is mijn website weer wat gevulder en kan ik snel profiteren van een betere ranking”. 

Een stuk content overnemen van een andere website is toegestaan, zolang je er maar toestemming voor vraagt. Ben je dus van plan een stuk content van een andere website over te nemen? Wees dan zo slim om toestemming aan de auteur te vragen :). Doe je dit niet en mocht de auteur er ooit een probleem van maken, dan kan het je zelfs een rechtszaak of een dure schadeclaim opleveren. 

Helaas voor de copy pasters is het niet zo dat je door het overnemen van content ook een SEO-voordeel opbouwt. Wat dus wel vaak wordt gedacht. Een zoekmachine laat namelijk alleen het originele stuk content zien. En dit is logischerwijs het stuk content dat van de oorspronkelijke bron komt. Dit betekent dat jouw gekopieerde stuk niet of nauwelijks in de zoekresultaten wordt getoond. 

Even zonder dollen: iedereen kopieert wel eens een stuk content voor zijn eigen website. De mate waarin en de manier waarop je dat doet is echter van groot belang. Neem je klakkeloos een groot stuk tekst over, dan heeft de gekopieerde content geen schijn van kans om goed te ranken. Wat beter werkt is een klein deel van een stuk tekst over nemen, deze vervolgens herschrijven en aanvullen met eigen content. Zo ziet Google dat het nieuwe stuk content origineel is en wordt er een betere ranking toegekend. 

Interne duplicate content 

Interne duplicate content wordt over het algemeen, meestal onbewust, door jezelf veroorzaakt. Wanneer Google je website crawlt en ontdekt dat er twee webpagina’s op elkaar lijken, kan er verwarring veroorzaakt worden. Het gevolg is dat Google vervolgens de pagina die volgens hen het meest relevant is, beter laat ranken. Het kan zijn dat dit de pagina is die jij juist helemaal niet hoger geranked wil laten hebben. 

Bijvoorbeeld: op de website van een webbureau staan zowel een diensten- als blogpagina met informatie over het laten ontwikkelen van een website. De tekst op beide pagina’s is bijna identiek en hierdoor is de kans groot dat Google het als duplicate content ziet. 

Dit fenomeen wordt ook wel interne concurrentie of keyword kannibalisatie genoemd. De pagina’s vreten elkaars ranking als het ware op.  

Het komt bij verschillende websites voor, maar toch vooral bij webshops. Vaak is het bij webshops namelijk zo dat je verschillende paden op dezelfde productpagina kan komen. Hoe dit eruit ziet? Kijk maar naar het onderstaande fictieve voorbeeld: 

www.grasmaaierwebshop.nl/grasmaaiers/budget/moizasie/uitvoering-a
www.grasmaaierwebshop.nl/grasmaaiers/merken/moizasie/uitvoering-a

Ondanks dat de URL’s verschillend zijn, ziet Google dit nog steeds als duplicate content omdat de slugs te veel op elkaar lijken.

Hoe duplicate content onstaat 

Eigenlijk is het zo dat de meeste website-eigenaren niet met opzet duplicate content creëren. Maar dat betekent nog niet dat het er niet is. Sterker nog, meer dan 29% van de content gepubliceerd op het web wordt gezien als duplicate content. 

Laten we eens kijken naar enkele van de meest voorkomende manieren waarop dubbele inhoud onbedoeld wordt gemaakt: 

Kopiëren en plakken

Deze komt zowel op intern als externe niveau voor. Internal duplicate content ontstaat door meerdere pagina’s met dezelfde tekst aan te maken. Externe duplicate content onstaat door de content van een website letterlijk over te nemen op je eigen website. Dit gebeurt heel veel bij webshops. Die krijgen namelijk standaard teksten van leveranciers opgestuurd welke vervolgens klakkeloos overgenomen worden. Het gevolg is dat veel webshops in de zoekresultaten dezelfde teksten hebben. Dit komt hun SEO niet ten goede. 

URL-variaties 

URL-parameters, zoals kliktracking en bepaalde analysecode, kunnen ook dubbele inhoudsproblemen veroorzaken.

Bijvoorbeeld:

www.sowmedia.nl/blauw-widgets?c … is een duplicaat van www.sowmedia.nl/blauw-widgets?c…&cat=3 “class =” redactor-autoparser-object “> www.sowmedia.nl /blauw-widgets is een duplicaat van www.sowmedia.nl/blauw-widgets?cat=3&color=blue

Ook kunnen sessie-ID’s een veelvoorkomende veroorzaker zijn van dubbele inhoud. Dit gebeurt wanneer elke gebruiker die een website bezoekt, een andere sessie-ID krijgt toegewezen die is opgeslagen in de URL.

Printervriendelijke versies van inhoud kunnen ook dubbele inhoudsproblemen veroorzaken wanneer meerdere versies van de pagina’s worden geïndexeerd.

HTTP vs. HTTPS of WWW vs. niet-WWW-pagina’s

Als je website twee verschillende versies heeft (“www.site.com” en “site.com”, met en zonder het voorvoegsel “www”), en dezelfde inhoud in beide versies voorkomt, kun je ook dubbele inhoudsproblemen krijgen. Hetzelfde geldt voor sites die versies onderhouden op zowel http: // als https: //.

Duplicate content is slecht voor SEO

Zoals we in de introductie al vertelden, kan duplicate content je technisch gezien geen penalty opleveren. Maar de vraag is dan nog wel: hoe slecht is duplicate content voor SEO? Er zijn een aantal minder leuke scenario’s die kunnen voorkomen. We bespreken ze hieronder.

Google laat de verkeerde webpagina zien

Wanneer er meerdere stukken vergelijkbare inhoud op meer dan één locatie op het internet staan, kan het voor zoekmachines moeilijk zijn om te bepalen welke versie het meest relevant is voor een bepaalde zoekopdracht. In veel gevallen zal Google een keuze zal moeten maken tussen de dubbele-inhoudspagina’s en er slechts één tonen.

De zoekopdracht is van grote invloed hoe Google met duplicate content omgaat. Stel je voor je hebt zowel een Belgische als Nederlandse webshop en een potentiële klant wil je bezorgkosten weten. Er wordt vervolgens de bezorgkosten met jouw websitenaam opgezocht. Het probleem is alleen dat er twee pagina’s precies hetzelfde zijn en Google daarom een keuze zal moeten maken. Omdat de potentiële klant geen landnaam in de zoekopdracht heeft verwerkt, zal Google de pagina kiezen met de hoogste autoriteit. En het kan dan voorkomen dat dit precies de verkeerde pagina is. 

Verzwakte linkkracht 

In de meeste gevallen, handelt Google duplicate content goed af en heeft het geen negatief effect op je ranking. Toch kan het wel invloed hebben op de linkkracht als een andere website verwijst naar jouw duplicate content. De links die vanaf een andere pagina doorverwijzen naar jouw website, weten namelijk niet waar ze naartoe moeten linken. Ze raken er in de war van dat dezelfde content op meerdere plekken te vinden is. 

In plaats dat alle links naar één unieke pagina verwijzen, worden de links verdeeld over alle duplicates. Het gevolg is dat je lager zult ranken dan wanneer er maar één unieke pagina op de website was geweest. 

Keyword kannibalisatie 

We hebben het al eerder als voorbeeld gegeven, maar een ander negatief effect op SEO van duplicate content is keyword kannibalisatie. Omdat zoekmachines worden gedwongen om te kiezen tussen twee pagina’s, wordt degene getoond met de meeste autoriteit. In het geval van het webbureau wordt dus enkel de dienstenpagina of het blog hoog geranked in de zoekresultaten. Het is dan erg spijtig wanneer je op beide pagina’s relevante informatie hebt staan en er maar één wordt getoond. 

Je bent dan letterlijk aan het concurreren met jezelf. Om dit probleem te voorkomen kun dus je beter unieke content en een uniek keyword gebruiken. 

Verspilling van crawl budget

Om de zoveel tijd doorloopt Google je website. Dit wordt crawlen genoemd. Op deze manier weet Google wat er te vinden is op je website en wat je te bieden hebt. Door middel van deze informatie kan Google een zoekopdracht matchen met de content op je website. Omdat Google een crawl budget gebruikt, is het belangrijk dat de juiste pagina’s van je website worden gecrawld. Er kunnen er namelijk maar een maximaal aantal gecrawled worden. 

Voornamelijk voor grote websites is dit van groot belang. Mocht je veel duplicate content op je website hebben staan, dan is de kans groot dat het crawlbudget wordt verspeeld aan nutteloze pagina’s. 

In het uiterste geval: een penalty

Duplicate content levert je geen penalty op, tenzij je het héél bont maakt. Alleen in zeer zeldzame gevallen, wanneer je bewust bezig bent met manipuleren van de ranking en gebruikers te misleiden, kan het invloed hebben op de ranking van je website. In het uiterste geval wordt een website verwijderd uit de index van Google en daardoor niet meer in de zoekresultaten weergegeven. Dit kan echter alleen voorkomen als bijvoorbeeld je gehele website uit duplicate content bestaat. 

Duplicate content opsporen

Duplicate content oplossen is in de meeste gevallen niet heel moeilijk, maar hiervoor moet je duplicaten wel eerst opsporen. Hier zijn verschillende manieren en tools voor. 

De makkelijkste manier: zoeken in Google

Een simpele manier om te zoeken naar duplicate content is om een stukje tekst van een pagina te pakken en daarop te zoeken in Google. Als je het stukje tussen aanhalingtekens zet, dan kun je zien of er een website is die letterlijk jouw tekst heeft gekopieerd. 

Duplicate content tools

Als je (grootschalig) onderzoek wilt doen naar interne en externe duplicate content, is het verstandig om hier een tool voor in te zetten. Er zijn veel verschillende tools om duplicate content mee op te sporen. Degene die wij zelf gebruiken, zijn: 

Copyscape 
Siteliner
Google Search Console
SE Ranking

Externe duplicate content check

Een handige tool die je kan helpen bij het controleren van externe duplicate content is Copyscape. Vul op hun website de URL van je website in en er wordt voor je onderzocht of er duplicaten van jouw teksten zijn. Zie je in de resultaten dat iemand jouw teksten heeft gekopieerd? Stuur de eigenaar van de website dan een verzoek om de teksten te verwijderen. 

Interne duplicate content check

Met de tool Siteliner kun je je eigen website checken op dubbele inhoudsproblemen. Echter moet je hier wel het onderscheid maken tussen duplicate content en content die je vanzelfsprekend op meerdere plekken van je website herhaalt. Zoals je menu, footer en contactpagina bijvoorbeeld. Dit soort content wordt ook wel common content genoemd en vormt geen gevaar voor SEO.

Google Search Console: uitgebreide audit duplicate content

Als je een uitgebreider onderzoek voor je duplicate content wil doen, raden wij de tool Google Search Console aan. Met deze tool kun je zien dat bepaalde pagina’s niet geïndexeerd worden, omdat ze als duplicate content worden gezien of als er een duplicate pagina is gevonden zonder dat er aangegeven is wat het origineel is. Ook kun je zien welke van de duplicaten Google als canonieke pagina heeft geselecteerd. Het handige is dat als je op deze foutmeldingen klikt, de locatie van het probleem wordt aangegeven. 

SE Ranking: duplicate keywords 

Een andere zeer bruikbare tool voor het opsporen van duplicate content is SE Ranking. Naast dat deze tool laat zien op welke keywords jouw website in Google wordt getoond, kun je ook zien of een zoekwoord gekoppeld is aan één of meerdere URL’s. Zo kan het voorkomen dat een keyword gekoppeld is aan drie verschillende webpagina’s. Hierdoor weet Google niet welke pagina het hoogst moet ranken, omdat alle drie de pagina’s sterk op elkaar lijken. 

Hoe kun je duplicate content voorkomen

In het beste geval heb je natuurlijk helemaal geen duplicate content op je website. Het is namelijk beter om te voorkomen dan te genezen. Dit scheelt een hoop werk. Hoe je dit het snelst kunt bereiken? 

Unieke content maken 

De enige manier om echt goed te ranken in Google is door het creëren van originele en relevante content. Content die zowel uniek en relevant is voor de zoekmachine als de zoekmachinegebruiker, wordt namelijk pas echt gewaardeerd. Vanzelfsprekend is duplicate content dit niet. Probeer bij het maken van de teksten voor je website zo min mogelijk content van andere websites over te nemen. Anders zal je website nooit hoog gaan ranken in de zoekresultaten. Ook is dit de beste manier om duplicate content te vermijden. 

Is het kwaad al geschied en heb je duplicate content ontdekt? Geen man over boord! Met de volgende tips heb je de duplicate content snel opgelost: 

Content aanpassen

Heb je een duplicate content fout op twee of meer pagina’s ontdekt? Probeer ze allemaal uniek te maken door een ander keyword uit te kiezen en de tekst te herschrijven. Het kan best lang duren voordat Google nieuwe pagina’s een bepaalde ranking toekent. Daarom is het aanpassen van de content van reeds bestaande pagina’s zeker gunstig. Bestaande pagina’s zijn tevens al geïndexeerd en hebben ook al een ranking, waardoor Google de veranderingen sneller zal opmerken. 

Gebruik redirects 

Worden meerdere pagina’s op je website aan hetzelfde keyword gekoppeld door Google? Maak dan een redirect aan van alle duplicate pagina’s naar de hoofdpagina. Als een bezoeker op één van de duplicate pagina’s belandt, wordt deze vervolgens doorverwezen naar de originele bron. 

Het grote voordeel is dat door de redirects een groot deel van de waarde van de duplicate pagina’s doorgegeven wordt aan de hoofdpagina. Hierdoor krijgt de hoofdpagina een hoge SEO score. 

Je kunt een redirect aanmaken met een plugin zoals Yoast SEO of via je htaccess-bestand.

Gebruik canonicals

Met een canonical tag kun je een zoekmachine laten weten dat één of meerdere pagina’s duplicaten zijn. Net als met een redirect wordt alle waarde in principe doorgegeven. Het grote verschil is alleen dat pagina’s met een canonical tag gewoon te bekijken zijn. Een bezoeker wordt dus niet automatisch naar de hoofdpagina doorgestuurd, zoals wel het geval is bij een redirect.

Een canonical tag staat in de broncode van je website. Net als de redirect, kun je deze makkelijk toevoegen met Yoast SEO

No index 

Je kunt er ook voor kiezen om bepaalde pagina’s niet te laten indexeren. Ze worden dan niet getoond in de zoekresultaten. Dit kan van pas komen voor bijvoorbeeld een bedank- of oude vacaturepagina’s. Je kunt ervoor kiezen om de pagina nog wel te laten crawlen maar niet meer te indexeren door middel van noindex + follow om zo de linkkracht te behouden. Wil je dat Google de pagina volledig negeert en alle links ook? Kies dan voor noindex + nofollow. Dit kun je opnieuw instellen met Yoast SEO

Hulp nodig met duplicate content?

Heb je veel duplicate content fouten en besteed je het oplossen hiervan liever uit? We begrijpen het en helpen je graag verder. We hebben al veel klanten geholpen met het opsporten en verhelpen duplicate content. Het resultaat hiervan? Unieke pagina’s en een verbeterde ranking op specifieke keywords en de website in het algemeen. Naast het oplossen van duplicate content, bieden we ook nog andere zoekmachine optimalisatie diensten aan zoals linkbuilding, copywriting en conversie-optimalisatie.