Reguliere expressie (regex) en SEO

Let op: dit artikel is gericht op (technische) SEO-specialisten die meer willen weten over reguliere expressie. Voor beginners is dit blog mogelijk te ingewikkeld of complex. Mocht je meer willen weten over reguliere expressie en hoe jij dit succesvol kunt gebruiken binnen jouw bedrijf? Neem dan gerust contact met ons op. 

Soms zijn er van die handigheidjes, waarmee je taken kan automatiseren, of waarmee je veel tijd bespaart. Reguliere expressie (regex) klinkt nu misschien nog vaag, maar maakt veel mogelijk, bijvoorbeeld bij het uitvoeren van A/B testen, of bij het uitsluiten van url’s in de Robots.txt. In dit blogartikel lees je hoe jij reguliere expressie kan inzetten voor SEO. 

Wat is reguliere expressie? (Regex)

Een reguliere expressie is een reeks die specifieke tekstpatronen beschrijft. Deze patronen kunnen worden gebruikt om te zoeken naar overeenkomstige tekst, of om te kijken of een bepaalde reeks voldoet aan het patroon dat wordt beschreven door de reguliere expressie. Hieronder een tabel met hoe reguliere expressie werkt en welke expressies veel gebruikt worden door SEO-specialisten. 

.Matcht een enkele karakter 
.*Een match voor 0 of meer karakters
.+.+ een match voor 1 of meer karakter(s)
dEen match voor een enkel cijfer (0-9)
?Maakt het teken dat ervoor staat optioneel
|Geeft een “of” functie aan 
^Wordt gebruikt om het begin van een reeks aan te geven.
[ ]Geeft een range aan 

Voorbeeld reguliere expressie: 

Matcht 
.onderwonder
.*onderbijzonder
onder.* onderbroek 

Reguliere expressies worden vaak gebruikt in computerprogramma’s om tekst te verwerken en te analyseren. Regex wordt door SEO-specialisten het meest gebruikt in sheets,.txt bestanden en in software van Google. Later in dit artikel leggen wij haarfijn uit hoe wij regex gebruiken in Google sheets, Google Search Console en Google Data Studio. 

Hoe werkt reguliere expressie? 

Reguliere expressie voeg je toe aan een file, die ervoor zorgt dat de juiste match ontstaat. Software en programmeertalen die reguliere expressie lezen, zorgen ervoor dat het gelezen wordt, en matcht karakters met de instructies. Even concreet: voor ons als SEO-specialist betekent dit dat wij A/B testen kunnen uitvoeren, doordat wij wijzigingen aan groepen url’s kunnen doorvoeren. 

Regex 

SEO-specialisten en developers kijken graag even af welke reguliere expressie zij nodig hebben, voordat zij iets doorvoeren. Vandaar dat wij hieronder een lijst hebben opgesteld met regex die SEO-specialisten vaak nodig hebben. URL-patronen en variabelen ontdek je hierdoor makkelijker. Kom je er niet uit welke regex jij nodig hebt? Dan hebben wij zo nog een ware eyeopener voor je. 

Wat is het verschil tussen . en .* in reguliere expressie? 

Het verschil tussen een punt en een asterisk is dus dat een punt overeenkomt met één teken, terwijl een asterisk overeenkomt met één of meer tekens (of zelfs geen tekens). Dit betekent dat als je een regex-patroon “A.*B” hebt, dit zal overeenkomen met een breder scala aan teksten dan als je een patroon “A.B” hebt. De .* regex zorgt dus voor nieuwe combinaties. 

In reguliere expressies staat een punt (.) voor een enkel teken. Dit betekent dat de punt overeenkomt met elk teken dat op die positie voorkomt in de tekst. Bijvoorbeeld, als je een regex-patroon “A.B” hebt, zal dit overeenkomen met “AB”, “ACB”, “ADB”, enzovoort.

Een asterisk (.*) na een teken of patroon betekent dat het vorige teken of patroon kan voorkomen, maar niet hoeft. Dit betekent dat als je een regex-patroon “A.*B” hebt, dit overeenkomt met “AB”, “AXXB”, “AXXXB”, enzovoort. Dit betekent dat er een willekeurig aantal tekens tussen de A en de B kan voorkomen, of zelfs geen tekens. 

Krijg direct de juiste regex met ChatGTP 

Tijdens het schrijven van deze blog bracht OpenAI een nieuwe taalmodel uit. Voorheen gebruikte wij al GTP-3 voor het schrijven van gastblogs, maar het lijkt erop dat dit nieuwe taalmodel in de 3.5 series nog een stuk sterker is. Via ChatGTP vind je eenvoudig de regex waar jij naar op zoek bent. Veel SEO specialisten gebruikten AI enkel nog voor contentmarketing, maar ook voor technische SEO-specialisten en developers wordt AI steeds interessanter. Hieronder zie je een voorbeeld waarbij ik een regex zoek voor een groep url’s, waar zowel het woord “seo” als “specialist” in voorkomt.

Regex-codes toegepast in een SEO-analyse

Regex opstellen met AI in sheet

Een reguliere expressie opstellen is vaak veel uitzoekwerk. Ook omdat er een hoop mis kan gaan, wanneer je niet de juiste formule gebruikt. Naast dat je de ChatGTP kunt gebruiken voor het vinden van regex, hebben wij ook een sheet. Deze is nog gebaseerd op GTP-3 en is minder zorgvuldig. Toch kan de GTP 3 regex generator je een handje helpen. Je kunt hier in het Engels invullen naar welke regex je op zoek bent. In het rechterkolom zie je dan de uitkomst. Zie ook onderstaand voorbeeld. Wanneer wij een nieuwe sheet hebben, die gebaseerd is op GTP 3.5/4, delen wij dit hier. 

Regex opstellen met AI in sheet

Een reguliere expressie opstellen is vaak veel uitzoekwerk. Ook omdat er een hoop mis kan gaan, wanneer je niet de juiste formule gebruikt. Naast dat je de ChatGTP kunt gebruiken voor het vinden van regex, hebben wij ook een sheet. Deze is nog gebaseerd op GTP-3 en is minder zorgvuldig. Toch kan de GTP 3 regex generator je een handje helpen. Je kunt hier in het Engels invullen naar welke regex je op zoek bent. In het rechterkolom zie je dan de uitkomst. Zie ook onderstaand voorbeeld. Wanneer wij een nieuwe sheet hebben, die gebaseerd is op GTP 3.5/4, delen wij dit hier. 

Voorbeeld wanneer wij een nieuwe sheet hebben, die gebaseerd is op GTP 3.5/4.


Wil jij een filter toevoegen? Zorg dan dat jij jouw API-key bij de hand hebt. Hiervoor heb je een gratis account nodig bij OpenAI.com. Je ontvangt dan een secret API key, waarmee jij sheets koppelt aan GTP-3. De API-key voer je in de eerste kolom in (het gedeelte dat wij weggefilterd hebben). Ga jij aan de slag met de sheet? Houd er rekening mee dat je niet onnodig karakters gebruikt in het filter en dat je letters of variabelen binnen “ “ zet. Zie ook bovenstaand voorbeeld.

Reguliere expressie in de praktijk 

Wij gebruiken reguliere expressie vaak op meerdere manieren, bijvoorbeeld in Google Sheets, Google Search Console en in de Robots.txt file van een website. Hieronder leggen we uitgebreid uit wat je met reguliere expressie kan en hoe het werkt. 

Regex in Google Search Console en Google Sheets

Reguliere expressie gebruik je bijvoorbeeld in Google Search Console om prestaties van groepen URL’s te meten. Wil jij een lijst url’s checken, waarbij er geen variabele is die overeenkomt? Probeer dan onze sheet eens. Je voegt hier url’s toe, krijgt URL-paden en de reguliere expressie die jij nodig hebt voor het meten van een groep url’s, wanneer variabelen niet overeenkomen. 

Voorbeeld sheets

Url prestaties meten in Google Search Console 

In Google Search Console kun je prestaties meten met reguliere expressie. In Google Analytics is dit steeds minder vaak nodig, omdat er bij GA4 ontzettend veel filters zijn, waardoor je URL-groepen makkelijk meet. Wil jij een specifieke lijst met url’s meten in Google Search Console? Gebruik dan onze sheet. Je voegt de regex toe door in Google Search Console naar zoekresultaten > nieuw > pagina te gaan. Hier voeg je de URL regex voor search console toe uit de sheet. Je gebruikt de sheet alleen als je een groep url’s wilt meten waarbij een overeenkomende variabele ontbreekt. 

voorbeeld URL prestaties meten in Google Search Console

A/B testen met reguliere expressie

SEO A/B testing is het testen van wijzigingen aan een website. Hiervoor maak je gebruik van twee verschillende groepen; een controlegroep (A) en een testgroep (B). Bij de controlegroep doe je geen aanpassingen. Bij de variant hierop wel. Beide groepen meet je om te kijken of jouw hypothese tot het gewenste effect leidt. 

Er zit een verschil tussen CXO A/B testing en SEO A/B testing. Bij CXO A/B testing split je de bezoekers op en zorgt een variabele ervoor dat een bezoeker steeds een andere versie te zien krijgt. Er zijn dan twee versies van de pagina die jij optimaliseert. Bij SEO A/B testing split je juist de pagina’s op, in plaats van de bezoekers, omdat je de SEO-resultaten van de pagina wilt meten en niet het gedrag van de bezoeker.

Stel; we willen een A/B test uitvoeren met onze dienstenpagina’s. Dan splitsen we deze op en maken we een controlegroep en een groep waar we de variant op toepassen. We doen bijvoorbeeld het volgende: 

Controlegroep: /Diensten/pagina’s die begint met A-M 

Variantgroep: /Diensten/pagina’s die beginnen met N-Z 

De reguliere expressie die volgt is: 

/diensten/[a-m*]

/diensten[n-z*] 

Je ziet dan in Google Search Console alle pagina’s die voldoen aan deze voorwaarden en splits de categorieën op. Je maakt vervolgens eenvoudig een uitdraai van de pagina’s met clicks en vertoningen. Wanneer het om weinig pagina’s gaat, kan het zijn dat het totale aantal clicks van beide groepen url’s niet helemaal overeenkomt. 

Probeer ervoor te zorgen dat dit ongeveer gelijk is bij de controlegroep als bij de variantgroep. Als je SEO aanpassingen doet, wil je dat zowel de type pagina, als het aantal clicks, van beide groepen gelijk is. Hieronder zie je de regex in Search Console. Hetzelfde kun je doen in Google Analytics of in Google Optimize.

Regex in Search Console

Doordat wij maar een beperkt aantal dienstenpagina’s hebben, ligt het aantal vertoningen en clicks niet gelijk. Het is hierdoor lastig meten. Ook hebben we veruit niet genoeg bezoekers om een A/B test uit te voeren. Voor websites en webshops met met honderden of duizenden bezoekers per dag ligt dit anders. Bekijk ook onze SEO A/B testing blog om te zien waar jouw website/webshop aan moet voldoen voor een SEO A/B test. 

Regex in Google Data Studio 

In Google Data Studio maak je eenvoudig de koppeling met Google Search Console en Google Analytics. Ook hier kun je gebruikmaken van reguliere expressie. Wil je groepen url’s filteren? Dan maak je gebruik van een Google Analytics filter. Via Google Search Console kun je zoekopdrachten meten door een queryfilter toe te voegen. 

Stel; we willen meten wat onze organische sessies zijn op zoektermen waar “SEO” in voorkomt, dan voegen we onderstaand filter toe. Hierdoor zie je alleen nog maar het aantal clicks op zoektermen waar “SEO” in voorkomt. Zoals eerder vermeld, zorgt de .* regex in dit geval ervoor dat alle variaties voor en na SEO mogelijk zijn. 

grafiek met SEO zoektermen

Reguliere expressie gebruiken in de Robots.txt 

De robots.txt is een tekstbestand dat op een website staat. Wanneer een crawler (zoekmachine) een website bezoekt kijkt deze als eerste naar dit bestand. Dit werkt als een soort handleiding voor die website. Hier staat namelijk in welke pagina’s de crawler wel of niet mag crawlen. Lees ook meer hierover in ons robots.txt blog. Ook voor de robots.txt kun je gebruikmaken van reguliere expressie. Wel goed om te weten dat je hierbij niet gebruik kan maken van alle regex (zie uitgebreide Google documentatie). Hieronder een uitleg over onze eigen robots.txt en uitsluitingen die we middels reguliere expressie hebben doorgevoerd. Onze robots.txt ziet eruit als volgt: 

User-agent: *

Disallow: /wp-admin/

Allow: /wp-admin/admin-ajax.php

Disallow: *.pdf$

User-agent: *Zorgt ervoor dat onze site beschikbaar is voor alle type crawlers 
Disallow: /wp-admin/ Zorgt ervoor dat de exacte url  /wp-admin/ uitgesloten wordt. 
Allow: /wp-admin/admin-ajax.phpAls je dit niet allowed, wordt dit automatisch uitgesloten. De /wp-admin/admin-ajax.php file zorgt ervoor dat verzoeken afgehandeld worden die dynamische content op een website laden (beter bekend als Ajax-requests), zonder dat de webpagina refresht hoeft te worden. Als je dit uitsluit, zien de crawlers dit niet. 
*.pdf$Google kent bij indexing minder prioriteit toe aan PDF-bestanden dan normale webpagina’s. Door PDF’s uit te sluiten in de robots.txt voorkom je dat crawlbudget onnodig verloren gaat. Meer lezen over PDF’s en SEO? Lees dan ook de blog van Zenbrief
De * reguliere expressie zorgt ervoor dat het niet uitmaakt wat er voor pdf staat in de url. Het $-teken bepaalt dat de url moet eindigen op .pdf. Dit zorgt ervoor dat bijvoorbeeld een volgende url niet uitgesloten wordt: https:onder.nl/blog/pdf-maken-in-5-stappen. Via deze robots.txt validator kun je checken of jij de juiste url’s uitsluit. 

Reguliere expressie: De conclusie 

In deze blog besprak ik nog maar een aantal manieren hoe je reguliere expressie toe kunt toepassen als SEO-specialist. Hierbij hebben we het nog geeneens gehad over SEO migraties en het opstellen van redirect files met regex. Ook dat is namelijk mogelijk met reguliere expressie (check hiervoor ook ChatGTP). Wil je meer ontdekken over (technische) SEO? Lees dan vooral iedere week ons blog, en blijf op de hoogte van de laatste SEO trends en ontwikkelingen. Op zoek naar SEO advies? Neem dan contact met ons op. 

Share

Categorieën

Heb je vragen?

Neem contact op! :) wij helpen je graag verder met al je SEO vragen

SEO vraag stellen

Mis het niet

Meld je aan voor onze nieuwsbrief en mis geen enkele SEO tip

"*" geeft vereiste velden aan

Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.

Heb je vragen?

Wil je meer weten over SEO? Kan je website een nieuwe impuls gebruiken?
Neem contact op

Onder ons

Team van SEO specialisten

Het team van SEO bureau Onder bestaat uit enthousiaste SEO specialisten die graag samen met jou voor het beste resultaat gaan.

Maak kennis met ons team
SEO bureau Onder Zwolle

Deze klanten zijn ondersteboven van ons!

Renzo van Dongen

Renzo van Dongen

Digital content manager Peugeot

Of het nu over content of technische aanpassingen gaat, dat maakt niet uit. Martijn brieft dit op een hele heldere manier zodat dit lokaal of door ons hoofdkantoor in Frankrijk doorgevoerd kan worden. […] Sinds de start van onze samenwerking hebben we mooie resultaten behaald. Keep it up!

Marien van Stegeren

Eigenaar Kitcentrum

Wanneer je online onderneming groeit groeien de verwachtingen vaak ook, op elk gebied. Voor een groot gedeelte hadden we zelf de controle over SEO en de invulling hiervan. We kwamen er achter dat onze eigen “algemene blik” niet meer toereikend was en hebben daarom Bureau Onder ingeschakeld. Verrassend en helder. We hebben een fijne samenwerking opgebouwd, mede omdat Martijn  ook met regelmaat met Eline of Mariska (afhankelijk van de case) bij ons op kantoor komt wat voor ons erg waardevol is!

Marten Stellingwerf

Webmaster

Martijn en Mariska maken het SEO verhaal begrijpelijk voor de leek en denken graag met ons mee. Het is fijn dat er elke maand een persoonlijk contact moment is met een uitgebreide rapportage en de mogelijkheid om alles te doorspreken. Na enkele maanden is het Onder al gelukt om met enkele van onze webshop pagina’s de nummer 1 posities te verkrijgen op Google. Wij zijn zeer tevreden over Onder.

Mark Prummel

SEO Specialist Stella Fietsen

Sinds enkele jaren is Onder is een gewaardeerde partner van Stella. Martijn is mijn sparringpartner voor complexe SEO vraagstukken en het extra paar kritische ogen dat ons scherp houdt. Samen hebben we een mooie groei gerealiseerd in online zichtbaarheid, bezoekersaantallen en leads. Onder onderscheidt zich door haar korte communicatielijnen en vakkundigheid. Ze spreken onze taal: niet zeuren, maar aanpakken. Daar houden we van!

OnderBouwing

Mis geen enkele SEO tip
  • Inzichten en tips op het gebied van SEO
  • Voor beginners en gevorderden
  • Van experimenten tot ontwikkelingen bij Google en van
    best practices tot eigen cases
  • Een kijkje achter de schermen bij Onder

"*" geeft vereiste velden aan

Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.