De theorie die nu behandeld gaat worden is niet in de eerste plaats gericht op het beter scoren, maar op het verrijken van de in de zoekmachine-resultaten getoonde snippets, zodanig dat we de CTR (het doorklikpercentage vanuit de zoekresultaten) kunnen gaan verhogen. Het laat verder zien hoe de praktijk van het “semantische web” zich aan het ontwikkelen is. Over dit laatste moet eerst wat worden gezegd.
Het semantische web
Misschien heeft u al van dit begrip gehoord. Het is een beetje een mode woord geworden, maar desalniettemin is het een in mijn optiek zeer belangrijke Internetontwikkeling (onderdeel van wat wel web 3.0 wordt genoemd). Een ander woord voor ‘semantiek’ is ‘betekenis’. Het semantische web staat voor een Internet waarbij de betekenis van de aanwezige informatie is ontsloten.
Als we naar een willekeurige internetpagina gaan kunnen wij mensen goed begrijpen wat de betekenis is van de aldaar aanwezig informatie. Op de contactpagina zien we bijvoorbeeld de bedrijfsnaam met de adresgegevens en telefoonnummers. Op een evenementenpagina zien we trainingen of concerten met data en locaties. Op een pagina van een webshop zien we producten met gebruikersbeoordelingen. Voor ons is dat allemaal onmiddellijk te begrijpen omdat we vanuit onze ervaring betekenis kunnen toekennen aan de aanwezige informatie.
Voor externe applicaties is dat echter nagenoeg ondoenlijk: die begrijpen bijvoorbeeld niet zomaar dat “020-6755730” een telefoonnummer is van het bedrijf dat daar boven in de pagina vermeld staat. Of dat de naam daaronder de naam is van de eigenaar. Een webpagina is tegenwoordig nog steeds een “bak” met mooi opgemaakte woorden en getallen, waarbij onduidelijk is wat de precieze betekenis van de verschillende onderdelen is. Anders gezegd: de syntax (d.w.z. de regels waarmee we beschrijven hoe de pagina er uit moet zien) is wel bekend, maar de semantiek niet. U zult begrijpen dat zoekmachines de betekenis graag ook toegevoegd krijgen om zodoende betere zoekresultaten te kunnen genereren. Als men zoekt op “telefoonnummer SEOguru”, zou Google bijvoorbeeld graag meteen het telefoonnummer tonen. Google zou ook graag meteen willen begrijpen dat het bijvoorbeeld om het Hilton hotel in Parijs (en niet om de society ster) gaat als “Paris Hilton” in een specifieke webtekst voorkomt.
In het semantische web is de betekenis van de aldaar aanwezige informatie ontsloten. Webapplicaties kunnen de informatie dan heel eenvoudig van de pagina ophalen en verwerken, omdat ze begrijpen wat die woorden en getallen precies betekenen. Hierdoor zal er veel meer dynamiek kunnen gaan ontstaan vanuit en tussen websites. Zo’n extra semantische laag geeft externe webapplicaties als het ware de handvaten om de op de site aanwezige informatie voor eigen doeleinden aan te wenden. En als we dat slim doen kunnen we daarvan gaan profiteren.
Maar hoe kunnen we aan de informatie op onze webpagina’s betekenis mee gaan geven? Daartoe zijn er conventies in ontwikkeling, die inmiddels ook ondersteund worden door W3C (het World Wide Web Consortium die de webstandaarden voor het web ontwerpt) en ook Google. De belangrijkste conventies zijn RDFa, Microformats en Microdata (deze laatste is onderdeel van HTLM5). Binnen deze drie conventies kunnen de volgende zaken (ook wel entities genoemd) binnen onze webpagina’s nu reeds van betekenis worden voorzien:
* Personen
* Bedrijven
* Gebeurtenissen
* Reviews
* Recepten
* Video’s
Deze lijst zal in de loop van de komende jaren verder worden uitgebreid. Om u een indruk te geven van de wijze waarop een traditionele webpagina verrijkt kan worden met semantische informatie zullen van alle drie conventies nu uitwerkingen worden gegeven. Uitgangspunt is een zeer eenvoudig voorbeeld waarin de eerste hiervoorgenoemde entity wordt geïllustreerd, namelijk Personen (NB. Voorbeelden van Google rond deze entity kunt u hier vinden). Aan de volgende zin in html worden straks semantische elementen toegevoegd:
<div>Mijn naam is Alain Sadon. Ik ben de eigenaar van SEOguru. De bedrijfswebsite is: <a href="https://www.seoguru.nl">www.seoguru.nl</a>. Ik ben woonachtig in Amsterdam, Nederland.</div>
Wíj begrijpen bij het lezen wel hoe de persoon heet, waar hij woont en wat hij doet, maar een externe applicatie niet. Via de drie conventiemethoden gaan we dat nu toelichten. Microformats is de meest eenvoudige conventie. RDFa is iets complexer. Microdata is vooral veelbelovend omdat het standaard onderdeel is van HTML5.
Microformats
RDFa
Microdata
Te zien is dat we met de verschillende conventiemethodes hetzelfde kunnen bereiken, maar steeds op een nét iets andere manier. Verder zien we dat in RDFa en Microdata verwezen wordt naar data-vocabulary.org. Aldaar is precies gedefinieerd welke elementen kunnen worden gebruikt. Via deze centrale database krijgen we een zeer flexibel systeem voor het opbouwen van een semanisch web.
Als gezegd heeft Google alle drie de methoden omarmd. Op dit moment vindt dit met name uitdrukking in een verrijking van de snippets in de zoekresultaten. Dit kan worden geïllustreerd aan de hand van LinkedIn alwaar Microformat elementen reeds standaard aan de profielpagina’s worden toegevoegd. Als ik zoek op mijn naam “Alain Sadon” toont Google meteen onder de Titel in het grijs een aantal zaken die via Microformat van betekenis zijn voorzien en zodoende door Google kunnen worden getoond:
Google biedt ook een Testing Tool om pagina’s te testen die we zelf van Microformat, Microdata of RDFa elementen hebben voorzien. Als we de tool uitproberen op zo’n pagina wordt meteen de verrijkte snippet getoond. Ik heb dat eens getest op mijn seo training voor webontwikkelaars pagina waar ik mijn eerstvolgende training als Microformat gebeurtenis heb gedefinieerd. De Google Testing Tool toont het volgende:
De gehele vierde regel is nu aan de snippet toegevoegd. Dit betreft een link naar de pagina, de datum en de locatie. Precies om deze reden ben ik deze paragraaf begonnen met te stellen dat we onze CTR kunnen gaan verhogen door onze pagina’s te verrijken met semantische gegevens. Iemand die zoekt op “seo training” en een voor hem geschikte trainingsdatum en -locatie in beeld krijgt, zal eerder geneigd zijn op dat zoekresultaat te klikken dan de situatie waarbij die informatie niet aanwezig is.
Google is nog niet erg scheutig met het tonen van dergelijke Rich Snippets. Dit fenomeen bevindt zich bij het schrijven van dit artikel namelijk nog in een beta-fase. Twee dagen geleden is Matt Cutts, de woordvoerder van Google op het gebied van Search, met een youtube video gekomen waarin hij meldt dat het "een maand of wat" kan duren voordat de zoekresultaten verrijkt zijn met RDFa gegevens, vanaf het moment dat de pagina expliciet is aangemeld bij Google. In de toekomst zal dat automatisch plaatsvinden, maar in deze beta-fase moeten de verrijkte pagina’s nog wel bij Google worden aangemeld.
Duidelijk is wel dat het toevoegen van semantische gegevens aan webpagina’s steeds meer en steeds vaker interessante mogelijkheden, ook voor SEO, zal gaan opleveren. Tot slot wil ik opmerken dat een CMS in mijn optiek zo langzamerhand ook semantische ondersteuning zou moeten bieden aan de gebruikers ervan. Daarom ook heb ik dat criterium ook opgenomen in mijn onderzoek naar zoekmachine vriendelijke SEO CMSen.
Marco Lequin zegt
Duidelijk artikel over semantische web. Ik zie hier een revolutie op het gebied van optimaliseren van snippets op basis van de voor dat moment relevante informatie. Ik ga aan de hand van dit artikel zeker even verder neuzen wat het verder kan opleveren voor een gemiddeld bedrijf.
Bedankt.
Jan Meester zegt
Ook mijn complimenten voor dit artikel.
Het wordt echter nog interesanter als zoekresultaten gefilterd kunnen worden op basis van deze snippets. Dan kunnen bijvoorbeeld inkopers met een paar handelingen een longlist met potentiele leveranciers maken.
Naar mijn mening is het een tekortkoming van het web dat het nu om woorden gaat. Als identiteiten en eigenschappen ook mee gaan spelen zal dit ten goede komen aan de kwaliteit van zoekresultaten. Een zoekopdracht krijgt dan meerdere dimensies; vb. Wat zoekt je? (vb. wederverkoper of producent) Welk product ? Waar ?
Alain Sadon zegt
@Jan
Goede reactie, helemaal mee eens!