U heeft er waarschijnlijk wel van gehoord: de Google Panda Update. Die mysterieuze verandering aan het ranking-algoritme van Google, in de VS gelanceerd in maart jl. en ook in Nederland actief sinds augustus jl. Vanaf het moment dat Cutts en Singhal 3 maart jl. in een interview met Wired voor het eerst namens Google openheid van zaken gaven omtrent Panda, worden we overspoeld door informatie, meningen, onderzoeken, etc. omtrent de vraag wat Panda nu eigenlijk precies behelst. Hoewel er drie kwart jaar na dato nog steeds een aantal zaken onbekend zijn, is er inmiddels ook veel wél bekend. Hier, in 10 stappen, een overzicht en bespreking van de huidige stand van kennis.
1. Doel van Panda
Doel van Panda is het weren van “lage kwaliteit”-websites uit de rankings om zodoende kwaliteit-websites meer kans te geven goed te scoren. Het is dus niet zo dat we door meer kwaliteit te leveren, via Panda hoger kunnen gaan scoren. Panda zet slechts een rem op het scorend vermogen van websites met een lage kwaliteit.
2. Panda is een rankingfactor
Panda is geen fundamentele aanpassing van de wijze waarop Google sites rankt op zoekwoorden. Google communiceert al tijden dat er vele (200+) factoren zijn die de rankings beïnvloeden. Panda is daar nu als factor bijgekomen.
3. Panda is een filter
Panda is een soort filter, of in de woorden van Google “een classifier”, die er voor moet zorgen dat lage kwaliteit pagina’s of zelfs gehele websites uit de rankings worden geweerd. Dit filter heeft een zogenaamde threshold: als een pagina, sectie of site onder de threshold blijft is er geen sprake van lage kwaliteit, daarboven wel. Het is dus een zwart-wit filter: een pagina kan (bezien vanuit Panda) niet van bijvoorbeeld een “gemiddelde kwaliteit” zijn. De kwaliteit is laag of niet-laag.
4. Delen van lage kwaliteit kunnen gehele site schaden
Indien er slechts bepaalde delen van de site van een lage kwaliteit zijn, kunnen die er voor zorgen dat de threshold wordt overschreden en daarmee het filter voor de gehele site wordt geactiveerd.
5. Panda resulteert niet in penalties
Het filter lijkt zodoende op een penalty, maar blijkt dat niet te zijn. “Lage kwaliteit” betreft an sich namelijk geen overtreding van de richtlijnen van Google. Als de threshold voor een bepaalde site wordt overschreden, het filter wordt geactiveerd en de rankings daardoor dalen, heeft het dus ook geen zin bij Google een Reconsideration Request (herbeoordeling van de site) aan te vragen. Het filter wordt alleen op geautomatiseerde wijze in- of uitgeschakeld. Panda valt ook onder de verantwoordelijkheid van het Google Search Quality team en niet van het Webspam team.
6. Quality raters
De werking van Panda komt tot stand op basis van de input van zogenaamde “quality raters”. Dit zijn gebruikers van gemiddeld niveau, overigens niet direct in dienst bij Google, die allerlei vragen over de kwaliteit van sites, in relatie tot een bepaalde zoekopdracht, krijgen voorgeschoteld. De exacte lijst vragen is niet bekend, maar bevat zeker vragen als “zou u bij deze site uw credit card gegevens achterlaten?”, of “vertrouwt u de informatie in dit artikel?”.
Google heeft in een recent Twitter-debatje met Jennifer Ledbetter alias “Potpiegirl” overigens nadrukkelijk aangegeven dat de individuele antwoorden van de quality raters geen effect hebben op de rankings. Slechts de via machine learning veralgemeniseerde abstracties (zie volgende punt) hebben effect op de rankings. Ook de “blocks” via de Google Chrome extension (waarmee we sites in de zoekresultaten kunnen blokkeren) hebben geen direct effect op de zoekresultaten bij derden.
7. Machine learning
De technologie die een verband moet vinden tussen de kenmerken van een pagina of site en de kwaliteit ervan, is “machine learning”. Machine learning onderscheidt zich van traditionele algoritmen in het feit dat het verband niet expliciet wordt geprogrammeerd, maar door “de machine”, op basis van “trainingsvoorbeelden”, zélf wordt gevonden. Het “leren” door de Panda-machine bestaat uit het vinden van abstracte relaties tussen de kenmerken van de site/pagina aan de ene kant en de (door de raters vastgestelde) kwaliteit ervan aan de andere. Op basis van deze abstracte relaties wordt vervolgens het hele web op kwaliteit beoordeeld.
Het lijkt me persoonlijk goed mogelijk dat Neurale Netwerk technieken zijn aangewend, mede ook omdat de CV van de grondlegger van het Panda-mechanisme (dhr Navneet Panda) melding maakt van “Neural Information Systems”.
8. Welke kenmerken zijn beoordeeld?
Wat de kenmerken (in het Engels “metrics” genaamd) precies zijn die Google van een pagina of site exact noteert, is helaas nog steeds behoorlijk onduidelijk. Ik neem aan dat in ieder geval de signalen die Google ook al vóór Panda gebruikte, zijn meegenomen. Denk aan PageRank, leeftijd van de site, (zoiets als) TrustRank, etc. Omdat de quality raters hun beoordelingen met name ook zullen baseren op vormgevingsaspecten zullen daar ook verschillende kenmerken van moeten worden bepaald. Je kan denken aan het gebruik van dikgedrukte woorden, hoofdletters, advertenties, pop-ups, navigatie, aanwezigheid van graphics, etc., maar ook zoiets als de aanwezigheid van een telefoonnummer op de pagina.
Er wordt veelal aangenomen dat ook zogenaamde “gebruiksgegevens” (zoals weigeringspercentage, tijd op de site, etc) als kenmerk worden gebruikt. Indirect is er mogelijk een relatie tussen de kwaliteit van een site (zoals door Panda bepaald) en deze gebruiksgegevens, maar ik vraag me af of de gebruiksgegevens expliciet als kenmerken van een site binnen Panda zijn geïncorporeerd. Met name omdat bijvoorbeeld een hoog weigeringspercentage helemaal niets zegt over de kwaliteit van een pagina.
9. Panda is oppervlakkig
Daar quality raters per uur worden betaald zullen ze in een zo kort mogelijke tijd, zo veel mogelijk vragen willen beantwoorden. Veel meer dan één á twee minuten wordt er niet besteed aan een site. De beoordeling van de kwaliteit van een website zal daarom niet anders dan oppervlakkig kunnen zijn. Omdat deze beoordeling ten grondslag ligt aan het Panda machine learning proces, zal Panda zelf ook oppervlakkig zijn. Zorg daarom dat zowel de zoekresultaten als de site er -in ieder geval op het eerste gezicht- professioneel uitzien.
De vraag is voorts in hoeverre verwijzingen vanaf de via Panda “als lage kwaliteit” beoordeelde websites ook zijn gedevalueerd. Mijn indruk is dat dit niet of nauwelijks het geval is.
10. Panda updates
Zo gemiddeld eens per maand komt er een Panda update uit. Iedere update krijgt een versienummer. We zitten nu op versie 2.5. Panda heeft de scoringsposities van zo’n 10% van alle sites beïnvloedt, in het Engelse taalgebied wat meer dan in de niet-Engelse taalgebieden. Een update lijkt zowel aanpassingen in de werking van Panda te kunnen betreffen, als de toepassing van (de vernieuwde) Panda op websites.
Toevoeging, september 2013
Panda is inmiddels behoorlijk uitgekristalliseerd en geïntegreerd in het “overall”-Google rankingalgoritme. Er zijn hiermee geen Panda-updates meer, maar finetuning vindt dus rechtstreeks plaats in het overall algoritme dat de rankings bepaalt.
Uw reacties worden gewaardeerd!
Aanbevolen literatuur:
http://searchenginewatch.com/article/2122234/Panda-DNA-Algorithm-Tests-on-the-Google-Panda-Update
http://www.seo-theory.com/2011/05/06/characteristics-of-the-google-panda-algorithm/
http://googlewebmastercentral.blogspot.com/2011/05/more-guidance-on-building-high-quality.html
http://www.seomoz.org/blog/how-googles-panda-update-changed-seo-best-practices-forever-whiteboard-friday
http://searchenginewatch.com/article/2129359/How-Search-Engines-Use-Machine-Learning-for-Pattern-Detection
http://www.potpiegirl.com/2011/11/google-raters-who-are-they/
internet marketing zegt
Goed stuk informatie over de Google zoekmachine panda update! Geeft duidelijk weer wat Google aan het doen is. Zou mooi zijn als er een soort ranking was wat je als SEO expert zou moeten doen om toch nog hoog in Google te staan met organische zoekresultaten.
Ga zo door SEO Guru, thanks!
WACO Webdesign zegt
Zeer interresant artikel. Zeer nieuw en leerrijk voor mij. Keep up, thx
Maarten zegt
Leuk stuk over de Panda update. Veel is al bekend dus niet heel vernieuwend.
Een hoog weigeringspercentage zegt natuurlijk wel wat over een pagina. Maar het is tweeledig, of de bezoeker vindt wat hij heeft gevonden. Of de bezoeker vindt niet wat hij heeft gevonden en zoekt verder…
Bart Koppenaal zegt
Goed verhaal! Dan blijkt Panda toch niet zo te straffen als men voorheen dacht.
Hier kunnen we wat mee!
Willem | Webtraders B.V. zegt
Dit artikel geeft al veel meer opheldering dan andere verhalen op diverse blogs. Toch blijft er nog een hoop vaag betreft Panda! Ik ben benieuwd in hoeverre Google ons op de hoogte hiervan gaat brengen.
Hou ons op de hoogte! 🙂
Dream Hosting zegt
Dank! Deze ga ik even naar een klant doorsturen.
Online Promotions zegt
Zeer interessant artikel, helaas zoals hiervoor al gemeld blijft Google zeer vaag wat Panda betreft, het weren van low quality sites kunnen we alleen maar toejuichen…It’s all about content! 🙂