Referer spam: wat is dat? - deel 1
Bijna iedereen met een website of een weblog heeft er tegenwoordig last van: Referer spam (spreek uit riefúrrer spem).
Om een idee te krijgen wat referer spam precies is, gaan we eerst de term 'referer' nader bekijken. Referer komt van het woord 'referrer' en wordt dus vaak fout gespeld. Zo vaak zelfs, dat het momenteel zó is opgenomen in hét communicatieprotocol van het World Wide Web, namelijk HTTP (HyperText Transfer Protocol). HTTP is de standaard manier om informatie te versturen over het internet. Wanneer je op een site op een hyperlink klikt, verstuurt de browser het adres van de site waarop je je bevindt naar de site waarnaar de link verwijst. Een referer geeft dus aan waar jouw bezoeker vandaan kwam vóórdat hij of zij jouw site bezocht. Dit wordt o.a. bijgehouden in zogenaamde logfiles. Logfiles zijn tekstbestanden waar de (web)server informatie over de bezoekers van jouw website naar wegschrijft.
Statistiekensoftware, gebaseerd op deze logfiles, laat deze refererinformatie meestal zien in de vorm van een hyperlink. Als eigenaar van een site kun je dan zien welke websites een verwijzing naar jouw site hebben. Wat heeft dit met referer spam te maken, zul je nu wel denken? Het is de manier waarop deze spammers te werk gaan, die hier mee te maken heeft. Ze maken o.a. gebruik van software waarmee ze de refererinformatie kunnen 'vervalsen' en die in korte tijd vele websites meerdere malen kunnen opvragen. Ze laten dan een URL van hun eigen site achter in de refererlijst van de webstatistieken van jouw site.
Waarom doen ze dit?
Simpelweg, om hoger in de zoekresultaten te komen. Een aantal zoekmachines, waaronder Google, werkt namelijk op basis van 'Link Popularity': hoe meer er naar je site wordt gelinkt, des te populairder je site wel moet zijn; hierdoor komt deze dus hoger in de zoekresultaten te staan. Omdat spam meestal over sites gaat met onderwerpen waar niemand vrijwillig naar wil linken, proberen de spammers het dus op deze manier. Aangezien er websites of weblogs zijn waar de statistieken, en dus ook de refererinformatie, openbaar zijn, helpen zij dus de spammers hoger in de zoekresultaten te raken. Een voorbeeld van hoe een refererlijst er uit kan zien is in de onderstaande afbeelding te zien:

Zoals je kunt zien is een bepaalde tak van de pillenindustrie sterk vertegenwoordigd :-) 6 van deze ongewenste sites in de top 10 van totaal aantal referers met een hoog aantal 'hits'. Dit getal geeft het aantal verzoeken om informatie aan de server (ofwel aantal requests) weer.
Door deze vorm van spam kloppen je referers niet meer. Je kunt dus niet duidelijk meer zien wie er allemaal een verwijzing naar jouw site hebben. Deze worden namelijk verdrongen door de ongewenste sites met een hoog aantal hits. Een ander nadeel is dat de bezoekersaantallen van je site niet meer correct zijn. Verder wordt op deze manier traffic gegenereerd die jou voor extra kosten kan stellen.
Conclusie: de statistieken van je site zijn onbetrouwbaar geworden met 'dank' aan onze referer spammers.
Is hier wat tegen te doen?
Er is wel wat tegen te doen. Dit gaan we de volgende keer bekijken.


