Oorzaken van verschillen in statistische data

Door: Renate Sombroek op 10 september 2011

Oorzaken van verschillen in statistische data

Tussen de gegevens uit verschillende statistiekprogramma’s zitten verschillen omdat er uiteenlopende definities en meetmethoden worden gebruikt. Het verklaren van alle oorzaken van de verschillen is erg complex, omdat verschillen meestal het gevolg zijn van uiteenlopende oorzaken. Verschillen tussen de metingen van diverse webstatistieken zouden over langere periodes wel constant moeten zijn.
Verschillen in webstatistieken leiden uiteraard tot vragen over de betrouwbaarheid van de data. Om hier een gefundeerd antwoord op te kunnen geven zou de website moeten worden getest in een besloten omgeving en daarbij de resultaten van de verschillenden pakketten naast elkaar moeten worden gelegd. Hierbij zou het dataverkeer moeten worden gereguleerd en variabelen zoals het klikgedrag, IP-adressen en browser types instelbaar moeten zijn.

Dit is over het algemeen niet mogelijk, maar TNO heeft hier wel onderzoek naar gedaan. Uit de analyses bleek dat de gemeten waarden door de diverse websitestatistiek pakketten onderling soms zeer verschillen. De richting en de mate van de trends voor het aantal bezoekers, bezoeken en pageviews blijken echter wel sterk overeen te komen. Dit betekent dat de onderlinge verschillen tussen de pakketten over langere periodes constant blijven.
Maar hoewel de verschillen tussen metingen constant blijken, is dit verschil niet voor iedere website hetzelfde. Statistiekpakket A dat op de ene website structureel hogere waardes geeft dan pakket B, kan op een andere website juist lagere waardes geven. Belangrijke oorzaken hiervan blijken te liggen in de content en structuur van de website.

TNO geeft als verklaring voor de oorzaken van verschillen de volgende voorbeelden:

  • Pageviews wel of niet meetellen wanneer de back-pijl in de browser wordt gebruikt;
  • Verschillen in de berekeningmethode die wordt gebruikt in de interpretatieslag van pageviews naar bezoeken en unieke bezoekers;
  • De mate waarin het verkeer van webbots door het gebruikte pakket wordt gefilterd.

In het algemeen constateert TNO dat de afwijkingen vooral worden veroorzaakt door de grote hoeveelheid aan relatief kleine oorzaken. Het verklaren van alle oorzaken is hierdoor erg complex.

Xsite versus Google Analytics

Uit een analyse van de verschillen tussen Xsite statistieken en Google Analytics kunnen we het volgende opmerken:

  • Pageviews gemeten door Google Analytics en Xsite zijn redelijk met elkaar in lijn, waarbij de Xsite metingen over het algemeen iets hoger liggen. Dit zou bijvoorbeeld veroorzaakt kunnen worden doordat Google bepaalde IP-nummers niet meetelt in de metingen van de pageviews;
  • Visitors worden door Google Analytics anders gemeten dan de IP-nummers door Xsite. Het kan per site verschillen of de Xsite metingen hoger uitvallen of lager uitvallen. Dit is bijvoorbeeld afhankelijk van de opbouw van uw bezoekersbestand: zijn er veel mensen die gebruik maken van hetzelfde IP-nummer of juist niet?
  • In het aantal visits of bezoeken vallen de Xsite metingen over het algemeen hoger uit dan de Google metingen. Dit wordt veroorzaakt door verschillen in definitie van een bezoek en meetmethoden.

deel

Meer weten? Bel (020 52.100.52) of mail ons of ga naar
het contactformulier

Reageer op deze blog

Type het getal ELF in cijfers.