WebDrain

Nieuws en informatie over marketing, rss, weblogs, webfeeds, zoekmachines en andere webonderwerpen.

15 mei 2007

Sitedetail.nl geeft verkeerde cijfers

SiteDetailVandaag kwam Sitedetail.nl met cijfers over wie de grootste website van Nederland is. De manier waarop SiteDetail dat doet is soortgelijk aan de manier waarop de grote zoekmachines dat doen. De grootte van een website wordt bepaald door het aantal unieke paginaĺs waaruit een website bestaat.

Volgens Sitedetail.nl is dit de top 10 van grootste websites:
1 hyves.nl
2 ebay.nl
3 web-log.nl
4 cbs.nl
5 ciao-shopping.nl
6 marktplaats.nl
7 kelkoo.nl
8 xs4all.nl
9 uva.nl
10 lycos.nl

In Google kan je eenvoudig zien hoeveel pagina's er van een website ge´ndexeerd zijn, dit komt redelijk goed overeen met het daadwerkelijke aantal. Zoek gewoon op site: domein.nl. Voor deze site krijg je dan site:webdrain.com en op dit moment zijn er 973 pagina's ge´ndexeerd.

Als ik dit voor de top drie doe, dan kom ik op de volgende aantallen;
Hyves: 364.000 (.nl) + 332.000 (.net)
ebay: 7.140.000
web-log: 1.480.000

Als ik nog kan tellen, dan is e-bay.nl een stukje groter dan Hyves...
Deze lijst klopt dus totaal niet!
Of heeft Sitedetail een andere methode gebruikt om het aantal unieke pagina's te bepalen??

Update
WebWereld: Volgens Sitedetail heeft Hyves 70 miljoen pagina's omdat de netwerksite veel ajax-gebaseerde pagina's heeft, die niet worden opgenomen in de index van Google.
Het komt dus neer op de definitie van een "unieke pagina". Toch blijven de aantallen vreemd, elke normale pagina op Hyves heeft dus 100 ajax-pagina's... (700.000 vs. 70.000.000)
Ach, bullshit-cijfers of niet, Sitedetail heeft de publiciteit gehaald...

5 reacties:

Anonymous Anoniem zei...

Het komt idd neer op de definitie van unieke pagina. Jij gebruikt google als referentie voor het aantal 'echte'/niet ajax pagina's van Hyves. Ik ben het daar niet mee eens. Hoe kan google maar 700.000 pagina's indexeren als er al meer dan 3 miljoen profielen zijn? Google indexeerd helaas niet de totale website, ook niet alle niet dynamische pagina's.

15 mei, 2007 22:41  
Blogger Arnoud zei...

Sitedetail heeft uitleg gegeven over de herkomst van de aantallen
Toch blijf ik mijn twijfels houden over kwaliteit van de cijfers, de waarde van de grootte van een website en de methodiek van meten.

15 mei, 2007 23:26  
Anonymous FredZ zei...

Op breuls.log een aardige post naar aanleiding van jouw post: "Hoe groot is de jouwe?" http://breuls.org/2007/5/15#a2972

16 mei, 2007 09:08  
Anonymous Anoniem zei...

Arnoud, twijfels mag je hebben. Wat bepaalt de kwaliteit volgens jouw dan?
De waarde om de grootte van websites te weten is voor iedereen natuurljik anders. Sommigen zullen het waardevol vinden om te weten, andere zullen er niets aan hebben.
De methodiek van meten is iets verder uitgelegd in de update op sitedetail, maar het komt neer op een crawler die het NL domein heeft geindexeerd en daar kan je dan gewoon een rangorde van grootte uit halen.

16 mei, 2007 10:26  
Blogger Arnoud zei...

@Fred; bedankt voor de tip
@anoniem: uiteindelijk is het aantal pagina's een nietszeggend getal. Helemaal als je het bekijkt in een breder perspectief: doel van website, effectiviteit, efficientie, inhoud, doelgroep enz. enz.
Ik zou uit de aantallen misschien wel concluderen dat Hyves eens wat pagina's moet wegknikkeren zodat de performance omhoog gaat, iemand anders denk dat Hyves de belangrijkste website is.

16 mei, 2007 10:38  

Een reactie plaatsen

<< Startpagina