"Vybrane vyrazy z TOP treba 1000 se nahodnemu vzorku blizi daleko vice nez vyrazy pouzite v testu."
Tak to je temer statisticky oxymoron :-) Prosimvas, kde jste k te statistice pricichl?
"Ziskani nahodneho vzorku dotazu, pokud by byl recenzent ochoten testovat na stovkach vyrazu, je trivialni - staci odchytit kazdy n-ty dotaz polozeny vyhledavaci."
Nesmysl.
a) Vzorek je treba porizovat nahdonym vyberem z logu alespon za tyden, aby se vyloucily ruzne casove vlivy. (dotazy v 23.00 muzou vypadat jinak, nez v 8.30)
b) Vsadil bych se, ze vysledky budou dobre konvergovat uz u desitek mereni.