Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názor k diskusi Projekt "Nový hledač"

ondra.novacisko.cz
ondra.novacisko.cz (neregistrovaný) ---.lam.cz
2. 2. 2010 1:55

Re: Odpovědi

celé vlákno
V jiném vlákně vám Yuhu prozradil (ačkoliv netuším proč), že Seznam má okalibrované výsledky najatou partou brigádníků sestavenou tak, aby tvořili reprezentativní vzorek uživatelů. A neustále srovnávají svoje výsledky s výsledky brigádníků. Také Yuhu prozradil, že umí měřit úspěšnost i jiných vyhledávačů, například Googla (což je logický, porovnám výsledky brigádníků s výsledkem googla).

Napadlo Vás aspoň na chvíli, jak se ladí takových 118 kritérii? Myslíte si, že si tam sedne nějaký programátor a začne hýbat nějakýma vahama?

Ale houby. Když mám na jedné straně kritéria a na druhé straně požadované výsledky, pak takovéhle úlohy se řeší na VŠ v předmětu Problémy a Algoritmy, kdy problémem je třeba přábě naladění vah, aby výsledek hledání odpovídal kalibrovanému výsledku. Algoritmů, od genetických až po různě sofistikované, jako házení hrachu na N rozměrnou plochu, nebo ochlazovací algoritmy, to je pak sousto pro analitika a několik kilowattů výkonu a tisíce minut běhu jednoho trochu většího nabušeného stroje. I tak je problém dosáhnout ideálu.

A to co chci říct, že kdyby byla pravda, že by stačilo jen posuzovat klikání na výsledky, že by takový závěr musel vypadnout z výše uvedených algoritmů. Tedy že by všechny kritéria měli nulu a pouze klikání mělo 1? Zkuste se zamyslet a prozradit mi, proč tomu tak nebude. Proč nakonec každé kritérium dostane nějakou váhu tak, aby výsledky se optimálně přibližovali tomu, co by uživatel chtěl vidět.

To mi připomíná tu hádanku na rootu s tím autem a kozlama. Taky jsem byl přesvědčen, že to musí být 50:50, ale když to naprogramujete, zjistíte, že výsledky jsou jinde. Člověk se bohužel dost často plete.