Hlavní navigace

Názor k článku Jak na hodnocení uživatelů od Daniel.Peder@infoset.cz - Předesílám, že "hic sunt leones" i "hidden voting"...

  • Článek je starý, nové názory již nelze přidávat.
  • 24. 5. 2004 15:06

    Daniel.Peder@infoset.cz (neregistrovaný)
    Předesílám, že "hic sunt leones" i "hidden voting" jsou jen takové moje interní názvy, které jsem si přiřadil metodám, o kterých jsem, také v souvislosti s hodnocením příspěvků, v posledních letech teoreticky přemýšlel.

    "Hic sunt leones" je poměrně podobný systému slashdot:

    pro jednoduchost začněme tím, že "všechny" nové diskuzní příspěvky označujeme jako "nebezpečné" neboli zařazené do oblasti "hic sunt leones". Takže běžný user se jimi nemusí nechat obtěžovat, neboť je nevidí, dokud nechce, ale když chce, může! A nesmí mu v tom bránit žádný problém typu registrace atd..., prostě kdo chce, může. Totální demokracie.

    A zde už začíná přirozená, tudíž automatická, selekce, neboť do zóny "hic sunt leones" budou chodit jen ti "pracovitější" návštěvníci a ty bych ještě rozdělil na zvědavce, specialisty a spolupracovníky redakce - tohle dělení tu nebudu dál pitvat - ale jistě chápete, že pro dálší ladění může mít podstatný význam a že se také dá automatizovaně vyhodnotit na základě stejných principů.

    Tito "pracovitější" návštěvníci budou dle svého zvážení na některé "hic sunt leones" příspěvky reagovat.

    A tím se dostáváme k "hidden voting". Jakmile někdo reaguje na příspěvek někoho jiného, znamená to, že se jedná o zajímavé téma, tím dochází k tomu, že tento příspěvek dostal svůj první "volební hlas" a tím mu můžeme zvýšit TR(TextRank).TEČKA. Dále už jen rekurzivně pokračujeme ve zvyšování TR za každou "přímou-reakci" a za "reakci-na-reakci" a počítáme výsledný koieficient podobným způsobem jako Google počítá page rank. Váhy jednotlivých koeficientů musíme zvolit odhadem a postupně dolaďovat. To už ale zvládá jeden člověk 1x měsíčně ;)

    UR(UserRank) nám z toho vychází samovolně jako matematicky spočitatelná hodnota získaná např. jako průměr hodnocení všech příspěvků které daný uživatel stvořil. Stále se co nejvíce držme analogie s Google PageRankem a máme vyhráno.

    A protože to celé začíná fungovat jako neuronová síť nemusíme se zabývat kvalitou příspěvků, neboť ta nám sama vyplave z kvality a orientace zájmu našich návštěvníků. Tu pak mírně korigujeme a modifikujeme nastavením koeficientů pro výpočet TR a koefientu "hic sunt leones" threshold, tj. kdy diskuzní příspěvek začíná být tak zajímavý, že se začíná zobrazovat běžným návštěvníkům.

    Hotovo. Nezbývá než to naprogramovat :)) a uvést do provozu.

    Samozřejmě se najde pár detailů k dořešení, ale jako základní rámec mi to připadá dostatečně robustní na to aby to mohlo samo začít žít.

    ---
    A proč neznámkovat? na lupě máte určitě poměrně slušný přehled o tom, kolik lidí si článek přečte, kolik ho oznámkuje, kolik reaguje v diskuzi a na kolik se kryjou počty známkujících s počty těch kdo reagují v diskuzi. To jsou myslím velice důležitá čísla a tipoval bych, že průnik známkovačů a diskutérů bude malý. Např. já občas diskutuju ale neznámkuju, známkování totiž nedává žádný reálný smysl, lidi známkujou z různých pohnutek, ale jak i z diskuze zde vyplývá, obvykle má být známkování spíše formou rychlého příspěvku do diskuze (např.: vypnout cookies a klikat na negativní známku) než nějakým objektivním zhodnocením kvality článku. Proti známkování taky mluví to, že je to akce navíc, při které člověk musí vyčkat než proběhne - a čas jsou peníze a v tomhle případě - nic z toho :))
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).