Hlavní navigace

Vlákno názorů k článku Slevové servery a srovnávače cen, třeste se: Google Panda Update přichází od Yuhů - Jsem docela překvapený, že si Cutts a Singhal...

  • Článek je starý, nové názory již nelze přidávat.
  • 31. 8. 2011 19:13

    Yuhů

    Jsem docela překvapený, že si Cutts a Singhal takhle pustili hubu na špacír, protože konkrétní detaily rozpoznávacích algoritmů i detaily sběru je skutečně nutné ostře strážit. Ani ne tak před konkurencí jako spíš před blackhat SEO farmáři. Tyhle věci (rozpoznávání spamu apod.) se dělají už aspoň osm let a nikdy se o nich moc nemluvilo. Asi se teď snaží být zajímaví nebo ženou cenu akcií.

    Je sice zajímavé, že se "komentátoři internetového prostoru" na něčem shodnou, ale mnohem důležitější je, co ukazují data při vyhodnocení signálů. V článku je zmíněno devět signálů. V praxi je dobré spočítat si několik tisíc až několik desítek tisíc signálů a teprve ty vyhodnocovat. Přibližně každý desátý se ukáže jako výživný, a ten se použije. Nevěřím třeba, že by Google nesledoval diferenciaci a rozkročenost obsahu nebo nepřirozenost jazyka. Sám dobře vím, jak se třeba pro vyhledávání hodí mít detekci automatického překladu.

    Když přemýšlíte o zdrojích dat, tak je musíte myšlenkově rozdělit na dvě skupiny. 1) zdroje ovlivněné stránkou a 2) zdroje neovlivněné stránkou. Například Analytics patří do zdrojů ovlivněných stránkou, protože jsou prostě jenom na některých stránkách. Stejně tak AdSense nebo facebook tlačítka -- jsou jenom na některých stránkách. Naopak SERP nebo data z Chrome jsou konkrétním webem neovlivněné. Pak platí následující:
    1) zdroje ovlivněné stránkou lze použít pouze na VÝZKUM, nikoli na sběr signálů pro řazení nebo vyhodnocování kvality. (Typicky tedy Analytics lze použít na výzkum signálů.) Je to tím, že takové signály mají malé pokrytí. Na výzkum to stačí, na provoz nikoli.
    2) jako signály můžete použít zdroje neovlivněné stránkou (tedy třeba data z Chrome). Snaha farmářů utéct postihu tím, že si zruší Analytics, je směšná, protože Analytics se na detekci z pohledu Google nedá dobře použít.

    V přehledu použitelných reklamních systémů chybí kontextový Sklik.

    Lukáši, velmi dobrý článek, chválím.

  • 2. 9. 2011 7:30

    Franta (neregistrovaný)

    Muzu se zeptat na jednu vec k clanku?
    "Mezi nejserióznější weby, které Panda zřejmě nebude mít ráda, jsou ty, které umožňují položit otázku a dostat na ní od jiných uživatelů odpověď. Některé z podobných stránek už v USA a UK narazily… "
    Vite o nekterych konkretnich? Diky.

  • 31. 8. 2011 23:29

    Lukáš Tomek (neregistrovaný)

    Díky za pochvalu i poznámky. Zajímala by mě detekce strojového překladu. V nějakém divokém snu bych si snad ještě dovedl představit řekněme detekci textu strojově přeložného daným překladačem (např. Google Translator), přinejmenším primitivně by se to dalo zkusmo přeložit zpátky a hledat duplicitu. Ale obecná detekce strojového překladu? Existují na to nějaké lingvistické studie, patenty a pod.?

  • 1. 9. 2011 8:48

    E-Ryc (neregistrovaný)

    Tak ona je otazka, co se zverejnilo/odhadlo a co vsechno tam v realu bezi...

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).