Vlákno názorů k článku Analýza: Jaké SEO faktory jsou nejdůležitější pro výsledky vyhledávání Seznamu? od Michal Illich - Nějak nerozumím tomuhle: - Stránka má jinou než českou...

Článek je starý, nové názory již nelze přidávat.

28. 11. 2012 11:03

Michal Illich

Nějak nerozumím tomuhle:
- Stránka má jinou než českou doménu 0,362
- Stránka má českou (.cz) doménu 0,31

Tyhle dvě množiny jsou navzájem disjunktní.
Pokud tedy být v jedné má pozitivní korelaci s pořadím ve vyhledávání, tak být v té druhé množině by mělo mít stejně velkou negativní korelaci, ne?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 11. 2012 11:30

bez přezdívky

Dobra otazka... To by me zajimalo take...

Pokud to nema zadny vliv, tak bych pochopil vysledek 0 a 0, ale pokud i minimalni vliv je, tak bych take ocekaval npr. +0.1 a -0.1 jelikoz, jak pisete, se tyto dve veliciny vzajeme vylucuji...

Mozna jen preklep (chybejici znamenko)?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 11. 2012 17:37

Jiří Koutný (neregistrovaný)

Michale, tohohle případu jsem si také všiml. Data/způsob výpočtu jsem ověřoval a nepřišel jsem na nic podezřelého.

Nejsem ve statistické až tak zkušený, takže to raději ověřím a napíšu sem výsledek.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 11. 2012 11:06

Matouš Borák (neregistrovaný)

Zajímavé. Když nad tím přemýšlím, vlastně mi nedochází, jak je možné, že z toho vznikla dvě čísla. Vzhledem k tomu, že samotná nezávislá proměnná tu má jen dvě hodnoty (cz doména, ne-cz doména), čekal bych prostě jediný koeficient korelace - statistickou závislost na těchto dvou hodnotách. Znaménko by určovalo, která varianta je pro seznam důležitější. Ale možná mi něco podstatného taky uniká :).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 11. 2012 11:25

brunob

Ja tomu rozumiem tak, že pri cz, aj "ne-cz" doméne je približne rovnaká pravdepodobnosť, že sa objaví v top 20. Negatívna korelácia by tam bola, ak by Seznam jednu doménu výrazne zvýhodňoval - a tým by z top 20 vytlačil iné domény - čo sa podľa analýzy nepreukázalo.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 11. 2012 10:30

bez přezdívky

Přesně tak tomu rozumím i já, viz můj komentář níže.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 11. 2012 10:02

bez přezdívky
Takže abych to shrnul:

Pozitivní korelace faktoru hasNonCzDomain -> NEčeská doména se ve vzorku vyskytovala častěji s vyšší pozicí, než s nižší.

Negativní korelace faktoru hasNonCzDomain -> NEčeská doména se ve vzorku vyskytovala častěji s nižší pozicí, než s vyšší.

Pozitivní korelace faktoru hasCzDomain -> česká doména se ve vzorku vyskytovala častěji s vyšší pozicí, než s nižší.

Negativní korelace faktoru hasCzDomain -> česká doména se ve vzorku vyskytovala častěji s nižší pozicí, než s vyšší.

Nemyslím si, že by např. 1) automaticky implikoval 4) apod.

Navíc vstupem výpočtu není pouze atribut "má českou doménu/má jinou než českou doménu". Druhý atributem jsou totiž pozice ve vyhledávání, které jsou v obou případech shodné.

V pochopení možná pomůže následující PHP kód: http://pastebin.com/J7E6SePD

Já jsem z výsledků pochopil, že pokud jsou korelační koeficienty (téměř) shodné, tak se oba typy TLD vyskytovaly ve výsledcích se stejnou pravděpodobností na nízkých i vysokých pozicích.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 11. 2012 20:05

Matouš Borák (neregistrovaný)

Díky za shrnutí. Stále mi nejde do hlavy závěr, který z toho děláte. Když Vás budu citovat, tak vlastně říkáte:

NEčeská doména se ve vzorku vyskytovala častěji s vyšší pozicí, než s nižší
a zároveň platí, že:
česká doména se ve vzorku vyskytovala častěji s vyšší pozicí, než s nižší.

Toto mi hlava prostě nebere :-)

Problém je možná v tom, že v tomto konkrétním případě podle mě test nesplňuje vstupní předpoklady pro použití Spearmanova Rank koeficientu. Tady je hezky shrnuto, jaké vlastnosti musí vstupní proměnné mít: musí být buď kontinuální (neboli kvantitativní, jako je třeba počet odkazů na stránku), nebo alespoň ordinální, tj. musí mít v sobě inherentně obsaženou kvalitu "pořadí". U testu s doménami tento předpoklad splňuje pouze proměnná výsledné pořadí na seznamu, ale proměnná hasCzDomain / hasNonCzDomain není ani kontinuální, ani nemá žádné pořadí. Je pouze nominální.

Spearman rank koeficient, jak ho chápu já, pak vyjadřuje shodu v monotónnosti obou proměnných. Monotónnost ale asi těžko lze určit u libovolně zvolené kategorie (typu "má .cz doménu") protože nejde říct, "má více .cz doménu" nebo "má méně .cz doménu".

Můj závěr z toho je, že se tyto typy korelací dají hezky použít pro SEO testy, ve kterých je souvislé pole hodnot, např: počet odkazů na web, počet výskytů klíčových slov v title tagu apod., ale už ne na "binární" proměnné typu česká doména nebo klíčové slovo je obsaženo v hostname. Vůbec netuším, co ta výsledná čísla u těchto testů mohou znamenat, ale já osobně jim - omlouvám se - nevěřím.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 11. 2012 20:32

Matouš Borák (neregistrovaný)

Ještě to doplním: vlastně mě napadá, že kdybychom si z proměnné "web má českou doménu" myšlenkově udělali ordinální proměnnou, tj. že kdybychom řekli, že "mít českou doménu je jakoby víc než nemít", pak se oba testy (hasCzDomain a hasNonCzDomain) redukují na jediný test hypotetické proměnné "česká doménovitost webu" versus pořadí na Seznamu.

Pak by mi ale z výsledné korelace kolem 0.3 vycházelo, že Seznam naopak mírně zvýhodňuje české domény oproti všem ostatním. A teď babo raď. :-)

Vlákno názorů k článku Analýza: Jaké SEO faktory jsou nejdůležitější pro výsledky vyhledávání Seznamu? od Michal Illich - Nějak nerozumím tomuhle: - Stránka má jinou než českou...

Dále u nás najdete

Začínající podnikatel: Základní termíny a marketing

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Daňové přiznání 2026: Termíny, novinky a změny

Malware, ransomware a další online hrozby: Jak se liší?

Stát se za data retention omluvil, ale údaje sbírá dál

Majetkové přiznání dalo ministrům současné vlády zabrat

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Zahrávají si ČEZ či E.ON s čínským ohněm?

Agentické nakupování mění pravidla e-commerce

Lidl Outlet opustil Olomouc a zamířil na sever Moravy

Kdo se bude moct vyhnout EET a co bude muset splnit?

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

U dědečkova stavu našla smysl a teď oživuje unikátní tkaní

Navazující a souběžná zaměstnání pro účely JMHZ

Plánované změny v penzích: Zjistili jsme další podrobnosti

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe