Hlavní navigace

Analýza: Jaké SEO faktory jsou nejdůležitější pro výsledky vyhledávání Seznamu?

Jiří Koutný 28. 11. 2012

Co může nejvíce ovlivnit umístění webové stránky ve vyhledávači na Seznam.cz? Možná vodítka nabízí korelační analýza více než 11 tisíc klíčových slov, kterou provedl Jiří Koutný.

Po vzoru zahraničních Search Engine Ranking Factors vznikl nedávno v Česku web SEOFaktory.cz. Vybraní čeští SEO konzultanti na něm hodnotili důležitost jednotlivých SEO faktorů pro úspěch ve vyhledávačích. Cílem tohoto článku je konfrontovat jejich názory s výsledky statistické analýzy důležitosti SEO faktorů.

Analýzu se jsem provedl v srpnu 2012 a zaměřuje se pouze na vyhledávač Seznam.cz. Pokud vás zajímají výsledky pro Google, přečtěte si článek Ranking Factors 2011 od SEOMozu. Obě analýzy využívají podobných postupů. Zájemci si mohou přečíst i kompletní metodiku mé analýzy.

Způsob výběru SEO faktorů

Zkoumané faktory jsem přebral z webu SEOfaktory.cz. Podrobně popsaný způsob výběru hledejte opět v metodice.

Analýza jej zaměřena především na on-page SEO faktory. Mezi off-page SEO faktory jsem vyhodnocoval pouze faktory Počet odkazů webu Počet unikátních webů, které odkazují na web. Pro analýzu dalších off-page faktorů jsem neměl k dispozici vhodný zdroj dat o zpětných odkazech. Potřebná data bylo možné získat např. přes API SEOMozu, bohužel pouze za vysoký poplatek.

Hlavní zkoumané faktory jsou vybrány na základě průzkumu ze SEOFaktory.cz.

Doplňkové faktory doplňují faktory hlavní. Např. faktor Klíčové slovo použito v názvu domény (např. www.klicoveslovo.cz) bylo nutné vydefinovat jasněji, a proto jsem jej rozdělil na hlavní faktor Klíčové slovo se shoduje s doménou druhého řádu (přesná shoda) a doplňkové faktory:

  • Klíčové slovo se shoduje s doménou druhého řádu (volná shoda),
  • Klíčové slovo je obsaženo v hostname (= celá doména, např. email.seznam.cz),
  • Počet výskytů klíčového slova v hostname.

Mezi doplňkové faktory jsem zařadil i jediné off-page faktory Počet odkazů webu a Počet unikátních webů, které odkazují na web.

Postup analýzy

Z databáze našeho SEO nástroje Collabim jsem vybral 11 363 klíčových slov, pro která jsme spočítali aktuální pozice na Seznam.cz. Pro každé z těchto klíčových slov jsem následně získal prvních 20 výsledků (URL) vyhledávání. Dohromady jsem stáhl a zpracoval obsah 227 600 stránek.

Po vzoru výše zmíněné analýzy SEOMozu jsem použil postup zvaný korelační analýza, konkrétně Spearmanův koeficient pořadové korelace.

Co je korelační analýza?

Česká Wikipedia říká: “Korelace znamená vzájemný vztah mezi dvěma procesy nebo veličinami. Pokud se jedna z nich mění, mění se korelativně i druhá a naopak. Pokud se mezi dvěma procesy ukáže korelace, je pravděpodobné, že na sobě závisejí, nelze z toho však ještě usoudit, že by jeden z nich musel být příčinou a druhý následkem. To samotná korelace nedovoluje rozhodnout.

Míru korelace vyjadřuje korelační koeficient, který nabývá hodnot od –1 (zcela nepřímá závislost) až do +1 (zcela přímá závislost). Hodnoty kolem nuly znamenají, že mezi faktory není pravděpodobně žádná závislost.

Nejvyšší míry korelace v mé analýze dosáhl faktor Klíčové slovo použito v názvu domény (viz graf níže). To ale nemusí znamenat, že Seznam.cz skutečně používá tento faktor ve svém algoritmu řazení výsledků. Výsledek pouze říká, že veličiny pozice webu na dané klíčové slovo a umístění klíčového slova v doméně webu na sobě nějakým způsobem závisí.

V tomto případě je tato závislost (korelace) přímá. To znamená, že weby s klíčovým slovem v doméně mají na toto klíčové slovo častěji lepší pozici ve srovnání s weby, které klíčové slovo v doméně nemají.

Vysoké pozice těchto webů ale mohou být způsobeny úplně jiným faktorem. Podívejme se např. na texty příchozích odkazů webu www.letenky.cz (zdroj: MajesticSEO):


Autor: Jiří Koutný

Z tabulky vidíme, že nejčastější texty odkazů webu www.letenky.cz obsahují klíčové slovo letenky. Je to způsobeno tím, že u většiny webů je nejčastějším textem odkazů právě URL (doména). Pokud doména obsahuje důležité klíčové slovo, pak toto klíčové slovo obsahuje ve svém textu i většina odkazů.

Pro řazení výsledků vyhledávače Seznam.cz tak nemusí být důležitý faktor umístění klíčového slova v doméně, ale spíše faktor umístění klíčového slova v textech zpětných odkazů webu.

Výsledek


Autor: Jiří Koutný

Téměř shodná míra korelace faktorů Stránka má jinou než českou doménu a Stránka má českou doménu potvrzuje všeobecně známý fakt, že na typu domény prvního řádu (TLD) u Seznam.cz nezáleží. Jako doplněk by mohlo být zajímavé spočítat korelaci pozic ve vyhledávačích u domén s exotickými TLD (.travel, .aero atd.).

Vysoká míra korelace faktorů týkajících se klíčového slova v doméně mě nepřekvapila, viz příklad u vysvětlení korelační analýzy v předchozí části. Stejně tak mě nepřekvapil téměř nulový korelační koeficient faktoru Počet výskytů klíčového slova na stránce. Zkušení SEO konzultanti vědí, že vycpat stránku jedním klíčovým slovem nemá smysl.

Zajímavé bylo zjištění, že umístění klíčového slova v hlavním nadpisu stránky koreluje s výslednou pozicí ve výsledcích více, než umístění klíčového slova v titulku stránky. Rozdíly v korelačních koeficientech jsou ale zanedbatelné. Přesto jsem čekal, že faktory spojené s umístěním klíčového slova v titulku stránky si budou vést lépe.

Mimo hlavní faktory jsem spočítal korelaci i pro faktory doplňkové:


Autor: Jiří Koutný

Téměř nulová míra korelace mezi počtem odkazů/odkazujících unikátních webů a pozicí se také dala očekávat. Vyhledávače hodnotí spíše kvalitu odkazů než jejich absolutní počet. Vhodnější by bylo zahrnout pouze odkazy obsahující v textu konkrétní klíčové slovo. Tato data se mi bohužel nepodařilo získat, viz důvody popsané v úvodu článku.

Korelační koeficient faktoru Klíčové slovo je obsaženo v hostname se téměř shoduje s koeficientem faktoru Klíčové slovo se shoduje s doménou druhého řádu. Podobné koeficienty u faktorů Počet výskytů klíčového slova v hostname a Klíčové slovo je obsaženo v hostname způsobuje fakt, že v naprosté většině případů se klíčové slovo v hostname vyskytuje pouze jednou.

Zbývající koeficienty doplňkových faktorů nabývají velmi podobných hodnot, jako příslušné hlavní faktory.

Závěr

Porovnání pořadí důležitosti SEO faktorů:

WT100

Název faktoru Dle korelačního koeficientu Dle SEOFaktory.cz
Klíčové slovo použito v názvu domény (např. www.klicoveslovo.cz) 0,433 1. 50 % 5.
Stránka má jinou než českou doménu 0,362 2. 34 % 8.
Stránka má českou (.cz) doménu 0,31 3.
Klíčové slovo použito jako první slovo/a v tagu nadpisu <h1> 0,27 4. 51 % 4.
Klíčové slovo použito kdekoliv v tagu <title> 0,25 5. 79 % 1.
Klíčové slovo použito kdekoli v tagu nadpisu <h1> 0,216 6. 53 % 3.
Klíčové slovo použito jako první slovo v tagu <title> 0,169 7. 71 % 2.
Klíčové slovo použito v prvních 50 – 100 slovech v HTML kódu stránky 0,044 8. 34 % 8.
Klíčové slovo použito kdekoli v tagu dalších nadpisů <h2> – <h6> –0,027 9. 44 % 6.
Použití klíčových slov / množství opakování klíčových slov v HTML stránky –0,051 10. 39 % 7.

Opakuji, že vysoká míra korelace neznamená, že Seznam.cz skutečně daný faktor používá přímo ve svém algoritmu řazení výsledků. Z tabulky proto nelze vydedukovat, v jakých případech se hodnotitelé na SEOFaktory.cz mýlili. U mnoha faktorů je ale rozdíl významný a ukazuje, že dotyčný faktor nemusí být ve skutečnosti pro Seznam.cz tolik důležitý.

Našli jste v analýze další zajímavé vztahy, které jsem přehlédl? Podělte se o ně v komentářích k článku.

Našli jste v článku chybu?
Vitalia.cz: Když bílkoviny, tak jíme ty nekvalitní

Když bílkoviny, tak jíme ty nekvalitní

Podnikatel.cz: Poslanci chtějí sebrat majetek Bakalovi

Poslanci chtějí sebrat majetek Bakalovi

DigiZone.cz: Parlamentní listy: kde končí PR...

Parlamentní listy: kde končí PR...

Vitalia.cz: Tesco nabízí desítky tun jídla zdarma

Tesco nabízí desítky tun jídla zdarma

Vitalia.cz: Očkování proti chřipce u dětí: ČR nemá pravidla

Očkování proti chřipce u dětí: ČR nemá pravidla

Lupa.cz: Jak se prodává firma za miliardu?

Jak se prodává firma za miliardu?

120na80.cz: Zázrak ze smetiště: co léčí lopuch?

Zázrak ze smetiště: co léčí lopuch?

DigiZone.cz: Mordparta: trochu podchlazený 87. revír

Mordparta: trochu podchlazený 87. revír

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

DigiZone.cz: O2 TV doplnilo kanály HBO v HD

O2 TV doplnilo kanály HBO v HD

Vitalia.cz: Tohle jsou nejlepší česká piva podle odborníků

Tohle jsou nejlepší česká piva podle odborníků

120na80.cz: Na různou rýmu různá homeopatie

Na různou rýmu různá homeopatie

DigiZone.cz: Samsung EVO-S: novinka pro Skylink

Samsung EVO-S: novinka pro Skylink

Podnikatel.cz: Babišovi se nedá věřit, stěžovali si hospodští

Babišovi se nedá věřit, stěžovali si hospodští

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Vitalia.cz: Test dětských svačinek: Tyhle ne!

Test dětských svačinek: Tyhle ne!

DigiZone.cz: LG OLED65E6: první pohled

LG OLED65E6: první pohled

Vitalia.cz: Když všichni seli řepku, on vsadil na dýně

Když všichni seli řepku, on vsadil na dýně

Podnikatel.cz: Byla finanční manažerka, teď cvičí jógu

Byla finanční manažerka, teď cvičí jógu

DigiZone.cz: Digi2GO: výborný základ, ale...

Digi2GO: výborný základ, ale...