Nejsem prilis velky narcis :-), ale kdyz jsem zkousel dat vyhledat svuj web Palmknihy, tak Jyxo nasel jenom odkazy v clancich, stary a skoro dva roky nevyuzivany web na hyperlinku a domenu www.palmknihy.cz nenasel.
Zkouseno dnes a vcera.
http://www.jyxo.cz/search.php?s=palmknihy&d=cz
Web palmknihy.cz maji vsechny vyhledavace ZAKAZANO indexovat webmasterem tohoto webu. Viz http://palmknihy.cz/robots.txt - pro vsechny agenty je "disallow: /".
Tedy si promluvte s vasim webmasterem (pokud to nejste vy sam ;) ), a nevinte druhe. Nas robot indexuje vsechny, krome tech, ktere si vyslovne nepreji opak.
Ha, to je na mně!
Je pravda, že jsem zakázal robotům přístup, dělali nám falešné downloady a v tu chvíli jsem neměl čas hrát si s robots.txt... Taky je pravda, že jsme s kolegou každý z jiného konce republiky a že některé informace tím pádem mají delší cestu a některé dokonce ani nedojdou :-)
Tolik na vysvětlení. Někdy v budoucnu budeme mít sofistikovanější robots.txt, jen co se k tomu pořádně dostanu. A pak nastane krásná a zářivá budoucnost, plná šťastných hrajících si dětí... Howgh.
Také jsem zkoušel najít svůj nový web www.osobnosti.cz, ale bohužel to nic nenašlo, je starý 2 měsíce. U svého druhého webu (staršího 7 měsíců) to bylom trochu lepší www.topstars.cz. Ale když jsem dal hledat jednotlivé osobnosti tak to nic nenašlo.
www.osobnosti.cz v indexu je, zkuste hledat treba domain:osobnosti.cz, vypise vam to vsechny zaindexovane stranky.
Bohuzel ale mate v html kodu dost podstatne chyby - uprostred souboru je z niceho nic zcela novy <html>, <head> a <title> tag. Takto stranky nemohou byt dobre renderovany nekterym prohlizeci a zalezi na konkretnim parseru, ktery title si vybere (jyxo si vybere ten druhy a proto vam zaindexuje jen danou cast, tedy anketu). Projdete si stranky validatorem HTML...
Ano, domenu .net neindexuje zadny z ceskych vyhledavacu. Stranek zminujicich internetjam.net v .cz domene to najde dost.
Na adrese http://am.crolink.cz/ je jen presmerovani a na cilove strance to na mne vysype primo html kod stranky delane ve FrontPage. Zrejme vas webhosting vraci spatne hlavicku MIME.