Hlavní navigace

Vlákno názorů k článku Jen pět procent dat nese textovou informaci od Marek Prokop - Nechci zpochybňovat naměřené údaje a souhlasím i s...

  • Článek je starý, nové názory již nelze přidávat.
  • 12. 11. 2002 10:39

    Marek Prokop (neregistrovaný)
    Nechci zpochybňovat naměřené údaje a souhlasím i s tím, jak je autor interpretuje, ale jednu poznámku bych přeci jenom měl. Holovatyho skript do textového obsahu nezahrnuje URL odkazů a žádné atributy, tedy ani atributy TITLE a ALT. Zatímco atributů asi na měřených stránkách mnoho nebude, odkazů je na většině z nich jako máku. U katalogů a portálů činí odkazy dokonce *hlavní obsah* stránky -- není to sice přímo viditelný obsah, avšak právě kvůli němu tam uživatelé chodí. Je tedy trochu nefér URL odkazů do obsahu nepočítat.
  • 12. 11. 2002 14:01

    Martin Kopta (neregistrovaný)
    Ano, Marku, bohužel data jsem měl hotová už před dvěma týdny a byl jsem jen líný napsat k nim tuhle omáčku, takže naše krátká diskuse o zahrnování atributů do obsahu proběhla až v době, kdy bych musel původní kód (naštěstí ho mám uložený) znovu kompletně přeměřit. Jenže to je dalších sedm hodin práce...

    Jinak s těmi odkazy, to je trochu problém. Jak by k tomu přišel Atlas, který odkazuje na článek na Českých novinách pod URL http://www.atlas.cz/r/?n2786725, když na něj odkazují přes URL http://www.ceskenoviny.cz/view-id.php4?id=20021112F01277. Stejný obsah, různá délka odkazu.

    Samozřejmě souhlasím s tím, že title, alt, summary, cite, href by se k obsahu pocitat mely. Otazkou je, jak zapracovat informaci nesouci obrazky (pres <img...>, pres jejich url, pres jejich datovy objem?) a ajak je snadno odlišit, abych nad tím nestrávilk několik týdnů.

    Ostatně, v článku odkazuju na svoje bookmarklety, kde offline verze zapocitava do obsahu i zminene atributy (ale narozdil od Holovatyho nezapocitavam document.title, protoze MSIE ma dost omezenou delku bookmarkletu a nepodarilo se mi zkratit regularni vyrazy).

    Taky je otazkou, jak hodnotit metainformace. Pro me treba informace typu xml:lang="en-MT" je pomerne zajimava a tvurce kodu si musel dat tu praci, aby mi ji zpristupnil...
  • 12. 11. 2002 15:39

    Marek Prokop (neregistrovaný)
    Martine, je mi jasné, že už jsi měl data naměřena a i tak, jak je to provedeno, jsou ty informace velmi zajímavé. Jen to srovnání by si zasloužilo komentář ve smyslu mého příspěvku. Chtě, nechtě, home page katalogu *má* obsahovat především odkazy, takže není úplně fér jí vyčítat, když je opravdu obsahuje.

    S délkou URL nic dělat nejde -- někdo odkazuje přes svůj redirekt, někdo odkazuje na weby s krátkými URL, někdo na weby s dlouhými URL... To by mne netrápilo.

    Co se týče dalších atributů, omezil bych obsah na ty, které jsou viditelné, nebo které by se v optimálním případě měly tisknout. Určitě tam tedy patří HREF (u A) a TITLE. ALT (a stejně tak LONGDESC) je už sporný, protože to je *alternativní* (a tudíž vlastně duplicitní) obsah. To už by se mohly počítat i stránky odkazované D-linky, samostatné verze pro PDA, atd.

    Atributy jako lang, cite, summary, apod. bych nechal plavat. Samozřejmě, že nesou informaci, ale tu nesou všechny HTML značky, pokud jsou správně použity. Kdyby se ale počítaly i H#, P, OL, a další sémantické značky, celá ta hračka by ztratila půvab. Muselo by se počítat ručně a rozhodovat o každé značce, zda je použita účelně a zda předmětnou informací přenáší tím nejefektivnějším způsobem.
  • 7. 12. 2002 12:00

    Marabu (neregistrovaný)
    No to je pane problem. Rekneme ze mate sajt jako e-shop. Pak je otazka co vsecko pocitate za "efektivni" informace. Logo obchodu? Rekneme ze ne, lec treba obrazky vyrobku jsou nepochybne informace dost dulezite (no schvalne zkuste si predstavit textovy popis monitoru! - takovej velkej zesikmenej, sedej tady dole ma tohle...)
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).