Hlavní navigace

Názory k článku Národní knihovna zpřístupnila část archivu českého Internetu

  • 8. 12. 2005 14:10

    bez přezdívky
    Cim to je, ze s podobnymi vecmi The WayBackMachine www.webarchive.org nema problemy - nebo chcete rici, ze podnikaji nelegalne a to za bohateho prispeni akademicke sfery?
  • 8. 12. 2005 14:52

    MS (neregistrovaný)
    Vážený pane Hutaři,
    doufal jsem, že se ozve někdo kompetentní a zareaguje na můj příspěvek. Děkuji Vám, že jste některé záležitosti ujasnil.
    1. Otázka nutné smlouvy je podivná, ale to ani jeden z nás neovlivní.
    2. To, že je DC metadata nutné vložit pouze na hlavní stránku, je samozřejmě dobrá zpráva, možná by nebylo špatné upravit formulace přímo na Vašich stránkách, kde píšete "NK ČR vytvoří k Vašemu zdroji metadata, která si vložíte do html kódu Vašeho zdroje". Ani ve smlouvě (bod II/5, resp.příloha č.2) to není jasněji definováno (píše se tam, že metadata je nutno vložit do "hlavičky zdroje", čímž chápu HTML hlavičky všech stránek).

    Přesto mi dovolte tu nejdůležitější otázku:
    3. Proč se mi jako vydavateli vyplatí uzavřít smlouvu s Webarchivem.cz, když Internet Archive Wayback Machine též archivuje stránky? Výhodu bych viděl ve spojení Webarchivu s katalogem NK ČR, o kterém koneckonců píšete i na svých stránkách. Nepodařilo se mi však v online katalogu NK dohledat nic jiného, než anotaci zdroje (konkrétně Ikaros). Konkrétní články nejsou dohledatelné, nebo byla chyba na mé straně?

    Děkuji za odpovědi.
  • 13. 12. 2005 13:46

    Jan Hutař (neregistrovaný)
    bohuzel Vas musim zklamat, je to presne jak rikate. Internet Archive a jeho Wayback machine vyviji svoji cinnost bez toho aby se starali o autorska prava. Ovsem s tim, ze pokud vydavatel pozada o vyrazeni z jejich archivu, je jeho zdroj vyrazen. Zastupci Internet Archive se tim netaji a na konferencich (naposledy ve Vidni v zari 2005) lze tuto skutecnost bezne slyset. O vyrazeni pritom pozadalo zatim opravdu minimum vydavatelu.
  • 13. 12. 2005 14:03

    Jan Hutař (neregistrovaný)
    dobry den,
    dekuji na upozorneni, je asi opravdu treba formulaci na nasem webu zmenit.
    K otazce c.3 - v soucasne dobe jsou zaznamy spolupracujicich zdroju v samostatne bazi WEB, viz http://sigma.nkp.cz/F. Soucasti baze NKC, coz je katalog Narodni knihovny, bude behem 14 dni - od noveho roku (ceka se na nasazeni nove verze systemu Aleph).Dojde tedy k vnoreni baze WEB do NKC.
    Internet Archive opravdu archivuje spoustu ceskych stranek, ovsem sam uznate, ze pokud maji zaber na cely svetovy web, tak jim spousta veci utece. WebArchiv zajima jen domena .cz a ma tak vetsi sanci uspet a uchovat ji ve vetsim zaberu. Navic IA je soukroma neziskova spolecnost, tj. jeji kontinuita nemusi byt zarucena.
    s pozdravem Jan Hutar, NK ČR
  • 13. 12. 2005 15:12

    Jan Hutař (neregistrovaný)
    dobry den,
    mate pravdu, prirovnani je presne. Ovsem je nutno si uvedomit, ze projekt je ve svem pocatku. Tj. sklizi se max. 2x rocne, a to do hloubky 25-50 odkazu. U zdroju, na ktere mame smlouvu se pocita zatim se 4 skliznemi za rok. U zpravodajskych serveru je stale problem, ovsem v budoucnu se pocita s castejsi sklizni. Robot je schopny poznat a sklidit pouze "nove" veci, takze nestahuje tuny balastu okolo.
    Proc neni uzakonena povinnost vydavatele? To co popisujete se nazyva Povinny vytisk, ktery funguje ve vsech civilizovanych zemich (vcetne ČR) pro vse papirove (knihy a periodika). Ovsem v soucasnych zakonech o povinnem vytisku nejsou zmineny elektronicke online zdroje, kterych pribyva. Proto dochazi ke zmenam techto zakonu (Dansko,Novy Zeland, Island,Velka Britanie, pripravuje se mj. Francie). Pokud by se provedla zmena i v ceskych zakonech o PV, bylo by to skvele. Zatim bohuzel neni.
    Jan Hutar, NK ČR
  • 7. 12. 2005 8:21

    Michal Krsek
    Ma nejaky jiny vyznam nez ukazat ctenarum, jak do HTML kodu nastrkat Dublic core elementy? I to by melo vyznam (mnohem vetsi nez ruzne snahy o cisty web), jenze by to muselo byt trosku vysvetleno :-)
  • 9. 12. 2005 10:32

    bez přezdívky
    Stejně mi to přijde jako pitomost. Proč prolítávat weby nějakým robotem jednou za rok s úrovní zanoření nula nula nic? Kolik pak budete mít třeba z idnes.cz nebo kteréhokoliv webu, který vydává tři nové články denně? Navíc s každou informací robot stahuje ještě tuny balastu kolem.

    Proč není uzákoněna povinnost vydavatele, aby jednou za rok poslal celou svou databázi (článků, diskusí, atd) Národní knihovně a ta by to po zbytek roku nějak zpracovávala... Měla by sice surová data, ale zcela kompletní.

    Váš současný přístup mi přijde jak kdyby místo povinných výtisků novin, časopisů a knih (doufám že toto stále existuje!) vyběhli jednou za rok pracovníci knihovny do trafik a knihkupectví, z každého výtisku který najdou vyškubli náhodně čtyři stránky a pak to v knihovně ve sklepě syslili. Jaký by pak měli obraz současného světa pro budoucí generace? Naprosto zmatený a zcela neúplný.
  • 9. 12. 2005 13:08

    Pizi (neregistrovaný)
    Proc neni uzakonena, protoze to je zasah do svobody vydavatele. Nechapu proc takova povinnost. Jakym pravem? Nevidim nic zadouciho na tom snazit se vydavani cehokoliv ztizit.
  • 7. 12. 2005 17:37

    Jan Kálal
    Význam posledního obrázku je ukázat čtenářům Lupy, co chce po vydavatelích Národní knihovna. Máte pravdu, že se jedná a elementy Dublin core, které NK pro popis webů určených na archivaci používá. Smylsem článku bylo informovat o WebArchivu jako takovém, technické detaily řešení zbydou možná do jiného textu.
  • 7. 12. 2005 21:39

    Michal Krsek
    Hm, mozna, ze jsem ten clanek cetl HODNE nepozorne, ale nejak jsem z kontextu nevyrozumel, ze je to neco, co po vydavatelich chce Narodni knihovna.
    Naproti tomu stacilo zminit, ze NK chce po vydavatelich krome souhlasu take umisteni relevantnich metadat.
    V prezentovane podobe se mi to jevi nesmyslnym.
  • 7. 12. 2005 21:39

    Michal Krsek
    Verte, ze presne postupy, jak implementovat DC do webu jsem slysel (a cetl) nekolikrat. Naposledy v cervnu na zkousce Dokumentograficke informacni systemy - vytahl si to clovek prede mnou :-)
  • 9. 12. 2005 15:24

    J (neregistrovaný)
    Teba proto, ze podobna povinost existuje pro papirove vydavatele. Cokoli u nas vydate, musite od toho dodat tzv. povine vytisky knihovnam. Ti plati jak pro knihy, tak pro noviny a casopisy.
  • 7. 12. 2005 19:22

    MS (neregistrovaný)

    Jsem jeden z těch "kontaktovaných subjektů", které na nabídku Národní knihovny neodpověděly. Pokusím se nastínit, proč.

    Když jsem pro tehdy vznikající projekt Glosy.info žádal o přidělení ISSN, zaškrtl jsem souhlas s archivací média v digitálním archivu.

    O několik týdnů později jsem obdržel e-mail, z nějž jsem vyrozuměl, že bych měl vytisknout smlouvu, vyplnit, podepsat a odnést na poštu a přidat do stránek metadata Dublin Core. Mám tedy obětovat svůj čas vyřizováním smlouvy a přidat na stránku cca 3 GB necachovatelných dat ročně (počítáno pro menší projekt se 100 000 PV měsíčně, velikost metadat 2,5 kB) výměnou za účast na "projektu, který nebudeme potřebovat dnes a možná ani za deset let, ale jehož výsledky snad ocení další generace" (jak jej popisuje ředitel Národní knihovny Vlastimil Ježek)?

    Jinak řečeno: Nechápu, na co je webarchiv.cz dobrý. Na rešerše určitě ne, používají se zavedené akademické archivy (JSTOR, Proquest..) nebo pro laické hledání Google a pod. Návštěvnost nám také nepřinese. A jestli je určen pro další generace, ušetřím si tedy námahu, kterou bych nyní musel vynaložit, protože než další generace doroste, legislativa určitě umožní archivovat elektronické zdroje bez smlouvy s vydavateli.

  • 7. 12. 2005 18:54

    Adam Brokeš (neregistrovaný)
    Pokud Vás zajímají přesné postupy, jak implementovat Dublin Core metadata, mohu Vás odkázat na relevantní odkazy: http://www.ics.muni.cz/dublin_core/
    http://www.webarchiv.cz/cgi-bin/dc_cz.pl
  • 8. 12. 2005 13:49

    Jan Hutař (neregistrovaný)
    Je jistě poutavé přečíst si názor z druhé strany, ovšem názor obsahuje několik zavádějících nepřesností. Tady je několik komentářů a upřesnění

    - Vytištění smlouvy, přečtení a její vyplnění včetně podpisu zabere max. 30 minut. Vyplnění spočívá v uvedení adresy vydavatele, data a podpisu. Otázkou zůstává investice do poštovného a samotný výlet na poštu. Národní knihovna by uvítala možnost souhlasu např. emailem, ovšem v rámci současné legislativy (autorský zákon) to není možné.

    - Národní knihovna požaduje umístění metadat POUZE do hlavní stránky zdroje, tj. pouze 1x. Jedná se o vložení několika řádku textu do html hlavní stránky zdroje (viz obrázek v textu). Nemůže být tedy řeč o 3GB navíc.

    - na co je projekt dobrý, když máme JSTOR atd.? Když odhlídneme od toho, že JSTOR apod. mají naprosto jiný cíl, může se stát (ačkoliv to nikomu nepřejeme), že např. stránky glosy.info za 10 nebo 15 let zmizí z nějakého důvodu z internetu, vydavatel projekt uzavře, zkrachuje, nebo cokoliv podobného. Tím pádem kompletní stránky zmizí pro veřejnost. OVŠEM, pokud budou glosy.info ve WebArchivu.cz, pak kdokoliv bude mít možnost tyto stránky vidět a prohlížet právě z tohoto archivu přesně ve stejné podobě v jaké existovaly, než z nějakého důvodu nenávratně zmizely. Což se za výhodu a přínos dá považovat.

    - ve WebArchivu takové již neexistující zdroje uloženy jsou

    - ano, projekt je určen pro další generace, ale je třeba ho začít plnit již dnes, zdroje totiž z webu mizí každým dnem, později až legislativa umožní tohle vše beze smlouvy, nemusí žádné glosy.info existovat

    s pozdravem za Národní knihovnu Jan Hutař
DigiZone.cz: Nejnovější špičkové TV ve videu

Nejnovější špičkové TV ve videu

Podnikatel.cz: V říjnu se rozšíří režim reverse-charge

V říjnu se rozšíří režim reverse-charge

Vitalia.cz: dTest odhalil ten nejlepší kečup

dTest odhalil ten nejlepší kečup

Podnikatel.cz: Letáky? Lidi zuří, ale ony stále fungují

Letáky? Lidi zuří, ale ony stále fungují

DigiZone.cz: Samsung EVO-S: novinka pro Skylink

Samsung EVO-S: novinka pro Skylink

Vitalia.cz: Když všichni seli řepku, on vsadil na dýně

Když všichni seli řepku, on vsadil na dýně

Podnikatel.cz: Byla finanční manažerka, teď cvičí jógu

Byla finanční manažerka, teď cvičí jógu

Lupa.cz: Další Češi si nechali vložit do těla čip

Další Češi si nechali vložit do těla čip

120na80.cz: Co je padesátkrát sladší než cukr?

Co je padesátkrát sladší než cukr?

DigiZone.cz: Na jaká videa se vlastně díváme

Na jaká videa se vlastně díváme

Lupa.cz: Jak se prodává firma za miliardu?

Jak se prodává firma za miliardu?

DigiZone.cz: Digi2GO: výborný základ, ale...

Digi2GO: výborný základ, ale...

Vitalia.cz: Tohle jsou nejlepší česká piva podle odborníků

Tohle jsou nejlepší česká piva podle odborníků

Podnikatel.cz: EET pro e-shopy? Postavené na hlavu

EET pro e-shopy? Postavené na hlavu

Vitalia.cz: Tahák, jak vyzrát nad zápachem z úst

Tahák, jak vyzrát nad zápachem z úst

Podnikatel.cz: Znáte už 5 novinek k #EET

Znáte už 5 novinek k #EET

120na80.cz: Hrbatá prsa aneb mýty o implantátech

Hrbatá prsa aneb mýty o implantátech

DigiZone.cz: LG OLED65E6: první pohled

LG OLED65E6: první pohled

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

120na80.cz: Na různou rýmu různá homeopatie

Na různou rýmu různá homeopatie