Názory k článku
Národní knihovna zpřístupnila část archivu českého Internetu
Posledni obrazek
celé vláknoRe: Posledni obrazek
celé vláknoRe: Posledni obrazek
celé vláknoNaproti tomu stacilo zminit, ze NK chce po vydavatelich krome souhlasu take umisteni relevantnich metadat.
V prezentovane podobe se mi to jevi nesmyslnym.
Re: Posledni obrazek
celé vláknohttp://www.webarchiv.cz/cgi-bin/dc_cz.pl
Re: Posledni obrazek
celé vláknoZ pohledu vydavatele
celé vláknoJsem jeden z těch "kontaktovaných subjektů", které na nabídku Národní knihovny neodpověděly. Pokusím se nastínit, proč.
Když jsem pro tehdy vznikající projekt Glosy.info žádal o přidělení ISSN, zaškrtl jsem souhlas s archivací média v digitálním archivu.
O několik týdnů později jsem obdržel e-mail, z nějž jsem vyrozuměl, že bych měl vytisknout smlouvu, vyplnit, podepsat a odnést na poštu a přidat do stránek metadata Dublin Core. Mám tedy obětovat svůj čas vyřizováním smlouvy a přidat na stránku cca 3 GB necachovatelných dat ročně (počítáno pro menší projekt se 100 000 PV měsíčně, velikost metadat 2,5 kB) výměnou za účast na "projektu, který nebudeme potřebovat dnes a možná ani za deset let, ale jehož výsledky snad ocení další generace" (jak jej popisuje ředitel Národní knihovny Vlastimil Ježek)?
Jinak řečeno: Nechápu, na co je webarchiv.cz dobrý. Na rešerše určitě ne, používají se zavedené akademické archivy (JSTOR, Proquest..) nebo pro laické hledání Google a pod. Návštěvnost nám také nepřinese. A jestli je určen pro další generace, ušetřím si tedy námahu, kterou bych nyní musel vynaložit, protože než další generace doroste, legislativa určitě umožní archivovat elektronické zdroje bez smlouvy s vydavateli.
Re: Z pohledu vydavatele
celé vlákno- Vytištění smlouvy, přečtení a její vyplnění včetně podpisu zabere max. 30 minut. Vyplnění spočívá v uvedení adresy vydavatele, data a podpisu. Otázkou zůstává investice do poštovného a samotný výlet na poštu. Národní knihovna by uvítala možnost souhlasu např. emailem, ovšem v rámci současné legislativy (autorský zákon) to není možné.
- Národní knihovna požaduje umístění metadat POUZE do hlavní stránky zdroje, tj. pouze 1x. Jedná se o vložení několika řádku textu do html hlavní stránky zdroje (viz obrázek v textu). Nemůže být tedy řeč o 3GB navíc.
- na co je projekt dobrý, když máme JSTOR atd.? Když odhlídneme od toho, že JSTOR apod. mají naprosto jiný cíl, může se stát (ačkoliv to nikomu nepřejeme), že např. stránky glosy.info za 10 nebo 15 let zmizí z nějakého důvodu z internetu, vydavatel projekt uzavře, zkrachuje, nebo cokoliv podobného. Tím pádem kompletní stránky zmizí pro veřejnost. OVŠEM, pokud budou glosy.info ve WebArchivu.cz, pak kdokoliv bude mít možnost tyto stránky vidět a prohlížet právě z tohoto archivu přesně ve stejné podobě v jaké existovaly, než z nějakého důvodu nenávratně zmizely. Což se za výhodu a přínos dá považovat.
- ve WebArchivu takové již neexistující zdroje uloženy jsou
- ano, projekt je určen pro další generace, ale je třeba ho začít plnit již dnes, zdroje totiž z webu mizí každým dnem, později až legislativa umožní tohle vše beze smlouvy, nemusí žádné glosy.info existovat
s pozdravem za Národní knihovnu Jan Hutař
Re: Z pohledu vydavatele
celé vláknoRe: Z pohledu vydavatele
celé vláknoRe: Z pohledu vydavatele
celé vláknodoufal jsem, že se ozve někdo kompetentní a zareaguje na můj příspěvek. Děkuji Vám, že jste některé záležitosti ujasnil.
1. Otázka nutné smlouvy je podivná, ale to ani jeden z nás neovlivní.
2. To, že je DC metadata nutné vložit pouze na hlavní stránku, je samozřejmě dobrá zpráva, možná by nebylo špatné upravit formulace přímo na Vašich stránkách, kde píšete "NK ČR vytvoří k Vašemu zdroji metadata, která si vložíte do html kódu Vašeho zdroje". Ani ve smlouvě (bod II/5, resp.příloha č.2) to není jasněji definováno (píše se tam, že metadata je nutno vložit do "hlavičky zdroje", čímž chápu HTML hlavičky všech stránek).
Přesto mi dovolte tu nejdůležitější otázku:
3. Proč se mi jako vydavateli vyplatí uzavřít smlouvu s Webarchivem.cz, když Internet Archive Wayback Machine též archivuje stránky? Výhodu bych viděl ve spojení Webarchivu s katalogem NK ČR, o kterém koneckonců píšete i na svých stránkách. Nepodařilo se mi však v online katalogu NK dohledat nic jiného, než anotaci zdroje (konkrétně Ikaros). Konkrétní články nejsou dohledatelné, nebo byla chyba na mé straně?
Děkuji za odpovědi.
Re: Z pohledu vydavatele
celé vláknodekuji na upozorneni, je asi opravdu treba formulaci na nasem webu zmenit.
K otazce c.3 - v soucasne dobe jsou zaznamy spolupracujicich zdroju v samostatne bazi WEB, viz http://sigma.nkp.cz/F. Soucasti baze NKC, coz je katalog Narodni knihovny, bude behem 14 dni - od noveho roku (ceka se na nasazeni nove verze systemu Aleph).Dojde tedy k vnoreni baze WEB do NKC.
Internet Archive opravdu archivuje spoustu ceskych stranek, ovsem sam uznate, ze pokud maji zaber na cely svetovy web, tak jim spousta veci utece. WebArchiv zajima jen domena .cz a ma tak vetsi sanci uspet a uchovat ji ve vetsim zaberu. Navic IA je soukroma neziskova spolecnost, tj. jeji kontinuita nemusi byt zarucena.
s pozdravem Jan Hutar, NK ČR
Re: Z pohledu vydavatele
celé vláknoProč není uzákoněna povinnost vydavatele, aby jednou za rok poslal celou svou databázi (článků, diskusí, atd) Národní knihovně a ta by to po zbytek roku nějak zpracovávala... Měla by sice surová data, ale zcela kompletní.
Váš současný přístup mi přijde jak kdyby místo povinných výtisků novin, časopisů a knih (doufám že toto stále existuje!) vyběhli jednou za rok pracovníci knihovny do trafik a knihkupectví, z každého výtisku který najdou vyškubli náhodně čtyři stránky a pak to v knihovně ve sklepě syslili. Jaký by pak měli obraz současného světa pro budoucí generace? Naprosto zmatený a zcela neúplný.
Re: Z pohledu vydavatele
celé vláknoRe: Z pohledu vydavatele
celé vláknoRe: Z pohledu vydavatele
celé vláknomate pravdu, prirovnani je presne. Ovsem je nutno si uvedomit, ze projekt je ve svem pocatku. Tj. sklizi se max. 2x rocne, a to do hloubky 25-50 odkazu. U zdroju, na ktere mame smlouvu se pocita zatim se 4 skliznemi za rok. U zpravodajskych serveru je stale problem, ovsem v budoucnu se pocita s castejsi sklizni. Robot je schopny poznat a sklidit pouze "nove" veci, takze nestahuje tuny balastu okolo.
Proc neni uzakonena povinnost vydavatele? To co popisujete se nazyva Povinny vytisk, ktery funguje ve vsech civilizovanych zemich (vcetne ČR) pro vse papirove (knihy a periodika). Ovsem v soucasnych zakonech o povinnem vytisku nejsou zmineny elektronicke online zdroje, kterych pribyva. Proto dochazi ke zmenam techto zakonu (Dansko,Novy Zeland, Island,Velka Britanie, pripravuje se mj. Francie). Pokud by se provedla zmena i v ceskych zakonech o PV, bylo by to skvele. Zatim bohuzel neni.
Jan Hutar, NK ČR