Názory k článku
Národní knihovna zpřístupnila část archivu českého Internetu

Michal Krsek aura:59
7. 12. 2005 8:21 Nový

Posledni obrazek

celé vlákno
Ma nejaky jiny vyznam nez ukazat ctenarum, jak do HTML kodu nastrkat Dublic core elementy? I to by melo vyznam (mnohem vetsi nez ruzne snahy o cisty web), jenze by to muselo byt trosku vysvetleno :-)
Jan Kálal
7. 12. 2005 17:37 Nový

Re: Posledni obrazek

celé vlákno
Význam posledního obrázku je ukázat čtenářům Lupy, co chce po vydavatelích Národní knihovna. Máte pravdu, že se jedná a elementy Dublin core, které NK pro popis webů určených na archivaci používá. Smylsem článku bylo informovat o WebArchivu jako takovém, technické detaily řešení zbydou možná do jiného textu.
Michal Krsek aura:59
7. 12. 2005 21:39 Nový

Re: Posledni obrazek

celé vlákno
Hm, mozna, ze jsem ten clanek cetl HODNE nepozorne, ale nejak jsem z kontextu nevyrozumel, ze je to neco, co po vydavatelich chce Narodni knihovna.
Naproti tomu stacilo zminit, ze NK chce po vydavatelich krome souhlasu take umisteni relevantnich metadat.
V prezentovane podobe se mi to jevi nesmyslnym.
Adam Brokeš
Adam Brokeš (neregistrovaný)
7. 12. 2005 18:54 Nový

Re: Posledni obrazek

celé vlákno
Pokud Vás zajímají přesné postupy, jak implementovat Dublin Core metadata, mohu Vás odkázat na relevantní odkazy: http://www.ics.muni.cz/dublin_core/
http://www.webarchiv.cz/cgi-bin/dc_cz.pl
Michal Krsek aura:59
7. 12. 2005 21:39 Nový

Re: Posledni obrazek

celé vlákno
Verte, ze presne postupy, jak implementovat DC do webu jsem slysel (a cetl) nekolikrat. Naposledy v cervnu na zkousce Dokumentograficke informacni systemy - vytahl si to clovek prede mnou :-)
MS
MS (neregistrovaný)
7. 12. 2005 19:22 Nový

Z pohledu vydavatele

celé vlákno

Jsem jeden z těch "kontaktovaných subjektů", které na nabídku Národní knihovny neodpověděly. Pokusím se nastínit, proč.

Když jsem pro tehdy vznikající projekt Glosy.info žádal o přidělení ISSN, zaškrtl jsem souhlas s archivací média v digitálním archivu.

O několik týdnů později jsem obdržel e-mail, z nějž jsem vyrozuměl, že bych měl vytisknout smlouvu, vyplnit, podepsat a odnést na poštu a přidat do stránek metadata Dublin Core. Mám tedy obětovat svůj čas vyřizováním smlouvy a přidat na stránku cca 3 GB necachovatelných dat ročně (počítáno pro menší projekt se 100 000 PV měsíčně, velikost metadat 2,5 kB) výměnou za účast na "projektu, který nebudeme potřebovat dnes a možná ani za deset let, ale jehož výsledky snad ocení další generace" (jak jej popisuje ředitel Národní knihovny Vlastimil Ježek)?

Jinak řečeno: Nechápu, na co je webarchiv.cz dobrý. Na rešerše určitě ne, používají se zavedené akademické archivy (JSTOR, Proquest..) nebo pro laické hledání Google a pod. Návštěvnost nám také nepřinese. A jestli je určen pro další generace, ušetřím si tedy námahu, kterou bych nyní musel vynaložit, protože než další generace doroste, legislativa určitě umožní archivovat elektronické zdroje bez smlouvy s vydavateli.

Jan Hutař
Jan Hutař (neregistrovaný)
8. 12. 2005 13:49 Nový

Re: Z pohledu vydavatele

celé vlákno
Je jistě poutavé přečíst si názor z druhé strany, ovšem názor obsahuje několik zavádějících nepřesností. Tady je několik komentářů a upřesnění

- Vytištění smlouvy, přečtení a její vyplnění včetně podpisu zabere max. 30 minut. Vyplnění spočívá v uvedení adresy vydavatele, data a podpisu. Otázkou zůstává investice do poštovného a samotný výlet na poštu. Národní knihovna by uvítala možnost souhlasu např. emailem, ovšem v rámci současné legislativy (autorský zákon) to není možné.

- Národní knihovna požaduje umístění metadat POUZE do hlavní stránky zdroje, tj. pouze 1x. Jedná se o vložení několika řádku textu do html hlavní stránky zdroje (viz obrázek v textu). Nemůže být tedy řeč o 3GB navíc.

- na co je projekt dobrý, když máme JSTOR atd.? Když odhlídneme od toho, že JSTOR apod. mají naprosto jiný cíl, může se stát (ačkoliv to nikomu nepřejeme), že např. stránky glosy.info za 10 nebo 15 let zmizí z nějakého důvodu z internetu, vydavatel projekt uzavře, zkrachuje, nebo cokoliv podobného. Tím pádem kompletní stránky zmizí pro veřejnost. OVŠEM, pokud budou glosy.info ve WebArchivu.cz, pak kdokoliv bude mít možnost tyto stránky vidět a prohlížet právě z tohoto archivu přesně ve stejné podobě v jaké existovaly, než z nějakého důvodu nenávratně zmizely. Což se za výhodu a přínos dá považovat.

- ve WebArchivu takové již neexistující zdroje uloženy jsou

- ano, projekt je určen pro další generace, ale je třeba ho začít plnit již dnes, zdroje totiž z webu mizí každým dnem, později až legislativa umožní tohle vše beze smlouvy, nemusí žádné glosy.info existovat

s pozdravem za Národní knihovnu Jan Hutař
Pavel Janoušek aura:41

Re: Z pohledu vydavatele

celé vlákno
Cim to je, ze s podobnymi vecmi The WayBackMachine www.webarchive.org nema problemy - nebo chcete rici, ze podnikaji nelegalne a to za bohateho prispeni akademicke sfery?
Jan Hutař
Jan Hutař (neregistrovaný)
13. 12. 2005 13:46 Nový

Re: Z pohledu vydavatele

celé vlákno
bohuzel Vas musim zklamat, je to presne jak rikate. Internet Archive a jeho Wayback machine vyviji svoji cinnost bez toho aby se starali o autorska prava. Ovsem s tim, ze pokud vydavatel pozada o vyrazeni z jejich archivu, je jeho zdroj vyrazen. Zastupci Internet Archive se tim netaji a na konferencich (naposledy ve Vidni v zari 2005) lze tuto skutecnost bezne slyset. O vyrazeni pritom pozadalo zatim opravdu minimum vydavatelu.
MS
MS (neregistrovaný)
8. 12. 2005 14:52 Nový

Re: Z pohledu vydavatele

celé vlákno
Vážený pane Hutaři,
doufal jsem, že se ozve někdo kompetentní a zareaguje na můj příspěvek. Děkuji Vám, že jste některé záležitosti ujasnil.
1. Otázka nutné smlouvy je podivná, ale to ani jeden z nás neovlivní.
2. To, že je DC metadata nutné vložit pouze na hlavní stránku, je samozřejmě dobrá zpráva, možná by nebylo špatné upravit formulace přímo na Vašich stránkách, kde píšete "NK ČR vytvoří k Vašemu zdroji metadata, která si vložíte do html kódu Vašeho zdroje". Ani ve smlouvě (bod II/5, resp.příloha č.2) to není jasněji definováno (píše se tam, že metadata je nutno vložit do "hlavičky zdroje", čímž chápu HTML hlavičky všech stránek).

Přesto mi dovolte tu nejdůležitější otázku:
3. Proč se mi jako vydavateli vyplatí uzavřít smlouvu s Webarchivem.cz, když Internet Archive Wayback Machine též archivuje stránky? Výhodu bych viděl ve spojení Webarchivu s katalogem NK ČR, o kterém koneckonců píšete i na svých stránkách. Nepodařilo se mi však v online katalogu NK dohledat nic jiného, než anotaci zdroje (konkrétně Ikaros). Konkrétní články nejsou dohledatelné, nebo byla chyba na mé straně?

Děkuji za odpovědi.
Jan Hutař
Jan Hutař (neregistrovaný)
13. 12. 2005 14:03 Nový

Re: Z pohledu vydavatele

celé vlákno
dobry den,
dekuji na upozorneni, je asi opravdu treba formulaci na nasem webu zmenit.
K otazce c.3 - v soucasne dobe jsou zaznamy spolupracujicich zdroju v samostatne bazi WEB, viz http://sigma.nkp.cz/F. Soucasti baze NKC, coz je katalog Narodni knihovny, bude behem 14 dni - od noveho roku (ceka se na nasazeni nove verze systemu Aleph).Dojde tedy k vnoreni baze WEB do NKC.
Internet Archive opravdu archivuje spoustu ceskych stranek, ovsem sam uznate, ze pokud maji zaber na cely svetovy web, tak jim spousta veci utece. WebArchiv zajima jen domena .cz a ma tak vetsi sanci uspet a uchovat ji ve vetsim zaberu. Navic IA je soukroma neziskova spolecnost, tj. jeji kontinuita nemusi byt zarucena.
s pozdravem Jan Hutar, NK ČR
Martin Helon aura:37

Re: Z pohledu vydavatele

celé vlákno
Stejně mi to přijde jako pitomost. Proč prolítávat weby nějakým robotem jednou za rok s úrovní zanoření nula nula nic? Kolik pak budete mít třeba z idnes.cz nebo kteréhokoliv webu, který vydává tři nové články denně? Navíc s každou informací robot stahuje ještě tuny balastu kolem.

Proč není uzákoněna povinnost vydavatele, aby jednou za rok poslal celou svou databázi (článků, diskusí, atd) Národní knihovně a ta by to po zbytek roku nějak zpracovávala... Měla by sice surová data, ale zcela kompletní.

Váš současný přístup mi přijde jak kdyby místo povinných výtisků novin, časopisů a knih (doufám že toto stále existuje!) vyběhli jednou za rok pracovníci knihovny do trafik a knihkupectví, z každého výtisku který najdou vyškubli náhodně čtyři stránky a pak to v knihovně ve sklepě syslili. Jaký by pak měli obraz současného světa pro budoucí generace? Naprosto zmatený a zcela neúplný.
Pizi
Pizi (neregistrovaný)
9. 12. 2005 13:08 Nový

Re: Z pohledu vydavatele

celé vlákno
Proc neni uzakonena, protoze to je zasah do svobody vydavatele. Nechapu proc takova povinnost. Jakym pravem? Nevidim nic zadouciho na tom snazit se vydavani cehokoliv ztizit.
J
J (neregistrovaný)
9. 12. 2005 15:24 Nový

Re: Z pohledu vydavatele

celé vlákno
Teba proto, ze podobna povinost existuje pro papirove vydavatele. Cokoli u nas vydate, musite od toho dodat tzv. povine vytisky knihovnam. Ti plati jak pro knihy, tak pro noviny a casopisy.
Jan Hutař
Jan Hutař (neregistrovaný)
13. 12. 2005 15:12 Nový

Re: Z pohledu vydavatele

celé vlákno
dobry den,
mate pravdu, prirovnani je presne. Ovsem je nutno si uvedomit, ze projekt je ve svem pocatku. Tj. sklizi se max. 2x rocne, a to do hloubky 25-50 odkazu. U zdroju, na ktere mame smlouvu se pocita zatim se 4 skliznemi za rok. U zpravodajskych serveru je stale problem, ovsem v budoucnu se pocita s castejsi sklizni. Robot je schopny poznat a sklidit pouze "nove" veci, takze nestahuje tuny balastu okolo.
Proc neni uzakonena povinnost vydavatele? To co popisujete se nazyva Povinny vytisk, ktery funguje ve vsech civilizovanych zemich (vcetne ČR) pro vse papirove (knihy a periodika). Ovsem v soucasnych zakonech o povinnem vytisku nejsou zmineny elektronicke online zdroje, kterych pribyva. Proto dochazi ke zmenam techto zakonu (Dansko,Novy Zeland, Island,Velka Britanie, pripravuje se mj. Francie). Pokud by se provedla zmena i v ceskych zakonech o PV, bylo by to skvele. Zatim bohuzel neni.
Jan Hutar, NK ČR
vvvghj
vvvghj (neregistrovaný)
13. 3. 2008 17:24 Nový

10

hk.hjhhhjjkůjhhhkj
Zasílat nově přidané příspěvky e-mailem