Hlavní navigace

Wikimedia ČR a Národní knihovna uvolňují 750 tisíc záznamů o osobách

Sdílet

Jan Sedlák

Wikimedia Česká republika ve spolupráci s Národní knihovnou ČR ve formě otevřených dat (pod licencí CC-0) zveřejňují přes tři čtvrtě milionu záznamů významných osob. Čerpá se z báze národních jmenných autorit provozované Národní knihovnou.

Data jsou propojena (linked) a během podzimu roku 2019 byly systematicky propojovány záznamy na Wikidatech se záznamy od knihovny. Podařilo se spárovat zhruba 25 tisíc záznamů.

„Provozovat dvě obrovské paralelní databáze a nenavázat mezi nimi spojení je marněním času i peněz všech zúčastněných. Když je spolu naučíme komunikovat, mohou z toho těžit obě – pro Wikidata se jedná o cenný pramen informací o osobách a jejich datech a místech narození, pro bázi národních autorit může přijít vhod například snadné automatické odkazování na různé autorské databáze, jako je ORCID nebo ISNI, či rozšířené informace týkající se příbuzenských a pracovních vztahů mezi osobami,“ popisuje Wikimedia na svém blogu. Vojtěch Dostál tam také popisuje další detaily.

Tuzemská Wikimedia představila ještě jednu novinku. Tým z Matfyzu vyvinul nástroj, pomocí kterého je možné automaticky převádět data z veřejných databází do Wikidat. Jde o modul Wikibase Loader pro LinkedPipes ETL.

„Umožňuje naprogramovat kompletní sadu kroků, které je potřeba udělat mezi načtením dat z téměř jakékoliv výchozí databáze a finálním importem do Wikidat. Jednou za čas se spustí robot, který podle těchto instrukcí zkontroluje, zda nastaly nějaké změny ve výchozí databázi, a pokud ano, patřičně aktualizuje Wikidata. Série instrukcí může být klidně i poměrně složitá, jak je vidět z obrázku – robotům je to jedno,“ rozvádí se více na blogu.

Našli jste v článku chybu?
Ochrana proti spamovacím robotům. Odpovězte prosím na následující otázku: Jaký je letos rok?

Žádné názory