
Wikimedia Česká republika ve spolupráci s Národní knihovnou ČR ve formě otevřených dat (pod licencí CC-0) zveřejňují přes tři čtvrtě milionu záznamů významných osob. Čerpá se z báze národních jmenných autorit provozované Národní knihovnou.
Data jsou propojena (linked) a během podzimu roku 2019 byly systematicky propojovány záznamy na Wikidatech se záznamy od knihovny. Podařilo se spárovat zhruba 25 tisíc záznamů.
„Provozovat dvě obrovské paralelní databáze a nenavázat mezi nimi spojení je marněním času i peněz všech zúčastněných. Když je spolu naučíme komunikovat, mohou z toho těžit obě – pro Wikidata se jedná o cenný pramen informací o osobách a jejich datech a místech narození, pro bázi národních autorit může přijít vhod například snadné automatické odkazování na různé autorské databáze, jako je ORCID nebo ISNI, či rozšířené informace týkající se příbuzenských a pracovních vztahů mezi osobami,“ popisuje Wikimedia na svém blogu. Vojtěch Dostál tam také popisuje další detaily.
Tuzemská Wikimedia představila ještě jednu novinku. Tým z Matfyzu vyvinul nástroj, pomocí kterého je možné automaticky převádět data z veřejných databází do Wikidat. Jde o modul Wikibase Loader pro LinkedPipes ETL.
„Umožňuje naprogramovat kompletní sadu kroků, které je potřeba udělat mezi načtením dat z téměř jakékoliv výchozí databáze a finálním importem do Wikidat. Jednou za čas se spustí robot, který podle těchto instrukcí zkontroluje, zda nastaly nějaké změny ve výchozí databázi, a pokud ano, patřičně aktualizuje Wikidata. Série instrukcí může být klidně i poměrně složitá, jak je vidět z obrázku – robotům je to jedno,“ rozvádí se více na blogu.