Hlavní navigace

Politici se hesla o sobě snaží měnit pořád, říká wikipedista Vojtěch Dostál

Autor: Jan Vaca
Jan Vaca

Českou Wikipedii tvoří až šest set aktivních editorů, oproti anglické verzi se nám počet přispěvatelů daří držet, říká v rozhovoru Vojtěch Dostál, předseda rady spolku Wikimedia.

Doba čtení: 13 minut

Začněme u čísel. Česká Wikipedie byla spuštěna v květnu 2002. Kolik má nyní po šestnácti letech fungování hesel?

Něco přes 410 tisíc článků.

Dokážete to přepočítat na objem dat?

S ilustracemi a fotografiemi to jsou určitě terabajty, samotný text by se ale zatím vešel na CD, má asi 680 MB. Anglická Wikipedie má asi 15 GB.

Kolik lidí na české Wikipedii něco hledá?

Měsíčně je to v průměru asi 50 milionů zobrazení, někdy je i 80 milionů zobrazení. Což není málo.

Kolik lidí nyní českou Wikipedii tvoří?

To se dá stanovit poměrně složitě. Lidí, kteří měsíčně hrábnou aspoň trošku do české Wikipedie, je asi pět tisíc. Lidí, kteří udělají alespoň pět editací měsíčně, je kolem pěti, šesti set. A těch hodně aktivních, kteří nastavují pravidla, mění strukturu článků a podobně, je kolem 80 až 100 měsíčně. Z evropských jazyků jsme na tom po skandinávských zemích skoro nejlépe (interaktivní grafiku, jak jsou aktivní editoři v jednotlivých zemích, najdete zde – pozn. redakce).

Vojtěch Dostál
Na české Wikipedii je aktivní od roku 2007. Předsedou rady spolku Wikimedia je od rok 2015. V současné době je studentem doktorského studia na Přírodovědecké fakultě Univerzity Karlovy. Věnuje se vývojové a buněčné biologii.

Ty aktivní znáte všechny osobně?

Ne, to ne. Osobně jich znám asi polovinu.

Lze i tak říct, kdo českou Wikipedii tvoří?

Takový ten stereotypní pohled je, že to jsou mladí muži, ajťáci kolem 25 let. To je ale pravda jen z poloviny. Máme i spoustu žen, máme teenagery i důchodce. Máme tam různé profese – humanitní i technicky zaměřené. Často to jsou lidé, kteří rádi píšou, musí to být nadneseně trošku grafomani. Rádi se hrabou v informacích a dělí se o to, co vědí nebo umí zjistit. Zrovna to nás spojuje asi nejvíc.

Je to více, nebo méně než v minulosti?

Struktura skupiny tvůrců se dlouho už relativně nemění, jen se to postupně rozšířilo právě o lidi z netechnických oborů. Na začátku o Wikipedii věděli hlavně ajťáci z open source světa. Co se týče počtu editorů, tak ten je na české Wikipedii stabilní. Byli bychom sice rádi, kdyby se to zvyšovalo, ale moc se to nedaří. Oproti anglicky psané Wikipedii jsme ale na tom ještě dobře, tam naopak bohužel počet těch hodně aktivních přispěvatelů klesá.

Máte pro to nějaké vysvětlení? Nemůže to být třeba pocitem, že je Wikipedie už přežitá?

To je první věc, která každého napadne. Já bych to ale neřekl. Myslím, že je spousta cest, kudy se Wikipedie může vydat a překvapit. Pokles počtu přispěvatelů může souviset podle mě spíš s pocitem, že je Wikipedie už kompletní. Hlavně u anglické verze už není moc výzev, který by nové wikipedisty motivovaly, aby začali psát. Napsat nový článek na anglické Wikipedii už vyžaduje opravdu odbornou znalost v nějaké úzké oblasti, třeba nějaké vědecké. Běžné oblasti jsou ale už zpracované. Samozřejmě těch důvodů bude asi víc, bohužel je neznáme, jinak by s tím šlo něco dělat.

Co se na české Wikipedii hledá nejčastěji?

Publikujeme každý měsíc seznam nejvíc hledaných článků. V čase se to proměňuje, ale hodně zájem reaguje na nějaké aktuální události. Často se to týká států, kde se něco zrovna děje, nebo osobností, které získaly nějakou novou funkci nebo zemřely. Pak jsou mezi články stálice typu Česko, Václav Havel a Václav Klaus.

Máte detailnější informace o čtenářích, třeba odkud jsou?

Zajímalo by nás to, ale ta data nemáme. Wikipedie je obecně opatrná na osobní data. Týká se to těch, kteří ji tvoří, i těch, kdo ji čtou. Data tak téměř nesbíráme, do určité míry jen např. zjišťujeme interakce čtenářů se stránkou, ale vždy v plně anonymizované podobě.

Nesmysly mažeme zhruba každých pět minut

Zmiňoval jste, že těch aktivnějších tvůrců textů je až šest set. Jak se jejich práce kontroluje v době fake news?

U aktivnějších editorů, kteří udělají minimálně pět editací týdně, se to pomalu začíná lámat. Jsou to prostě editoři, které už víceméně známe. A pokud si vybudují reputaci, tak se kontrolují méně, což nám usnadňuje práci. Na druhou stranu uznávám, že pokud by si někdo vybudoval reputaci a pak chtěl vkládat něco závadného, byla by to cesta, jak Wikipedii uškodit. Ale to se moc nestává.

Říkáte, že se to moc nestává. To znamená, že se to už tedy stalo?

Například na anglické Wikipedii se stalo, že jeden editor vytvořil článek o Bicholimském konfliktu, což byla údajně nějaká válka v Indii. Bylo to opatřeno velkým množstvím knižních zdrojů a citací. A až po několika letech se zjistilo, že si to ten člověk kompletně vymyslel, včetně těch citací. Bohužel pokud někdo zdánlivě dodržuje pravidla a chová se, jak má, tak kontrolní mechanismy mohou selhat. Je to ale vzácná věc.

V českém prostředí se nic takového nestalo?

V českém prostředí jsou hoaxy naštěstí velmi rychle odhaleny a odstraněny. Občas se stane, že nějaký nesmysl vydrží o něco déle, ale v tom objemu dat se nám to daří kontrolovat na vysoké úrovni.

Jak ten proces kontroly probíhá?

Naše know-how je takové, že vidíme všechny změny, které v reálném čase probíhají. A je skupina wikipedistů, kteří si sami říkají patroláři, a ti ve dne v noci kontrolují změny. Pokud je tam nějaká chyba, tak mohou změny jedním kliknutím vrátit zpátky. Samozřejmě se zaměřují především na anonymní změny nebo na editace, které náš systém využívající umělou inteligenci vyhodnotí jako chybné.

Jak ten systém funguje?

Má obrovskou databázi editací. Půlka z nich jsou editace, které jsme vyhodnotili jako správné, druhou polovinu tvoří chyby. A systém se snaží hledat podobnost, jestli nová změna má blíž k jedné, nebo druhé skupině.

V minulosti se česká Wikipedie potýkala s přepisováním některých údajů u politiků. Děje se to stále?

Pořád se to děje. Hlavně v předvolebním období se politici snaží vylepšovat své profily, případně to dělají jejich spolupracovníci z PR agentur. Ale lidé z PR agentur vědí, že na to přijdeme a ten politik z toho může mít ostudu.

V jakém smyslu někdo údaje mění?

V lepším případě doplňuje třeba faktografické údaje, které ve článku chybí. Ale často se nám stávalo, že odmazávali informace, které se jim nelíbily. Mazali třeba informace o starších uzavřených kauzách, na které se už pozapomnělo. Ale Wikipedie nemaže informace o událostech, které se staly třeba před pěti lety, jen kvůli tomu, že je to dlouho.

Jak často se mažou příspěvky na české Wikipedii?

K odstraňování konkrétních změn, říká se tomu revertování, dochází velmi často. Řekl bych, že tak každých pět minut. Týká se to hlavně drobných, banálních změn, které jsou ale zároveň chybné. Občas se stane i to, že se revertují mezi sebou dva zkušení wikipedisté, protože tu věc vidí jinak.

Ke smazání celé stránky dochází několikrát denně. Buď jde o vyslovené nesmysly, nebo o články, jejichž téma je vyhodnoceno jako nevýznamné. Někdo napíše třeba článek o nějakém youtuberovi, který se ještě neprosadil, sportovci ze III. ligy nebo o skutečně lokálním politikovi.

Jak je to v případě aktualizací? Prošel jsem si několik hesel a všiml si zastaralých údajů. Jak často se tedy zadaná hesla prochází, případně nepoužíváte nějaké automatické varování, že nějaké heslo nebylo upraveno už dva, tři roky?

Bohužel v tom objemu hesel se nám nepodařilo najít nějaký mechanismus, jak to wikipedistům usnadnit. Zatím se to dělá proto náhodně, kdy některý z editorů najde zastaralé heslo a opraví ho. Pokud je to osoba, která není tak známá, tak se na to přijde samozřejmě později.

Pak jsou specifické údaje, jako třeba počty obyvatel v obcích, které se mění každý rok. Ale tam už naštěstí každý rok nemusíme udělat osm tisíc editací, ale máme data uložená ve speciální databázi, které se říká Wikidata. A z té databáze se to načítá automaticky. Stáhneme si aktuální data z Českého statistického úřadu a změna se pak projeví u všech obcí v Česku.

Hodně se zpřísňuje pohled na autorská práva. Jak řešíte tuhle oblast?

My jsme odjakživa byli na autorská práva opatrní. Komunita editorů je vycvičená, aby kontrolovala možné porušení autorského práva, a týká se to nejen fotografií, ale i textu.

V případě textu probíhá kontrola jak?

Funguje to přes editory, kteří, když se jim zdá nějaký text podezřelý, tak ho jednoduše zkopírují a přes Google zkontrolují, jestli už někde nebyl publikovaný. A podobně to funguje i s fotografiemi. Takhle odhalíme většinu plagiátů, protože to lidé stahují z internetu. A samozřejmě pokud nás na plagiát nebo na porušení autorského práva někdo upozorní, tak to okamžitě řešíme. Například fotky hned při pochybnostech mažeme, případně se snažíme k nim zajistit souhlas autora. Ale nemáme například upload filtry, tak jak to nyní navrhuje Evropská unie. Dost se toho obáváme, protože implementace takového filtru není jednoduchá, a navíc to generuje spoustu chyb.

Vojtěch Dostál, předseda správní rady spolku Wikimedia.
Autor: Jan Vaca

Vojtěch Dostál, předseda rady spolku Wikimedia.

Před třemi roky byla aktuálním tématem svoboda panoramatu. Wikipedie byla v tomto ohledu poměrně aktivní, upozorňovali jste na rizika. Evropský parlament to sice nakonec neschválil, ale lidé to pořád občas řeší. Pro vás to už je uzavřená kapitola?

Bohužel není, pořád je to problém. Sice nedošlo k tomu celoevropskému omezení svobody panoramatu, ale v současné chvíli je na každém státu, aby si pravidla určil po svém. Třeba Belgie, Francie nebo Itálie mají svobodu panoramatu poměrně omezenou a spoustu budov nebo soch z moderní doby, které jsou na veřejném prostranství, tak na francouzské Wikipedii nenajdete. Třeba pyramidu v Louvre nebo noční Eiffelovu věž, protože samotné její nasvícení je autorsky chráněné.

V Česku je to tedy jak?

V Česku není svoboda panoramatu omezena. Navíc to vypadalo, že by vše se mohlo celoevropsky pohnout naším směrem. Běží kampaň za celoevropskou svobodu panoramatu a v Evropském parlamentu se hlasovalo o pozměňovacím návrhu, který by svobodu panoramatu posunul víceméně na českou úroveň. Bohužel návrh nyní neprošel.

Senioři přinášejí do Wikipedie témata, kterým se mladí příliš nevěnují

Procházel jsem vaše výroční zprávy a v té za loňský rok bylo uvedeno, že váš spolek Wikimedia se začíná profesionalizovat. Co to znamená?

Já jen pro vysvětlení zopakuji, že spolek Wikimedia a Wikipedie samotná jsou od sebe oddělené, i když se ty světy samozřejmě prolínají a pomáhají si. Ale komunita Wikipedie je čistě dobrovolnická a chceme to tak nechat. Některé věci na dobrovolnické bázi ale nejde už dělat, proto po celém světě vznikají pobočky Wikimedia, které mají třeba formu spolků nebo občanských sdružení. Tyto spolky mají už zaměstnance, kteří se věnují třeba propagaci Wikipedie nebo fundraisingu. V Česku funguje malý zaměstnanecký tým, který má ředitele a tři projektové manažery.

Co mají přesně na starost?

Zmínil jsem fundraising, ale pro nás jsou důležitější spíš různé projekty sloužící k propagaci Wikipedie. Podporujeme spolupráci na různých vzdělávacích projektech, spolupracujeme s univerzitami. Vyučujeme také seniory, jak psát na Wikipedii. Podporujeme fotografy, kteří pro Wikipedii fotí. A snažíme se podporovat i takzvané power users, tedy ty autory, kteří provádí velké a rozsáhlé změny.

Vy jste zmínil program pro seniory. Jak to probíhá?

My klademe důraz na spolupráci se zavedenými institucemi. Chodíme proto do knihoven a seniorských klubů, kde probíhají přednášky pro ty, kteří už něco o počítačích vědí, nejsou to úplní začátečníci. A ty v rámci šesti lekcích naučíme základy editování Wikipedie. Máme samozřejmě i lekce pro pokročilé.

Kolik tedy těmi kurzy prošlo seniorů?

Už jsou to stovky. Desítky z nich se na Wikipedii uchytily na poměrně dlouho dobu, zůstaly u toho minimálně rok a samy editovaly. Je to pro nás cenné, protože senioři přinášejí často témata, kterým se mladší generace už tolik nevěnují. Mezi seniory máme třeba mineralogy nebo historiky. V propagaci nám pomohl i Jan Sokol, který se stal duchovním otcem programu pro seniory.

Zaměřujete se i na studenty. Vy jste před dvěma roky v jednom z rozhovorů řekl, že učitelé nemají příliš rádi Wikipedii. Změnilo se to?

Pomalu, ale už se to mění. Učitelé dříve upozorňovali na rizika využívání Wikipedie ve výuce, my ale vlastně děláme totéž. Studenti by neměli slepě vzít článek na Wikipedii a udělat si z toho referát. V bakalářce by se také Wikipedie neměla citovat, prostě nejsme zdroj určený k odborným rešerším. Na druhou stranu vidíme obrovský potenciál, kdy studenti, kteří se naučí psát článek na Wikipedii, si tak osvojí řadu dalších dovedností. Třeba gramotnost ve vyhledávání zdrojů nebo schopnost zpracovat téma tak, aby tomu každý rozuměl. Kromě toho programu Studenti píší Wikipedii máme navíc i projekt Uč se s Wiki, který je zaměřený na základní a střední školy. Tam jde víc o využití Wikipedie při výuce. Hodně žáků se s Wikipedií setká, ale neumí ji dobře využívat.

V Česku připadá na 1 milion čtenářů 48 aktivních wikipedistů.
Autor: Wikipedia.org

V Česku připadá na 1 milion čtenářů 48 aktivních wikipedistů.

Ve výroční zprávě zmiňujete ještě projekt nazvaný Wikiměsto, kdy cíleně zmapujete vybrané město. Kolik měst je už takto zpracovaných?

Pokud se nepletu, tak je jich pět. Přibyslav, Hustopeče, Mariánské Lázně, Litovel a naposledy letos Kopřivnice.

Jak to probíhá?

My do vybrané lokality pošleme tým odborníků na různé oblasti, jsou tam samozřejmě i fotografové, kteří zdokumentují všechny objekty, které ještě na Wikipedii nemáme. V týmu jsou i encyklopedisté, kteří ve spolupráci s místními institucemi dávají dohromady texty.

Vrátím se ještě k té stagnaci, o které jste mluvil na začátku. Nemůže být způsobená i tím, že prostředí Wikipedie není uživatelsky úplně příjemné? Rychle se sice vše načítá, ale vzhledem je poměrně zastaralá.

Uznávám, že Wikipedie svým designem uvízla v roce 2001, kdy vznikla. Trochu vypadá jako nějaký archeologický nález, jako takový trilobit internetu. Ale funkce, které jsou uvnitř, se neustále mění a zlepšují se. Přidávají se třeba nové nástroje, které pomáhají editorům odhalovat chyby, jak automaticky hromadně něco měnit a další věci. Vnitřek tak plně odpovídá současným měřítkům. Ale designem jsme opravdu hodně konzervativní, což některé čtenáře odradit může. Na druhou stranu to nestálo nikomu za to, aby si vytvořil mirror Wikipedie, který by zcela legálně využíval naše data a zároveň měl nový design. Vzhled Wikipedie jen navíc svým způsobem naší značkou, která nereaguje na nějaké módní vlny.

Přesto se zeptám, zda na světové úrovni v této oblasti nějaké debaty probíhají…

Občas to na setkáních s kolegy z jiných států zazní. Ale ty změny je velmi těžké prosadit. Zrovna teď probíhá na české Wikipedii debata ohledně změny hlavní stránky. Je to ale velmi složitý proces, který nakonec nemusí dopadnout. A to se jen bavíme o mírném zjednodušení, uhlazení hlavní stránky. Kvůli konzervativitě komunity jsme ale poměrně omezení ve změnách, které by šlo přitom realizovat poměrně snadno. Občas je to bolestivé.

Jaká bude podle vás budoucnost Wikipedie? Kde bude za 20 let?

Je otázka, zda tu ještě Wikipedie bude, případně zda tu nebude existovat něco, co na ni naváže a nahradí ji. Je možné, že se poskytování informací posune tak, že se lidé zeptají umělé inteligence a ta jim plnohodnotně odpoví. Právě proto budujeme i systémy, které využívají umělou inteligenci.

WT100 tip v článku Kabátová

Můžete být konkrétnější?

Máme vlastní interní databázi, která je složená z dat z Wikipedie i dalších veřejných zdrojů. To jsou ta Wikidata, která jsem již zmiňoval. Na tuto databázi jsou navázané nástroje zatím v experimentální bázi, které umožní buď automaticky vybudovat článek podle strukturovaných dat, nebo budou schopny na lidsky položenou otázku dát lidsky formulovanou odpověď. Zeptáte se třeba na místo narození Charlese Darwina a systém vám už dnes (nástroj si můžete vyzkoušet zde) odpoví: „Myslíte pravděpodobné Charlese Darwina, který je autorem evoluční teorie. Ten se narodil tam a tam.“ A vy se zeptáte, kde to je, a systém vám odpoví, že je to ve Velké Británii.

Našli jste v článku chybu?