Podle studie “Europe’s Languages in the Digital Age” je většina méně používaných jazyků na Internetu ohrožena vyhynutím. Zmiňovány jsou jazyky jako islandština, maltština, litevština, lotyština, které mají tak málo těch co těmito jazyky mluví, že nemohou na Internetu zanechávat výraznější stopu.
Experti dospěli k závěru, že jednadvaceti z třiceti jazyků se dostává přinejlepším rudimentární, spíše však vůbec žádné podpory jazykových technologií.
A tím pádem mají také online příliš málo příkladů, aby bylo možné poskytnout data pro překladové stroje a technologie. Studie ale upozorňuje, že i podstatně rozšířenější jazyky (nizozemština, francouzština, němčina, italština i španělština) mají problém – jejich podpora je pouze průměrná (ve srovnání s angličtinou), pokud se na vše díváte právě z pohledu podkladů potřebných pro technologie umožňující překlady, ale třeba i převody mezi textem a mluveným slovem.
Studie upozorňuje na to, že u méně rozšířených jazyků selhávají strojové překlady jazyků typicky na nedostatečném objemu „vzorků“ – použití statistické metody strojového překladu je na nich závislé.
V případě českého jazyka můžeme být v souvislosti s
podporou jazykových technologií mírně optimističtí.
V České republice je fungující jazykově-technologická
výzkumná komunita, která má poměrně dlouhou tradici
a byla v minulosti podpořena různými výzkumnými
programy. Pro češtinu byla vytvořena řada zdrojů a
technologií. Ve srovnání s prostředky a nástroji pro
angličtinu je však rozsah zdrojů a nástrojů stále velmi
omezený a kvalitou a množstvím stále ještě nedostačující
pro vývoj technologií potřebných pro podporu skutečně
mnohojazyčné společnosti založené na znalostech.
Pokud vás zajímá co studie říká o češtině, můžete to najít v The Czech Language in the Digital Age / Čeština v digitálním věku (a osobně k tomu dodám, že je to hodně zajímavé čtení).