Vlákno názorů k článku ČR: Přístupnost konečně pod zákonem od David Špinar - Nejsem lingvista (takže jsem dále uvedené příklady určitě...

  • Článek je starý, nové názory již nelze přidávat.
  • 4. 3. 2004 8:53

    David Špinar (neregistrovaný)

    Nejsem lingvista (takže jsem dále uvedené příklady určitě děsivě zkomolil), ale domnívám se, že v uvedených případech jde o slova převzatá, která už lze považovat za součást češtiny.

    Ani já nejsem lingvista a netuším, o jakou specifickou "třídu" slov tady jde. Jenom vím, že toto pravidlo je zde uvedeno především proto, že je třeba sdělit hlasové čtečce, jak má dané slovo přečíst. A pak je jedno, jestli je slovo software přejaté, nebo ne. Hlasová čtečka ho musí přečíst jako softvér, a nikoliv software.

    A protože tvůrce www stránek nemusí vědět, jestli toto slovo už existuje i v české verzi hlasových čteček (to by třeba mohl vědět pan Pavlíček ze SONS), měl by jej adekvátně označit.

    Ale jak jsem řekl, pro české prostředí bych toto pravidlo rozhodně nezařadil do priority 1 a souhlasím se SONSem, že ho do BFW zařadili až do priority 3.

  • 4. 3. 2004 3:52

    Václav Dvořák (neregistrovaný)
    Cituji článek:
    """Příkladem je třeba zásada, která patří do priority 1 a která přikazuje označovat všechny změny jazyka textu oproti jazyku dokumentu (pravidlo 4.1). Nedokáži si představit, že by někdo musel označovat všechna často používaná cizí slova, jako je software nebo design pomocí syntaxe. Počet takových slov je pak v češtině radikálně vyšší než v angličtině."""

    Nejsem lingvista (takže jsem dále uvedené příklady určitě děsivě zkomolil), ale domnívám se, že v uvedených případech jde o slova převzatá, která už lze považovat za součást češtiny. Takový doslovný výklad by byl docela absurdní, a to i v angličtině. To by pak v anglických textech museli tagovat třeba <span lang="latina, má-li ISO kód ;-)">etc. (et cetera), e.g. (exempli gratia), i.e. (id est), virus</span>, <span lang="fr?">vis-á-vis</span>, <span lang="gr">democra</span>cy ;-))), možná i třeba vlastní jméno <span lang="fr">France</span> :-) a určitě tisíce jiných převzatých slov, které mě zrovna nenapadají, protože přebírání z cizích slov se samozřejmě děje ve všech jazycích, jenže v těch menšinových, jako je čeština, je to jaksi zjevnější.

    Z praktičtějšího hlediska si myslím, že při tagování jazyků jde hlavně o to, aby bylo možné dejme tomu používat jiný font pro určitý jazyk, hypoteticky vyvolat strojový překlad, ale zejména asi přepnout řečový syntetizér do správného jazyka. A funkční TTS systém si s výslovností běžně užívaných slov musí poradit, byť by danému jazyku byly původně sebecizejší.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).