Hlavní navigace

Čekají nás adresy Jan.Žižka@trocnov.cz?

26. 4. 2007
Doba čtení: 4 minuty

Sdílet

 Autor: 29
Po internacionalizaci doménových jmen IETF uvažuje o zavedení národních abeced také do adres pro elektronickou poštu. Jsem asi málo obrozenec, ale nenacházím pro tyto snahy přílišné nadšení.

Příslušné specifikace připravuje pracovní skupina Email Address Internationali­zation (EAI) a zdá se, že DNS bylo proti poště procházkou růžovým sadem. Stručně připomenu, že internacionali­zovaná doménová jména (IDN) jsou realizována tak, aby jádro DNS zůstalo beze změny. Inteligence je pouze na koncích, kdy DNS klient převede doménu obsahující znaky národní abecedy na standardizovaný tvar využívající jen ASCII a ten pak použije k řešení dotazu. Díky tomu není nutné měnit servery ani protokoly. Změna se týká jen DNS klientů, čili poměrně malé (a jednoduché) části celého systému.

Podobný přístup použilo kdysi MIME k obohacení obsahu elektronické pošty – je implementováno v poštovních klientech, kteří dopisy zakódují/rozkódují do standardní podoby, takže celý přepravní systém pošty mohl zůstat beze změn. O to překvapivější je, že internacionalizace adres elektronické pošty nejde touto cestou, ale směřuje k přímému zavedení kódování UTF-8 do hlaviček a přepravních mechanismů. To má ovšem celou řadu dopadů a vynutí si úpravy na několika místech:

  • rozšíření SMTP pro přenos dopisů, které umožní používání UTF-8 v jejich obálkách (je označováno jako UTF8SMTP)
  • použití UTF-8 v hlavičkách elektronických dopisů
  • odpovídající rozšíření protokolů pro vzdálený přístup ke schránce (IMAP, POP)
  • metody pro „downgrade“ dopisu, pokud je třeba jej doručit systému nepodporujícímu potřebná rozšíření
  • změny v provozních mechanismech, jako jsou zprávy o doručení, chybové zprávy a podobně

Nemohu se ubránit pocitu, že se jedná o příliš mnoho změn vyvolaných celkem malichernou příčinou. Autoři návrhu sami uznávají, že již současný formát adresy umožňuje do ní vložit ledacos, včetně jména v národním jazyce. Třeba adresa

=?ISO-8859-2?Q?Brouk_Pytl=EDk?= <brouk.pytlik@kdes.cz>

zařídí, že v poštovním programu se bude dotyčný zobrazovat jako „Brouk Pytlík“, ovšem pošta se doručí na jeho skutečnou adresu, v tomto případě brouk.pytlik@kdes­.cz. Autorům vadí, že skutečné jméno zde má roli komentáře a formálně vlastně není součástí adresy. A že prý v jazycích, jejichž zápis nevychází z latinky, působí nepřirozeně. Připadá mi to jako fundamentalismus.

U spousty dopisů jejich odesilatelé adresu příjemce ani neuvidí – většina korespondence vzniká jako odpovědi na cizí dopisy nebo píšeme ustáleným komunikačním partnerům, jejichž adresy máme v adresáři. Také když kliknete na poštovní odkaz na WWW stránce (schéma mailto:), nemusíte koncovou adresu nijak řešit. Budete s ní konfrontováni jen v případech, kdy ji lovíte z paměti nebo opisujete z propagačního materiálu, vizitky či jiného nepočítačového zdroje.

V takovém případě ovšem s jejím zápisem v UTF-8 budou mít fatální problém všichni uživatelé Internetu mimo daný jazykový okruh, čili většina. Špatně si představuji, jak bych psal do hlavičky dopisu adresu v čínštině či arabštině. Takže buď odesilatel poskytne i alternativní ASCII adresu, nebo mu řada uživatelů prostě nebude schopna napsat. Přitom právě babylon v adresách přispěl k neúspěchu „báječného“ poštovního standardu X.400 (tam se jednalo o několik různých formátů).

Můžete namítnout, že v současném stavu mají podobné problémy Číňané, Arabové a další se zápisem adres v latince. To je sice pravda, ale existuje několik podstatných rozdílů:

BRAND24

  • Latinka je jednoduchá. Člověk si při zápisu adresy vystačí s 26 písmeny, 10 číslicemi, tečkou, pomlčkou a zavináčem.
  • ASCII zápis představuje jednotnou platformu, pro všechny společnou. Při zavedení národních abeced budeme potenciálně zkoumat N různých jazyků.
  • Latinka do cizojazyčných prostředí tak jako tak proniká a z celé řady důvodů ji zdejší uživatelé na počítači potřebují a dovedou jí psát. Viz třeba stránku uživatelské podpory japonského Canonu, kde si člověk neznalý japonštiny moc nepočte, ale názvy modelů jsou latinkou.

A když se od pragmatických otázek vrátíme k podstatě věci, je třeba konstatovat, že adresa pro elektronickou poštu není vlastní jméno, ale identifikátor pro přenosový systém. Identifikátory mívají technická omezení a pokud vadí, obcházejí se technickými prostředky na jejich ukládání, vyhledávání a používání (adresáře apod.). Nevidím důvod, proč zrovna po tomto identifikátoru chtít, aby se skutečnému jménu co nejvíce blížil. Paradoxně existuje jiný proud, který razí pravý opak. Prohlašuje, že univerzálním člověčím identifikátorem do budoucna bude telefonní číslo a že všechny kontaktní informace o dotyčném získáme z DNS prostřednictvím E­NUM.

Sečteno a podtrženo: jsem přesvědčen, že případné zavedení UTF-8 do adres elektronické pošty bude změnou spíše k horšímu a nadělá víc škody než užitku. Vůbec mě nebude mrzet, když se plán skupiny EAI – vypracovat experimentální specifikace, ověřit jejich použitelnost na vzorových implementacích a v případě úspěchu pokračovat vzhůru k internetovým standardům – nepodaří naplnit.

Chtěli byste adresu s diakritikou?

  • Ano.
    6 %
  • Ne.
    90 %
  • Nepřemýšlel(a) jsem o tom.
    4 %

Byl pro vás článek přínosný?

Autor článku

Autor dělá nepořádek v příslovích, protože sítě nejen dělá, ale i učí a dokonce také řídí. Působí na Ústavu nových technologií a aplikované informatiky na Technické univerzitě v Liberci. Píše knihy.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).