Elektronická pošta byla znárodněna

Postupné pronikání národních abeced do internetových identifikátorů pokračuje. Po DNS následují adresy, hlavičky a přepravní mechanismy elektronické pošty, pro něž byla nedávno standardizována možnost použití UTF-8.

Tato aktivita není nijak nová, poprvé jsme o ní informovali v článku Čekají nás adresy Jan.Žižka@troc­nov.cz? před pěti lety. Od té doby snahy skupiny Email Address Internationali­zation prošly fází experimentálních specifikací (RFC 4952 a spol.) až po únorové vydání nové sady RFC. Tyto dokumenty na rozdíl od svých experimentálních předchůdců jsou na cestě k internetovému standardu. Jedná se o následující čtveřici:

  • RFC 6530 – popis architektury celého systému
  • RFC 6531 – rozšíření SMTP pro přepravu dopisů s UTF-8 v adresách a hlavičkách
  • RFC 6532 – rozšíření hlaviček elektronických do­pisů
  • RFC 6533 – UTF-8 v provozních hlášeních elektronické pošty

Jak jsem psal už v předchozím článku, přístup k řešení problému se výrazně liší od předchozích standardů umožňujících používání dříve zapovězených znaků. Jak MIME (národní znaky v obsahu dopisů), tak IDN (národní znaky v doménových jménech) převádějí na klientské straně národní znaky do zakódované podoby, která vyhovuje původním omezením. Přepravní systém a protokoly v těchto případech zůstávají beze změny, pouze je doplňuje chytrý klient zajišťující konverzi problémových znaků mezi nativní a přepravní podobou.

Národní znaky v poštovních hlavičkách naproti tomu počítají s rekonstrukcí celé přepravní infrastruktury. Žádné konverze se neprovádějí, v hlavičkách se používá nativní UTF-8 a přenos probíhá osmibitově. Nejvýznamnější novinky zavedené výše zmiňovanými specifikacemi jsou zhruba následující:

  • V poštovní adrese bude možné používat národní znaky v kódování UTF-8, a to jak na místě domény (tam to umožňuje IDN), tak v uživatelském jméně. Čili avizovaná adresa Jan.Žižka@troc­nov.cz se může stát skutečností. Tyto znaky mohou být součástí hlaviček elektronického dopisu i jeho obálky, kterou vytváří SMTP.

  • Dochází k rozšíření protokolu SMTP tak, aby umožňoval přepravu dopisů s UTF-8 v adresách. Rozšířená verze je označována jako SMTPUTF8 a komunikující strany se při zahájení konverzace informují, zda rozšíření podporují. U konkrétního přenášeného dopisu je pak vždy uvedeno, zda vyžaduje SMTPUTF8 nebo ne. Pro „obohacené“ dopisy specifikace zavádí nový MIME typ message/global. Program podporující SMTPUTF8 musí zároveň podporovat IDN a 8BITMIME, aby dokázal zpracovat národní znaky v doménových jménech a přenášet dopisy osmibitově.

  • Použití UTF-8 je doplněno i do servisních hlášení o doručení dopisů či přenosových problémech a chybách.

  • Zatím chybí rozšíření protokolů pro přístup k poštovní schránce. Pro IMAP s podporou UTF-8 existuje starší experimentální RFC 5738, na jehož mírné úpravě se pracuje (draft-ietf-eai-5738bis). Kromě práce s dopisy obsahujícími v hlavičkách národní znaky umožní jejich používání i v uživatelských jménech a heslech pro přístup ke schránce.

Přirozeně se nabízí otázka, jak budou prvky podporující STMPUTF8 spolupracovat se staršími účastníky poštovního provozu, kteří UTF-8 v adresách a hlavičkách nepodporují. Původní návrh počítal s úpravou (downgradem) dopisu, pokud je třeba předat jej prvku, který v hlavičkách akceptuje jen sedmibitové ASCII. Nakonec se ale autoři přiklonili k názoru, že měnit dopisy během přenosu není dobrý nápad. Jejich výsledný přístup je jednoduchý – dopis bude odmítnut.

Existují jemné doplňky tohoto principu. Pokud odpor klade hned první transportní program na cestě, může se odesílající poštovní klient pokusit dopis upravit, případně ze svého adresáře vylovit alternativní čistě ASCII adresu, aby SMTPUTF8 nebylo potřeba. Později v řetězci pak předávající server může zkusit oslovit jiný SMTP server pro daného příjemce, ovšem jen pokud má nějaké nadstandardní informace o dané situaci. Je totiž doporučeno, aby servery přijímající poštu pro určenou doménu (uvedené pro ni v DNS záznamech typu MX) byly z hlediska SMTPUTF8 konzistentní: Buď by nový standard měly podporovat všechny, nebo žádný.

Poznamenejme, že používání SMTPUTF8 je daleko volnější než třeba IDN. Jména domén podléhají politice příslušných správců. Pokud by pan Žižka chtěl mít doménu žižka.cz, nemůže, dokud CZ.NIC nepovolí IDN v doméně cz. Nikdo mu ale nezabrání ve vytvoření poštovní adresy Jan.Žižka@troc­nov.cz, pokud poštovní systém pro trocnov.cz bude podporovat SMTPUTF8. Toto rozhodnutí závisí čistě na lokálních správcích (a dostupnosti příslušných programů, samozřejmě).

Úplně jinou otázkou pak je, kolik transportních agentů bude ochotno převzít dopis s touto adresou odesilatele. Dnes nejspíš málo, ale dá se očekávat, že jejich počet rychle poroste – podpora SMTPUTF8 zní jako docela lákavý bod do seznamu vlastností poštovního programu, takže bych očekával poměrně rychlou reakci ze strany vývojářů.

UX16

V předchozím článku jsem dal najevo určité nenadšení z pronikání UTF-8 do adres, protože prostě nedokážu napsat adresu v arabštině nebo čínštině, pokud bych ji měl opisovat třeba z vizitky. Přístup autorů znárodněné pošty myslím charakterizuje tento citát z RFC 6530:

we need to build a fully internationalized email environment, focusing on permitting efficient communication among those who share a language and writing system

Tedy hlavní důraz kladou na usnadnění komunikace mezi uživateli pocházejícími ze stejnojazyčného prostředí. Už se tam ovšem nepíše, že cenou bude určité ztížení vzájemné komunikace mezi různojazyčnými uživateli. Pokud by Zikmund chtěl poslat na Jan.Žižka@troc­nov.cz nějaké to „Fstejte se, nyc se fam nestane!“, bude mít problém nejen s tím, že Žižka se nikdy nevzdává, ale bude muset nejprve vyřešit, jak na své německé či maďarské klávesnici napsat „ž“.

54 názorů Vstoupit do diskuse
poslední názor přidán 22. 4. 2012 11:32
Zasílat nově přidané názory e-mailem

Školení Google Analytics

  •  
    Jak vyhodnocovat úspěšnost reklamních kampaní.
  • Jak ovládat Google Analytics a najít co potřebuji.
  • Jak měřit hodnotu objednávek z webu.

Detailní informace o školení Google Analytics »