Kdo dneska píše URL z klávesnice?
Hm, no vlastně já... Těch několik málo, jako třeba gmail, nebo ... hmmm, meeebo, hmmm... jo, ještě občas java.sun.com! Ale to bude tak všecko...
Na všechno ostatní klikáme, vyhledáváme podle obsahu (a čínský obsah opravdu hledat nebudu, i když jsem se čínštinu tzkoušet učil, ale neuspěl jsem) nebo je máme v bookmarcích, kam se dostali jak? No přece ze stránek odněkud prokliknutých nebo nalezených!
A že nepoznám meebo.com od meebo.com? (To druhé je jako azbukou tějevo.sot. ;-) S tím mi zase pomůžou SiteAdvisor, Web of Trust apod.
Tož nevyšilujte.
Bojovníci za IDN by měli přestat lidem nalhávat, že doménové jméno je popisný text a je tudíž přirozené mít možnost ten text psát v přirozeném jazyce včetně diakritiky nebo nelatinkové abecedy. Jenže doménové jméno není popisný text, doménové jméno, jakkoli je "přívětivější" než IP adresa, kterou zastupuje, je a pořád zůstává identifikátorem. A identifikátory mají vždy nějaká omezující pravidla, které přesně vymezují, jak smějí vypadat.
Proč nikoho nenapadne bojovat za možnost používání diakritiky ve jménech proměnných jazyka C? Nebo za diakritiku v SPZ, možnost používání nejen číslic v telefonních číslech nebo číslech bankovních účtů? Protože všichni chápou, že by to byl nesmysl a přineslo by to daleko více problémů, než by z toho bylo užitku. A stejně je tomu i u doménových jmen: existují přesná pravidla, jak mají vypadat, a zavádění IDN přináší víc škody než užitku.
Zastánci IDN často argumentují tím, že e-maily už také dávno píšeme s diakritikou, případně v nelatinkových abecedách; tedy aspoň většina z nás. Ano, to je pravda, ale právě tento příklad ve skutečnosti hovoří proti IDN. Když se totiž podíváme na to, kde lze v mailu použít diakritiku nebo nelatinkové abecedy, zjistíme, že to je jednak v těle zprávy (RFC 2045), jednak v hlavičkách (RFC 2047). Tělo zprávy volně odpovídá obsahu webové stránky a tam už se diakritika i nelatinkové abecedy dávno používají. A co v hlavičkách? RFC 2047 naprosto přesně vymezuje, ve kterých hlavičkách a dokonce ve kterých jejich částech můžeme "encoded word" (a tedy diakritiku nebo nelatinkové abecedy) použít. Jsou to logicky pouze ty hlavičky, které nemají z hlediska doručení mailu v podstatě žádný význam - Subject
, Comment
, uživatelsky definované hlavičky a komentáře. Kromě nich už jen From
, To
a Cc
, zde ale pouze v části s "popisným textem", která není adresou a nemá vliv na doručení; dokonce i když to vyplývá z ostatních formulací, RFC 2047 pro jistotu výslovně zakazuje použití encoded word ve specifikaci e-mailové adresy.
Shrnu-li to, v e-mailové komunikaci lze opravdu používat diakritiku a nelatinkové abecedy, ale pouze v těch částech mailu, které jsou "pro lidi"; v servisních částech určených pro doručovací systém nemá co pohledávat. A přesně takhle to funguje i u webu bez IDN. IDN je jen snahou zanášet diakritiku a nelatinkové abecedy tam, kde nepřinášejí užitek, ale jen spoustu problémů.