Názor k článku
Život s krvelačným X
Michal Kubeček (neregistrovaný)
8. 3. 2007 13:50
Re: BOM a UTF-8
celé vlákno
BOM se začal používat proto, aby bylo možné rozlišit UTF-16LE od UTF-16BE, takže je-li první znak souboru BOM (tedy nedělitelná mezera nulové délky nebo co to bylo původně), lze ho označit za UTF-16 a ten, kdo ho načítá, hned ví, zda je zbytek souboru little endian nebo big endian UTF-16. Před dalším zpracováním by ale měl tento znak vynechat, takže veškerá práce už by měla probíhat bez něj. UTF-8 je ale na endianitě nezávislé, takže neexistuje žádné UTF-8LE a UTF-8BE, ale jen jedno jediné UTF-8, a proto je nesmysl při ukládání v UTF-8 přidávat nějakou značku navíc.