Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názor k článku
Život s krvelačným X

Michal Kubeček
Michal Kubeček (neregistrovaný)
8. 3. 2007 13:50

Re: BOM a UTF-8

celé vlákno
BOM se začal používat proto, aby bylo možné rozlišit UTF-16LE od UTF-16BE, takže je-li první znak souboru BOM (tedy nedělitelná mezera nulové délky nebo co to bylo původně), lze ho označit za UTF-16 a ten, kdo ho načítá, hned ví, zda je zbytek souboru little endian nebo big endian UTF-16. Před dalším zpracováním by ale měl tento znak vynechat, takže veškerá práce už by měla probíhat bez něj. UTF-8 je ale na endianitě nezávislé, takže neexistuje žádné UTF-8LE a UTF-8BE, ale jen jedno jediné UTF-8, a proto je nesmysl při ukládání v UTF-8 přidávat nějakou značku navíc.