Je videt, ze o tom moc nevite (coz neni az tak ku podivu, vzhledem k tomu ze SGML standart se spatne hleda).
HTML ma entity ktery jsou v XML taky. Pokud jim nerozumite, je to vas problem. Navic, nevalidujici parser XML se nemusi o nejae entity vubec starat.
Chtel bych vas videt, jak parsujete nektere v html validni obraty jako </>, H<sub/2/O nebo neukoncene parove znacky, u kterych musite zjistit, kde vlastne konci.