Předně, není nic jako "XML pro účely webových stránek", existuje pouze jedno XML. Zkuste se podívat třeba na tento fragment http://www.w3.org/TR/2006/REC-xml-20060816/#sec-entexpand a řekněte upřímně, máte chuť na něco takového psát parser? A vůbec - rozumíte tomu? Já s tím mám hodně velké problémy, abych pochopil, která bije.
HTML tohle neumí a proto jej parsovat je ve srovnání s XML skutečně brnkačka.