Cómo crear un documento XML bien formado a partir del HTML de Word

xml
Lo podéis descubrir en este post de Peter Sefton, que se basa en el parser libxml2.