O programa haskell-tagsoup é capaz de fazer parsing e extrair informações de documentos HTML/XML, mesmo que eles estejam mal formados.  