Il suit la spécification originale officielle WHATWG HTML5.
L'analyseur est conçu pour gérer toutes les saveurs de HTML et analyse des documents non valides en utilisant des règles de gestion des erreurs bien définies compatibles avec le comportement des principaux navigateurs Web de bureau.
La sortie est palced à l'intérieur d'une structure arborescente.
Il prend en charge la sortie de ElementTree, DOM et formats d'arbres lxml ainsi que d'un format personnalisé simple.
HTML5Lib est emballé avec distutils.
HTML5Lib est également disponible en:
Ruby - télécharger HTML5Lib pour Ruby ici .
Python - télécharger HTML5Lib pour Python ici .
PHP - télécharger HTML5Lib pour PHP ici
Ce qui est nouveau dans cette version:
- Parsis. documents HTML valides et non valides à un arbre
- Soutien à minidom, ElementTree (y compris cElementTree et lxml.etree), BeautifulSoup (obsolète) et les formats de sortie simpletree personnalisé
- DOM convertisseur SAX
- Rapports erreurs d'analyse
- détection de codage de caractères
- Filtrage et sérialisation des arbres
- HTML + CSS désinfectant
- Beaucoup de tests unitaires
Commentaires non trouvées