Belle projet de soupe est un analyseur Python HTML / XML conçue pour les projets d'exécution rapides comme l'écran-grattage. Trois caractéristiques en font puissante:
Belle soupe ne sera pas étouffer si vous lui donnez une mauvaise balisage. Il donne un arbre d'analyse qui fait environ autant de sens que le document original. Ce est généralement assez bon pour recueillir les données dont vous avez besoin et de se enfuir.
Belle soupe fournit quelques méthodes simples et idiomes pythonique pour la navigation, la recherche et la modification d'un arbre d'analyse: une boîte à outils pour disséquer un document et l'extraction de ce que vous avez besoin. Vous ne avez pas à créer un parseur personnalisé pour chaque application.
Beautiful Soup convertit automatiquement les documents entrants vers Unicode et documents sortants à UTF-8. Vous ne avez pas à penser codages, à moins que le document ne précise pas un codage et Beautiful Soup ne pouvez pas détecter automatiquement une. Il vous suffit de spécifier l'encodage d'origine.
Beautiful Soup analyse tout ce que vous lui donnez, et fait les choses arbre de traversée pour vous. Vous pouvez lui dire "Trouvez tous les liens", ou "Trouver tous les liens de ExternalLink de classe", ou "Retrouvez tous les liens dont les urls correspondre" foo.com »ou« Trouver la tête de la table qui a obtenu le texte en gras, puis donnez moi ce texte. "
Des données précieuses qui était autrefois enfermé dans des sites Web mal conçus est désormais à votre portée. . Projets qui aurait pris des heures prennent que quelques minutes avec Beautiful Soup
Exigences :
- Python
Commentaires non trouvées