DKPro TC est une source ouverte et entièrement gratuit cadre de classification de texte écrit dans le langage de programmation Java, sur la base du cadre UIMA Apache, et construit sur le dessus de la machine Weka Trousse d'apprentissage, DKPro Core et DKPro Lab. Il est spécialement conçu pour atténuer la machine supervisé des expériences d'apprentissage qui implique tout type de données textuelles.
DKPro TC dispose d'un exemple de code-Fetting commencé qui peut être utilisé pour les collections de texte standard, comme la Reuters-21578 texte Catégorisation corpus, en Groovy et Java; de nombreux extracteurs de caractéristiques génériques, tels que POS-tags et n-grammes; fonctionnalité pratique de l'optimisation des paramètres; des rapports détaillés, en soutenant de nombreuses mesures de performance standard; soutien à la classification des documents par paire; . appui à étiquette unique et la classification multi-étiquette
Exigences :
- Java 2 Standard Edition Runtime Environment
Commentaires non trouvées