Détails logiciels:
Version: 0.13.0 Mise à jour
Date de transfert: 10 Dec 15
Licence: Gratuit
Popularité: 71
A pipeline est une concaténation des opérations pour exécuter une tâche spécifique, agencé de sorte que la sortie de chaque élément est l'entrée de la suivante.
Apache Crunch fournit une méthode plus facile de traiter avec Hadoop pipelines MapReduce.
Crunch simplifie ce processus en fournissant un grand nombre de méthodes et de fonctions prêtes à l'emploi qui peuvent être utilisés pour assembler et manipuler pipelines MapReduce sous diverses formes.
Le projet comprend une API Java natif, avec un un Scala (nommé Scrunch).
Le soutien est en outre inclus pour manipulation Avro dossiers et Hbase lignes et de colonnes.
Commentaires non trouvées