Apache Nutch 2.3 Mise à jour
Apache Nutch projet est une source ouverte et évolutive des logiciels web crawler, hautement extensible et libre basée sur le Web qui repose sur Apache Lucene (version Java) bibliothèque.Il ajoute spécificités du Web, comme un robot, une base de données...