tapir est un outil de Python qui contient les programmes d'estimer et de tracer informatif phylogénétique des grands ensembles de données.
tapir Citant
Lorsque vous utilisez le tapir, s'il vous plaît citer:
- BC Faircloth, Chang J, Alfaro ME: tapir permet l'analyse à haut débit de informatif phylogénétique.
- Townsend JP: Profilage informatif phylogénétique. Biol systématique. 2007, 56: 222-231.
- Etang SLK, Frost SDW, Muse SV: HYPHY: tests d'hypothèses à l'aide de la phylogénie. Bioinformatics 2005, 21: 676-679.
Installation
Pour le moment, la meilleure façon d'installer le programme est:
git clone git: //github.com/faircloth-lab/tapir.git / path / to / tapir
Pour exécuter des tests:
cd / path / to / tapir /
test de python / test_townsend_code.py
Utiliser
Le code de estimate_p_i.py appelle un fichier batch pour hyphy qui est en templates /. Ce fichier doit être dans la même position par rapport à l'endroit où vous mettez estimate_p_i.py. Si vous installez amincit comme ci-dessus, vous serez très bien, pour le moment.
Courir:
cd / path / to / tapir /
python tapir_compute.py Input_Folder_of_Nexus_Files / Input.tree
& Nbsp; - sortie Output_Directory
& Nbsp; - époques = 32-42,88-98,95-105,164-174
& Nbsp; - fois = 37,93,100,170
& Nbsp; - multitraitement
--multiprocessing est facultative, sans elle, chaque locus sera exécuté consécutivement.
Si vous avez déjà exécuté les résultats ci-dessus et enregistrés dans votre dossier de sortie (voir ci-dessous), vous pouvez utiliser les dossiers site taux pré-existantes plutôt que d'estimer ceux de nouveau avec:
python tapir_compute.py Input_Folder_of_Site_Rate_JSON_Files / Input.tree
& Nbsp; - sortie Output_Directory
& Nbsp; - époques = 32-42,88-98,95-105,164-174
& Nbsp; - fois = 37,93,100,170
& Nbsp; - multitraitement
& Nbsp; - site-taux
Résultats
tapir écrit les résultats à une base de données sqlite dans le répertoire de sortie de votre choix. Ce répertoire contient également des fichiers de taux du site au format JSON pour chaque locus traversé tapir_compute.py.
Vous pouvez accéder aux résultats dans la base de données comme suit. Pour plus d'exemples, y compris traçage, voir la documentation
- Montez sqlite:
& Nbsp; sqlite3 Output_Directory / phylogénétique-informativeness.sqlite
- Obtenir des données intégrales pour toutes les époques:
& Nbsp; sélectionnez locus, intervalle, pi de loci, intervalle où loci.id = interval.id
- Obtenir des données intégrales pour une époque spécifique:
& Nbsp; sélectionnez locus, intervalle, pi de loci, intervalle
& Nbsp; où intervalle = '95 -105 'et loci.id = interval.id;
- Obtenir le nombre de loci ayant max (PI) à différentes époques:
& Nbsp; créer table temporaire max comme select id, max (pi) comme max du groupe intervalle par id;
& Nbsp; créer table temporaire t que de sélectionner interval.id, intervalle, max à partir intervalle, max
& Nbsp; où interval.pi = max.max;
& Nbsp; choisir l'intervalle, count (*) à partir de t groupe par intervalle;
Remerciements
Nous remercions Francesc Lopez-Giraldez et Jeffrey Townsend de nous fournir une copie de leur code source application web. . BCF grâce Hubbell S et P Gowaty
Exigences :
- Python
- SciPy
- NumPy
- DendroPy
- hyphy2 (s'il vous plaît télécharger ou de construire une hyphy2 mono-thread)
Commentaires non trouvées