MetagenomeDB est une bibliothèque Python conçu pour stocker facilement, d'extraire et d'annoter les séquences métagénomiques & nbsp;. MetagenomeDB agir comme une couche d'abstraction au-dessus d'une base de données MongoDB. Il fournit une API pour créer et modifier et de connecter deux types d'objets, à savoir des séquences et des collections:
& Nbsp; * séquences (classe Sequence) peut être lit, contigs, clones PCR, etc.
& Nbsp; * collections (classe Collection) représente ensembles de séquences; par exemple, lectures résultant du séquençage d'un échantillon, contigs assemblés à partir d'un ensemble de lectures, bibliothèque PCR
Tout objet peut être annoté en utilisant une syntaxe similaire à un dictionnaire:
# Abord, nous importons la bibliothèque
importation MetagenomeDB que mdb
# Puis nous créons un nouvel objet de séquence avec deux
# Propriétés (obligatoires), 'nom' et 'séquence'
s = mdb.Sequence ({"name": "Mon séquence", "séquence": "ATGC"})
# L'objet peut maintenant être annotée
[«longueur»] de impression
s ["type"] = "lus"
# Une fois modifiée, l'objet doivent être commis
# À la base de données pour que les modifications restent
s.commit ()
Les objets de type séquence ou Collection peuvent être connectés les uns aux autres afin de représenter divers ensembles de données métagénomiques. Des exemples comprennent, mais ne sont pas limités à:
& Nbsp; * collection de lit résultant d'une course de séquençage (relation entre la séquence plusieurs objets et une Collection)
& Nbsp; * ensemble de contigs résultant de l'assemblage d'un ensemble de lit (relation entre deux objets de collection)
& Nbsp; * lit qui font partie d'un contig (relation entre la séquence plusieurs objets et une séquence)
& Nbsp; * séquence qui est similaire à une autre séquence (relation entre deux objets Sequence)
& Nbsp; * collection qui fait partie d'une plus grande collection (relation entre deux objets de collection)
Le résultat est un réseau de séquences et de collection, qui peut être exploré en utilisant des méthodes dédiées; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Chacune de ces méthodes permettent de filtres sophistiqués utilisant la syntaxe interrogation MongoDB:
# Liste toutes les collections de type 'collection_of_reads'
# 'S' de la séquence appartiennent à
= s.list_collections collections ({"type": "collection_of_reads"})
# Liste toutes les séquences qui appartiennent également à ces collections
# D'une longueur d'au moins 50 pb
C dans des collections:
& Nbsp; c.list_sequences d'impression ({"longueur": {"$ gt": 50}})
MetagenomeDB fournit également un ensemble d'outils de ligne de commande pour importer des séquences de nucléotides, les séquences de protéines, de souffle et de sortie des algorithmes d'alignement FASTA, et les fichiers d'assemblage de l'ECA. . D'autres outils sont fournis pour ajouter ou supprimer plusieurs objets, ou de les annoter
Exigences :
- Python
Commentaires non trouvées