Mpalign3 Carregando Dados

Atualmente o MPAlign 3 só tem rotinas para ler e gravar seqüências nos formatos Fasta e Nexus. Caso necessite carregar outros formatos, por enquanto, o mais recomendado é utilizar-se do I/O do Biopython.

Entretanto, caso você tenha um arquivo chamado sequencias.fas com o seguinte conteúdo:

>Seq1
ATCGGCGTCCATG
>Seq2
ATCGCTGTCCAGC
>Seq3
AGCGCTGTCCAGT
>Seq4
ATCGCTGTAATCG

Você pode carrega-lo da seguinte maneira:

>>> from mpalign3 import SeqIO
>>> seqs = SeqIO.fasta.load_data("sequencias.fas")
>>> print seqs
[['Seq1', 'ATCGGCGTCCATG'], ['Seq2', 'ATCGCTGTCCAGC'], ['Seq3', 'AGCGCTGTCCAGT'], ['Seq4', 'ATCGCTGTAATCG']]
>>> for seq in seqs:
...     print "Nome da seqüência: ", seq[0]
...     print "Seqüência: ", seq[1]
... 
Nome da seqüência:  Seq1
Seqüência:  ATCGGCGTCCATG
Nome da seqüência:  Seq2
Seqüência:  ATCGCTGTCCAGC
Nome da seqüência:  Seq3
Seqüência:  AGCGCTGTCCAGT
Nome da seqüência:  Seq4
Seqüência:  ATCGCTGTAATCG
>>> seqs[1][0]
'Seq2'
>>> seqs[1][1]
'ATCGCTGTCCAGC'

Como você pode ver, SeqIO.fasta.load_data, retorna uma lista. Cada item da lista é uma outra lista de estrutura lista[0], lista[1] contendo respectivamente o nome e sua seqüência.

Caso seu arquivo estivesse no formato nexus com o nome sequencias.nex, bastaria, ao invés de usar SeqIO.fasta.load_data, usar SeqIO.nexus.load_data. As seqüências seriam disponibilizadas da mesma maneira.

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License