Criando Sequências

Seq(data, alphabet)

O projeto Biopython tem como tema central a análise de seqüências, sejam elas de DNA ou proteínas. No projeto, as seqüências não são apenas strings convencionais; na verdade são tratadas com um novo tipo. Esse tipo é definido em um classe denominada "Seq" (em Bio/Seq.py).
A classe Seq tem os seguintes atributos:

data
como o nome indica, armazena a seqüência própriamente dita. É uma string convencional, e, portanto, imutável.
alphabet
É um objeto que identifica quais caracteres compoem essa string e como ela deve ser interpretada, isto é, se é uma seqüência protéica, de DNA ou RNA; além, indica que tipo de codificação está usando. Os "alfabetos" atualmente disponíveis estão no modulo Bio/Alphabet.

Exemplo:

>>> from Bio.Seq import Seq
>>> from Bio.Alphabet import IUPAC
>>> sequencia = Seq("ATGGCAGTCAAGTACGTTG", IUPAC.unambiguous_dna)
>>> print sequencia
Seq('ATGGCAGTCAAGTACGTTG', IUPACUnambiguousDNA())
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License