Alfabetos

Esse é um texto que não pretende cobrir extensamente os alfabetos do Biopython, pelo contrário, pretende simplificá-lo. Portanto, não é rigoroso em sua amplitude, servindo apenas para as situações em que o leitor ficar inseguro quanto ao que se refere determinado alfabeto. Um bom resumo é consultar o seguinte:

  • protein_letters = "ACDEFGHIKLMNPQRSTVWY"
  • extended_protein_letters = "ACDEFGHIKLMNPQRSTVWYBXZ"
  • ambiguous_dna_letters = "GATCRYWSMKHBVDN"
  • unambiguous_dna_letters = "GATC"
  • ambiguous_rna_letters = "GAUCRYWSMKHBVDN"
  • unambiguous_rna_letters = "GAUC"

Por exemplo, o alfabeto IUPAC.unambiguous_dna_letters é a codificação das seqüências que só usam as letras "G", "A", "T", "C". Já o alfabeto ambiguous_dna_letters, é a codificação daquelas seqüências com a codificação degenerada, que usam as seguintes letras:"G", "A", "T", "C", "R", "Y", "W", "S", "M", "K", "H", "B", "V", "D", "N".

>>> from Bio.Alphabet import IUPAC
>>> dir(IUPAC)
['Alphabet', 'ExtendedIUPACDNA', 'ExtendedIUPACProtein', 'IUPACAmbiguousDNA', 'IUPACAmbiguousRNA', 'IUPACData', 'IUPACProtein', 'IUPACUnambiguousDNA', 'IUPACUnambiguousRNA', '__builtins__', '__doc__', '__file__', '__name__', '_bootstrap', 'ambiguous_dna', 'ambiguous_rna', 'default_manager', 'extended_dna', 'extended_protein', 'protein', 'unambiguous_dna', 'unambiguous_rna']
>>> print IUPAC.ambiguous_dna.letters
GATCRYWSMKHBVDN
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License