Coden

DNA to Protein 时, 不同的生物可能会使用不同的 Coden Table, 可至 NCBI 相关 assembly(?) 的页面搜索关键词 'Coden'

此外,数据库的序列中会出现除了ATCG之外的字符,其对应如下:

    degenerate_dict = {
        'A':'A',
        'T':'T',
        'C':'C',
        'G':'G',
        'R':'AG',
        'Y':'CT',
        'M':'AC',
        'K':'GT',
        'S':'GC',
        'W':'AT',
        'H':'ATC',
        'B':'GTC',
        'V':'GAC',
        'D':'GAT',
        'N':'ATCG'
    }

另外,氨基酸简写对照:

    {'VAL':'V', 'ILE':'I', 'LEU':'L', 'GLU':'E', 'GLN':'Q',
     'ASP':'D', 'ASN':'N', 'HIS':'H', 'TRP':'W', 'PHE':'F', 
     'TYR':'Y', 'ARG':'R', 'LYS':'K', 'SER':'S', 'THR':'T', 
     'MET':'M', 'ALA':'A', 'GLY':'G', 'PRO':'P', 'CYS':'C', 
     'Asx':'B', 'Glx':'Z', 'Xle':'J', 'Xaa':'X', 'Unk':'X'
     }

其中:

{
    'B':'DN',
    'Z':'EQ',
    'J':'LI',
    'X':'*',
    '*':'*'
}