ID Mapper
将不同数据库的注释结果对应起来
| -- | 常用对应关系 | -- |
|---|---|---|
| GENE_INFO | EntrezID转一切 | *.gz |
| idmapping.tb.gz | 很多数据库 | .gz |
| accession2taxid | Accession/Taxid/GI | .gz |
| filtered_goa_uniprot_all.gaf.gz | GO/GI/其refDB... | latest-->annotations-->.gz |
| ID Mapping | UniProtKB/GI | 在线 |
| bioDBnet | GI/KEGG/EC/... | 在线 |
| g:Profiler | Ensemble | 在线,部分物种 |
org.xx.eg.db + select() |
ENTREZID/ENSEMBL/SYMBOL | R:AnnotationDbi |
org.xx.eg.db + bitr() |
ENTREZID/ENSEMBL/SYMBOL | R:clusterProfiler |
getBM() |
Ensemble:Gene/Transcript | R:biomaRt |
| GO Cross-references | GO/... | -- |
| ID | 说明 | 示例 |
|---|---|---|
| Taxid | NCBI Taxonomy 所用ID | 1 root |
| Ensemble ID | ENS[SPE][X][11 number].[V] |
ENSP00000339754.1 P=Protein |
| GI Number | GenBank 核苷酸序列的序列标识号,Accession的不同版本会有不同GI号 | GI: 2462602239 RNF180 |
| RefSeq Accession Number | refseq,nt,nr,(非冗余+人工review) | GenBank: XM_054352456.1 RNF180 |
| Entrez ID | 也称Gene ID;不同物种同源基因对应不同Entrez ID;而对于同一Entrez ID,不同Assembly可对应不同RefSeq Accession | GeneID: 285671 RNF180 |
| Gene Symbol | 基因通用名称,或在Entrez ID前添加LOC前缀作为Symbol | TP53 |
| UniProt Accession Number | 提交记录,一个Entry可能对应多个Accession | A2BC19,P56559 |
| GO terms | -- | GO:0005829 |
其它参考:
- 将GEO里的探针转换为基因Symbol
- HGNC:对人类 Gene Symbol/Name 进行命名,有对应的 HGNC ID;也提供 Entrez ID 与 Gene Symbol 的转换(R:babelgene)
- Entrez: esearch, efetch 和elink 转换ID