1,人类所有基因蛋白序列下载
数据库地址:https://www.uniprot.org/tool-dashboard
1)进入网页,拉到最低端,点击“Proteins (UniProtKB)”
选择展示形式,个人喜欢table
2)选定物种和子库(Swiss-Prot是校准过的库)
3)选择需要下载的信息
选择好后点“save”
4)选择下载格式
可以通过预览看看格式和内容是不是你要的:
确定后点击“download”
至此人类所有蛋白序列下载完成。其实除了蛋白序列外能下载的注释信息还挺多,根据需要进行下载吧~
2,获取gene name、uniprotID、ensmbleID间对应关系
你关注的基因列表可能是gene name,可能是uniprotID,可能是ensmbleID。。。。那么接下来你可能需要获取ID间的对应关系或者进行ID转换。推荐一个在线转换ID的工具gprofiler。
工具地址:https://biit.cs.ut.ee/gprofiler/convert
1)进入网页
键入基因列表,选择物种和目标数据库:
结果:
导出即可。