由于之前的课题遗留了一些数据没有进行分析。
今天来尝试一下所学,首先搜索
然后得到如下链接:2016年的时候曾老师已经发过贴了。
http://www.biotrainee.com/thread-131-1-1.html
找到如下一系列相关功能网站:
1 JasPar http://jaspardev.genereg.net/
2 MotifMap http://motifmap.ics.uci.edu/
3 TRANSFAC Matrix models
http://www.gene-regulation.com/pub/databases.html
4 UniPROBE http://the_brain.bwh.harvard.edu/uniprobe/browse.php
5 Human Protein-DNA Interactome(hPDI) http://bioinfo.wilmer.jhu.edu/PDI/FAQ.html
6 Factorbook http://v1.factorbook.org/mediawi ... lcome_to_factorbook
7 DBD - TF prediction db http://www.transcriptionfactor.org/index.cgi?Home
8 HOCOMOCO http://hocomoco.autosome.ru/
9 一个转录因子相关数据库列表:
http://meme-suite.org/db/motifs
Jaspar has motifs, not binding sites. These are short sequences of DNA that are known to attract transcription factor binding. You can use the motifs to predict where in the genome transcription factors might bind, however there is not necessarily experimental evidence that the transcription factor ever does.
Because of the random cutting step in ChIP-seq (fragments around 200bp), binding sites will be much larger than motifs (even though the region occupied by the transcription factor may not be much bigger than the motif).
Enrichr
http://amp.pharm.mssm.edu/Enrichr/
有了上述背景知识就好办了,现在我有一个123个候选转录因子列表(核蛋白IP后质谱得到141个蛋白,初筛去掉一些明显的混杂因子),再去和已知的转录因子列表做一个map,估计能缩小后续验证范围了。
想像很美好,但是我打开这个MEME之后发现并不是这样的情况啊。我需要先学习一下这个网站怎么使用。(太复杂不知道怎么用)
然后同学推荐用另一个在线工具g:pProfiler,这个在线工具糅合了ID转换和功能富集分析大杂烩,网速还可以的情况下适合使用,批量导出图片和数据还是比较快的,看起来功能还不错的样子。
然后将之前获核蛋白IP的list放进去得到如下结果:
这种图的解读可以找到官方手册来看,但是具体的生物学意义就比较复杂了,我还没完全搞懂。
我得到的是 UniProt ID号,然后放在这里123个蛋白号做基因转换后得到128个基因号
这种情况下该怎么改进?我想要找到真正的转录因子,最好是把motif一起展示出来,然后功能直接或间接抑制RCAN1-4的表达的。总不能一个一个去NCBI里面搜索吧。
有没有相关的工具的推荐,谢谢。