等了好久的B站TCGA笔记(1-2章)

B站视频地址:https://www.bilibili.com/video/av49363776?from=search&seid=17709076368945641839
特此致谢:生信技能树

101

需要了解的内容:TCGA的研究范围、数据来源、数据格式、数据储存、基本的生物学概念、肿瘤学知识、熟悉使用R语言

R语言教程:https://www.bilibili.com/video/av25643438?from=search&seid=2313097517440657329

102

配套代码:https://github.com/jmzeng1314/tcga_example 也可以把整个github上的代码打包下来(就是考验网速---事实证明:网速卒)

miRNA数据库:http://www.mirbase.org/

miRNA 的命名方式:(引自周凡,庄诗美.《microRNA与肿瘤》, 生命科学, 2008, 20(2):207-212. )

  • (1) miRNA 简写成miR,再根据其被克隆的先后顺序加上阿拉伯数字,如miR-21

  • (2) 高度同源的miRNA 在数字后加上英文小写字母(a、b 、c),如miR-199a 和miR-199b;

  • (3) 由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的miRNA,则在后面加上阿拉伯数字以区分, 如miR-199a-1 和miR-199a-2;

  • (4) 如果一个前体的2 个臂分别加工产生miRNA,则根据克隆实验,在表达水平较低的miRNA 后面加“”,如miR-199a和miR-199a,或进行如下命名,miR-142-5p(也可命名为miR-142-s,表示从5' 端的臂加工而来)和miR-142-3p(也可命名为miR-142-as,表示从3′端的臂加工而来);

  • (5) 将物种缩写置于miRNA 之前,如hsa-miR-195 ;

  • (6) 确定命名规则之前发现的miRNA,如let-7,则保留原来名字。

流程:

  • 下载数据

  • 提取表达矩阵、临床信息

  • 差异分析---count用DEG+limma;micro-reads用limma

  • 把每个结果存成Rdata

  • bach--logrank(去NA、修改变量名称、引入临床信息开始做生存分析---生存分析的几个统计学方法?

  • bach--cox(cox回归,探究多因素对生存期的影响)及森林图制作

  • LASSO回归(听说要用泰勒公式展开,先放着)

  • (还有很多可以做的,慢慢去开发)

103

TCGA的用法:用于验证自己的数据,或者做了数据挖掘后,进行临床验证,可以多组学、多平台联合分析。多读文献多开脑洞

听说技能树承包了你2020生物信息学文献 https://mp.weixin.qq.com/s/7nvBDPZb2uGVglwJE7p_Rw

201

数据权限: 3级、4级才能下载分析;1级、2级需要申请下载。

大家记得去扫视频4:36 的二维码 https://www.bilibili.com/video/av49363776?p=4

测序--比对(BWA)--去除重复---碱基校正---BAM---IGV可视化---QC---mutation(somatic--体细胞突变--仅存在于特定组织中,不遗传给后代;germinal--种系突变--全身大部分细胞都突变,且可遗传 )---indels/purity(可下载作为数据校正)、ploidy/CNV/rearrangements(结构变异)----annotation

六种数据:外显子、表达数据、甲基化、蛋白质、CNV、临床信息、miRNA

网页工具

  • GDC---目前TCGA的整合

  • cbioportal--按照文章来分

  • UCSC---可以用Python下载

  • FIREHOSE

  • oncolnc---看生存相关专用

  • gepia

  • tanric---lncRNA

  • TCIA---与TCGA配套的影像资料

  • ICGC---比TCGA更大

202

GTEx: 可以与TCGA联合做正常 对照组或eQTL的分析

203---Xena

不需要编程


acdb994b-aa04-4a6c-8b52-2226e1984d99-4204432.jpg

关于筛选空白样本(左侧有黑色边框即为保留的)


bc55e617-1ddd-4532-bb8f-421182ba9859-4204432.jpg

读取数据出现空值要设置 fill=F,去除含空值数据:na.omit(),去除特定行的办法如下


b82270cb-5a76-4dc5-a3df-c7a8c3346cc8-4204432.jpg

204

firehose:http://gdac.broadinstitute.org/

(鉴于它数据更新的慢而且我已经学会了GDC全套,所以各位看视频吧)

205

文章规律(还是那句话:多看文章,多开脑洞,让技能树的文献推送承包你今年的文献吧)

https://mp.weixin.qq.com/s/7nvBDPZb2uGVglwJE7p_Rw

第三章单独写一个

从未想到GDC下载到数据合并整理

整整让我费了好久的脑子(大概是太久没做了)

尤其是304节,我整整看了四五遍才大致理清楚要怎么做

结果:脑子:懂了没,赶紧做;手:不,你不会。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容

  • 本文内容 本文为笔者个人的学习笔记,包括以下内容 TCGA count数据下载 count数据预处理,标准化 差异...
    医科研阅读 6,610评论 0 7
  • 肿瘤基因组图谱(TCGA)计划是由美国National Cancer Institute(NCI)和Nationa...
    MedBioinfoCloud阅读 11,167评论 2 24
  • 准备的工作总是那么繁琐。 总是觉得准备不完。 总是觉得自己带的东西不够多,不足以应付所有的事情。 总觉得自己的头脑...
    虔一阅读 103评论 0 1
  • 无计划不开始 无总结结束 成功开始于自我分析,结束于自我反省。 我一直记得老师讲的那句话,要多总结多问自己...
    枟枟阅读 132评论 0 0
  • 1. 什么是约束 2. 为什么要使用约束 3. 分类 not null default unique primar...
    knot98阅读 196评论 0 0