集成多组学数据的机器学习在生物医学中的应用

集成多组学数据的机器学习在生物医学中的应用大纲

机器学习及生物组学基础(提前赠送视频)

学习目标:对机器学习基本概念进行介绍,让大家对机器学习基本概念有大致了解。明确机器学习方法的适用性,优势,以及局限性等

1.什么是机器学习

2.机器学习的应用实例

3.生物组学简介(基因组学,转录组学,蛋白组学,代谢组学)

4.机器学习在在多组学数据分析的应用

python语言基础(提前赠送视频)

学习目标:机器学习主流实现是python语言。学习机器学习之前,有针对性的对python进行系统的学习,数据的基本处理,以方便将来开展机器学习的学习

1.python安装与开发环境的搭建

2.基本数据类型、组合数据类型

3.函数、列表、元组、字典、集合

4.控制结构、循环结构

5.Numpy模块——矩阵的科学计算

6.Matplotlib模块——数据处理与绘图

7.Pandas模块——csv数据处理与分析

8.Sklearn模块——机器学习模型基础软件包调用

案例教学一:利用Python pandas读取组学CSV数据并进行数据初步分析

生物组学大数据预处理与探索分析

学习目标:在对高维组学数据进行统计方法分析及机器学习建模过程前,需要对数据进行预处理,如缺失值填补,降维可视化等,大数据预处理与探索分析是检验数据质量与了解数据分布的必要过程。

1.高维组学数据的预处理框架

2.常用数据预处理方法:缺失值填补,标准化,归一化,对数转化

3.常用的降维方法,PCA,tSNE等

4.数据探索分析(EDA)

案例教学二:利用Python读取组学CSV数据并进行数据探索可视化分析(Exploratory data analysis,EDA)

经典机器学习模型及多组学应用

学习目标:对在多组学整合分析中最常使用的几种机器学习模型进行介绍,总结它们的优缺点及适用范围,通过动手实践快速掌握几种方法

1.线性模型(线性回归、梯度下降、正则化、回归的评价指标)

2.决策树(决策树原理、ID3算法、C4.5算法、CART算法)

3.支持向量机(线性支持向量机、可分、不可分支持向量机)

4.集成学习(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法)

5.模型选择与性能优化(数据清洗、特征工程、数据建模)

6.Scikit-learn机器学习库的使用

案例教学三:基于转录组学数据进行端到端的机器学习项目泛癌预测(数据预处理,数据建模,模型评估)

案例教学四:基于蛋白组学-代谢组学在COVID-19中生物标志物发现研究

深度学习在组学数据中的应用

学习目标:随着高通量组学平台的发展,生物医学研究大多采取了多组学技术结合的方法,不同组学来源(如转录组学、蛋白质组学和代谢组学)的数据可以通过基于深度学习的预测算法进行整合,以揭示系统生物学的复杂工作。在这一部分我们会重点对基于深度学习的神经网络进行系统的讲解,学习常见的神经网络架构在多组学分析的应用。

1.深度学习介绍,常用神经网络架构介绍

2.监督学习介绍,神经网络在转录组学+代谢组学的疾病预测为例

3.无监督学习介绍,高维组学数据降维,聚类分析,以单细胞转录组数据为例

案例教学五:基于t-SNE和UMAP进行单细胞转录组学数据降维,细胞亚型聚类分析。

深度学习神经网络基础与实践

学习目标:从零开始手动实现一个神经网络,在这一过程中对所涉及的原理进行系统讲解及实践,让大家能够更深刻的理解算法背后的原理以及实现方法,之后有利于对其他机器学习更全面快速掌握

1.深度学习与机器学习区别与联系

2.Perceptron, 神经元基础

3.神经网络的梯度下降法与损失函数

4.神经网络中的前向传播与反向传播

5.神经网络的模型评估

6.超参数优化,batch size, learning rate

7.深度学习工具——Pytorch的使用

8.深度学习工具——Keras的使用

案例教学六:基于高维转录组学及手动构建神经网络进行特征筛选及预测

多组学联合分析,阐明疾病分子机制

学习目标:从常见的多组学联合分析策略出发,如转录组+代谢组,蛋白组+代谢组等,对常用的数理统计分析方法进行介绍,之后学习如何利用数据库如KEGG等进行生物功能富集分析,结合机器学习方法进行生物标志物的挖掘,疾病预测以及生物分子作用机制等。

1.常用生物组学实验与分析方法,如转录组学,代谢组学

2.常用组学数据库介绍,如TCGA,PathBank,HMDB,KEGG

3.Python批量处理组学数据-归一化处理,差异分析,相关性分析

4.生物功能分析:GO 功能分析、代谢通路富集、分子互作等

5.基于转录组学的差异基因筛选,疾病预测

6.基于差异基因,联合代谢组学分析疾病分子发生机制

7.组学数据可视化,如火山图,t-SNE降维,代谢通路网络分析

8.组学特征(基因,蛋白,代谢物)选择(随机森林分析)

9.单细胞转录组学数据分析及可视化分析

案例教学七:(包含以下内容)

(1)转录组+代谢组的多组学分析胃癌,实现从“因”和“果”两个层面来探究生物学问题,相互间进行验证

(2)从海量的数据中筛选出关键基因、代谢物及代谢通路

(3)深度解析胃癌肿瘤标志物解释肿瘤发生发展的复杂性和整体性案例

深度学习神经网络进阶

学习目标:学习前沿神经网络如卷积神经网络,循环神经网络,注意力机制,自编码器,图神经网络在生物组学及药物筛选的应用,迁移学习应用等。

1.卷积神经网络基础及其应用(影像组学)

2.循环神经网络基础及其应用(蛋白组学)

3.注意力机制基础及其应用

4.自编码器基础及其应用(转录组学)

5.图神经网络基础及其应用(代谢组学)

6.迁移学习

7.深度学习框架——transformer的应用

案例教学八:基于自编码器进行药物/代谢物分子生成

深度学习在组学数据药物发现的应用

学习目标:基于基因表达特征建立疾病与小分子药物之间的关联关系,运用转录组学,蛋白组学,机器学习算法进行药物重定位。

1.基于生物组学的药物发现基础介绍

2.药物分子化学特征提取(分子指纹,描述符,分子图)

3.图神经网络预测药物分子性质

4.基于胰腺癌差异表达基因进行药物重定位

案例教学九:基于机器学习与图神经网络进行代谢物/药物分子的性质预测

案例教学十:以阿尔茨海默病为例,基于转录组学差异表达基因与深度学习模型进行药物重定位

AI+Science

学习目标:人工智能领域前沿内容,让大家了解最新的多组学与机器学习领域的研究动态,同时介绍几种更为先进的机器学习算法。

1.集成学习在多组学数据联合分析中的应用

2.多组学数据库在生物信息网络的挖掘与应用

3.生成模型在多组学数据的应用与挑战

4.影像组学进阶,弱监督学习进行影像组学的数据自动标注与分类

案例教学十一:基于生成对抗模型进行单细胞转录组数据深度特征提取

案例图示1:基于蛋白组学-代谢组学的肿瘤生物标志物发现

案例图示2:基于GWAS-表型组学的肺癌风险因子研究

案例图示3:基于图神经网络的代谢物分子性质预测与鉴定

案例图示4:基于自编码器的单细胞转录组-蛋白组学整合分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,612评论 5 471
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,345评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,625评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,022评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,974评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,227评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,688评论 3 392
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,358评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,490评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,402评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,446评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,126评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,721评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,802评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,013评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,504评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,080评论 2 341

推荐阅读更多精彩内容

  • 头条 GPT-4既令人兴奋又令人恐惧 [https://openai.com/research/gpt-4] 这篇...
    数科每日阅读 72评论 0 1
  • 20230317星期五四点三十四张双利《共产党宣言》 昨天晚上出去转了一会听的是《共产党宣言》,我就是对于共产主义...
    每天坚持阅读 147评论 0 0
  • 难得糊涂,随着年龄的增长,生活阅历真的可以让你醍醐灌顶。 托管中心有个孩子,小学三年级女孩,家庭条件优越,...
    行走的小蚂蚁阅读 61评论 0 0
  • 昌瑞利 “五个一”打卡 始于2023 01 30日,今日打卡第29天) 爱心]立一个志 修身之志:读《回家的路》到...
    CRL瑞阅读 74评论 0 0
  • 跨平台技术方案选择Flutter总结 1、移动端的跨端技术选型 移动端的跨端技术方案,我们关注的点主要集中在这几个...
    遥望星空forward阅读 146评论 0 1