下面是在写论文的过程中遇到的问题,其中有的是老师给出的答案,有的是我在网上搜的。
偏最小二乘法是一种降维算法,基因微阵列是一种大数据集,比如,现在医学上公开的数据集白血病数据集,它包含成千上万个基因数据,我们要从这个数据集中,运用偏最小二乘法降维,挖掘出有用的数据,为治疗做出判断。
你需要针对某一个癌症微阵列数据集(比如白血病)来研究,否则就会泛泛而谈。
偏最小二乘法降维在微阵列数据判别分析中的应用
10分钟搞懂遗传算法
轮盘赌算法(用于随机选择个体,概率大的选择几率大)
偏最小二乘法作为一种降维技术不但在微阵列数据判别分析中得到了应用,而且迅速推广到了微阵列数据分析的其他领域。比如在生存分析领域,通过病人的基因表达水平来预测生存时间。传统的生存分析模型(如COX回归模型)一般无法直接适用。Nguyen和Rocke建议先适用偏最小二乘法对数据进行降维,然后再对提取的成分拟合传统的生存分析模型。他们的方法在Alizadeh的淋巴瘤患者数据和Sorlie的乳腺癌患者数据上都得到了成功应用。
基因表达微阵列数据降维与分类比较研究
隐马尔可夫模型(是用来描述隐含未知参数的统计模型,举一个经典的例子:一个东京的朋友每天根据天气{下雨,天晴}决定当天的活动{公园散步,购物,清理房间}中的一种,我每天只能在twitter上看到她发的推“啊,我前天公园散步、昨天购物、今天清理房间了!”,那么我可以根据她发的推特推断东京这三天的天气。在这个例子里,显状态是活动,隐状态是天气。)
维特比算法就是求解HMM上的最短路径(-log(prob),也即是最大概率)的算法。
偏最小二乘法降维在基因微阵列数据分析中的应用相关论文
偏最小二乘法的相关文档
协同过滤算法(Collaborative Filtering…… Algorithm)。顾名思义,协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求