1:了解substr函数(截取函数),从start位置开始提取字符串,示例如下
2:用substr函数在TCGA数据中提取样本信息
tumor <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) < 10]
normal <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) >= 10]
根据TCGA数据中14,15位代表样本性质来提取分组信息。通过substr函数,截取表达矩阵中(expr),列名的第14.15的数值(用as.integer 转变为整数),然后判断14,15位置上的数值,<10(01-09)则为tumor组,>10(11)是指normal组。
因此,通过上述代码,利用substr函数即可得到样本的分组信息。