果蝇单细胞数据库:E-MTAB-10519 < ArrayExpress < BioStudies < EMBL-EBI
里面包含了2020年Science(Fly Cell Atlas: A single-nucleus transcriptomic atlas of the adult fruit fly)的全部raw_data
认识单细胞数据文件的格式
[sample name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gz
样品名称 Sx代表数据组,一样的S编号是一个样品
计算counts
cellranger count --id=FCA30_Male_MalpighianTubule_adult_5d_Perrimon_sample1 #这个是输出文件存放的位置
--transcriptome=refdata-cellranger-dmel656 \ #如果总是说路径不对,从建index时说你succeed时下面那行直接复制过来就不会有问题
--fastqs=/home3/yangx/workspace/single-cell/Fly_Cell_Atlas_2020_S_DATA \ #放测序文件的路径,没带文件,如果没有后面的--sample命令,就会分析这个文件夹中的所有文件
--sample=FCA30_Male_MalpighianTubule_adult_5d_Perrimon_sample1 #放对应的fastqs文件,是对文件添加前缀,即样本的名字,如果文件里有不只一个样本,那就必须指定sample
--description --expect-cells #期待的cell数量,例如1000
--force-cells --r1-length
--chemistry --r2-length
--lanes #就是说可以指定分析哪个lane
--localmem=xxx #比如200,
--localcores=10 #使用内存核的数量
结果解读
经此方式计算的结果会有很多,但是有用的文件只有两个。
还有一个很重要的文件,就是.html文件,所有的结果信息都在这里面
- 4395指的是测到了多少细胞,这一步改不得,前处理即使不好也不能从这里往回补救,可以重新送样,但不能变着法提高这里
- 55957指的是细胞中测到了多少片段,reads数量>UMI数量>Gene数量
- 1370指的是每个细胞中测到的基因的数量
(自己学习的笔记,欢迎讨论和指教,转载请注明出处)