seqtk的R1和R2的seed需要设置相同的数目
fastq文件随机取样问题(适于大数据)3M的reads是指3000000的read num 1G是指总的数据量 涉及到fastq文件(大约13个g)随机取样,看的文献用的seqkit,但我试了几次并没有取到3M的...
seqtk的R1和R2的seed需要设置相同的数目
fastq文件随机取样问题(适于大数据)3M的reads是指3000000的read num 1G是指总的数据量 涉及到fastq文件(大约13个g)随机取样,看的文献用的seqkit,但我试了几次并没有取到3M的...
3M的reads是指3000000的read num 1G是指总的数据量 涉及到fastq文件(大约13个g)随机取样,看的文献用的seqkit,但我试了几次并没有取到3M的...
-S中*.bw就是同时多个文件了
使用deeptools画热图和平均图ATAC后续可视化生成的热图和平均图可以用R包进行绘制,我这里选的是deeptools里的bamCoverage和computeMatrix功能 deeptools安装是用c...
最近因为运行软件脚本丢失,所以决定以后存到网上,此脚本是比较fastq文件是否相同的行数序列相同 import gzip from datetime import datet...
阅读文献Chromatin accessibility changes between Arabidopsis stem cells and mesophyll cells ...
基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释。注释之前首先得构建基因模型,有三种策略: 从头注释(de novo prediction...
唠唠叨叨: 因为处理ATAC-seq的原始fastq数据太大(已知GEO号在ncbi上下载),所以被老师要求用python编程分割fastq脚本,其实用软件seqkit就可以...
最近导师逼着开始学编程,没办法,只能一点点啃了,有时间记录下我写的简单python小程序,哈哈,我比较懒,先开个贴 python需要练习,看别人写的代码和自己打印到电脑屏幕里...
ATAC后续可视化生成的热图和平均图可以用R包进行绘制,我这里选的是deeptools里的bamCoverage和computeMatrix功能 deeptools安装是用c...
先传一些过程图,后期编文字 AnnotationHub的数据来源 AnnotationHub下载所需信息
我看的一些安装Bioconductor都是用 source("https://bioconductor.org/biocLite.R") biocLite("包名字") 但是...
这一次,我们来聊聊基因组注释。首先问自己一个问题,为什么要进行基因注释。就我目前而言,它用来解决如下问题: 在mapping-by-sequencing的时候,我找到了一些可...
最近一直在探索ATAC-流程,之前疫情在家的时候跟着练习了WGS和JCVI流程,有一个一个软件练习下来的, 也有借着脚本出图的 ATAC-seq练习到找peaks的步骤,因为...