240 发简信
IP属地:北京
  • 120
    基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量评估的软件——QUAST和BUSCO。 1.1 quast—...

  • 用verkko组装基因组

    背景介绍 verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere)级别的基因组组装的组装软件。 2022年9月14号李恒在主题为Pac...

  • @荣_e687 先分别生成你的二代和三代HIFI测序数据的路径文件,在.cfg配置文件中的sgs_fofn/lgs_fofn那里改成相应文件就行

    De novo组装#05 | 基因组纠错polish(racon+pilon, nextpolish)

    写在前面 在进行染色体挂载之前一般对得到的 "primary assembly"(主要组装/初始组装结果)进行进一步的优化,以减少错误,提高基因组的质量和准确性。然后再将这些...

  • 120
    聊聊“基因组共线性”

    最近看了几篇关于共线性分析的微信/简书推送,发现不少研究人员把“编码基因共线性”错误地描述为“全基因组共线性”。这是两个完全不同的概念,前者主要是基于蛋白水平,蛋白的保守性很...

  • @13cdd6ddd9c3 不用删,非T2T级别基因组组装有一些没有挂在到染色体的contig很正常,一般你去下载的基因组fasta文件都是由chr1 chr2 .....,以及一些scaffold## 组成的。你就不用管他,因为你也搞不清他到底是基因组上真实存在的序列由于所在的位置比较复杂没有挂上,还是前面软件组装产生的垃圾,你自己很难判断手动去移到真正准确的位置。建议用juicerbox调整完就重新去用assembly文件去重新生成fasta,可以设置下过滤参数,把那些太短contig都过滤掉,剩下比较长可以留着说不定里面确实有重要的东西但又没挂上,你用这个基因组做后续其他分析的时候可以选择只用chr水平的序列去做。关于juicerbox软件具体用法我有点记不清了,不过有一点需要注意下,随时调整分辨率,对一些比较短的contig进行操作的时候需要放大一点鼠标箭头才会出现相应的形状

    De novo组装#07 | 染色体挂载 (allhic,3d-dna)

    写在前面 初始组装经过基因组纠错(polish)以及去冗余(purge)之后,就可以将其挂载到染色体上,使其由contig/scaffold级别的基因组提升到chromoso...

  • 120
    性染色体的鉴定(GATK4)

    写在前面 性别被称为“进化生物学问题的皇后”,一直是生命科学领域中最具吸引力和最热门研究方向之一。而有性生物其性染色体的解析是性别研究的基础,这篇文章主要介绍一套鉴定性染色体...

  • fastqc只是用来检测测序数据是否存在质量问题(有没有接头,低质量的reads等),输出结果就是一个检测报告,本身并没有做过滤,一般都是fastp来跑数据过滤。不过现在的测序公司释放给你的测序数据都是跑过fastp的"clean data"了,一般不会给你raw data要你自己跑过滤。你可以看下公司给你的结题报告,一般都会有fastqc/fastp的相关结果

    De novo组装#01 | 测序数据质控(fasqc+fastp)

    fastqc查看数据基本情况 1#安装fastqc课题组超算已安装的fastqc报错,在自己目录下新建一个software目录用于安装相应的软件,手动安装: 2#运行程序安装...

  • 120
    gvcf文件与vcf文件

    一、解释一 这里注意HaplotypeCaller只能处理单样本文件,当有多样本时,官方建议使用HaplotypeCaller对单bam文件分别进行变异检测,生成GVCF文件...

  • 120
    De novo组装#08 | 基因组组装评估

    写在前面 基因组组装完成后,我们需要对我们组装好的基因组进行一个质量评估,质量评估主要从连续性(continuity),完整性(completeness),准确性( accu...

  • 120
    De novo组装#07 | 染色体挂载 (allhic,3d-dna)

    写在前面 初始组装经过基因组纠错(polish)以及去冗余(purge)之后,就可以将其挂载到染色体上,使其由contig/scaffold级别的基因组提升到chromoso...

  • De novo组装#06 | Scaffolding和gap filling

    基于三代测序reads进行Scaffold构建以及补洞gap filling,我这里只有一种三代测序数据CLR,这里就先不做了,而且我看文章做这步的人也非常少。后面有时间再补...

  • 120
    De novo组装#05 | 基因组纠错polish(racon+pilon, nextpolish)

    写在前面 在进行染色体挂载之前一般对得到的 "primary assembly"(主要组装/初始组装结果)进行进一步的优化,以减少错误,提高基因组的质量和准确性。然后再将这些...

  • 120
    De novo组装#04 | 基因组去冗余(purge_dups)

    写在前面 冗余序列的产生和多种因素有关,如 CLR 的测序错误,基因组自身的杂合性和重复序列的影响等等,purge_dups软件能根据read深度分析组装中haplotigs...

  • 120
    De novo组装#03 | 基因组拼接(flye, wtdbg2, mecat2, canu)

    写在前面 前面两篇文章De novo组装#01 | 测序数据质控(fasqc+fastp)[https://www.jianshu.com/p/7c5447517de3] ...

  • 120
    De novo组装#02 | 基因组survey (jellyfish+GenomeScope2)

    基因组Survey 是对基因组的大小、杂合情况进行评估。我们de novo组装一个物种的基因组之前,一般要对所测物种基因组大小有一个估计,以便后续测三代数据的时候,确定大概需...

  • 120
    De novo组装#01 | 测序数据质控(fasqc+fastp)

    fastqc查看数据基本情况 1#安装fastqc课题组超算已安装的fastqc报错,在自己目录下新建一个software目录用于安装相应的软件,手动安装: 2#运行程序安装...

  • 记录学习#001

    记录自己的生信入门 目标:9月份之前从头组装出一个染色体水平的基因组

  • 120