ONT甲基化下机数据是fast5格式,比较大,先转成pod5,提取和储存更方便
先装一个pod5,用pip
pip install pod5
然后直接转就行
pod5 convert fast5 fast5_pass/*.fast5 --output pod5/ --one-to-one ./fast5_pass
转完了用dorado做basecalling
dorado要自己下模型,如果模型拉不下来,需要自己下本地版
dorado download model all
dorado basecaller ./dna_r10.4.1_e8.2_400bps_hac@v5.0.0/ ./pod5/ --modified-bases-models ./dna_r10.4.1_e8.2_400bps_sup@v5.0.0_5mC_5hmC@v1/ --ref ref.fasta > calls.bam
samtools sort calls.bam > calls.sort.bam
samtools index calls.sort.bam
modkit pileup --cpg --ref ref.fasta calls.sort.ref.bam out.bed --preset traditional