#include <stdio.h>
#include <stdlib.h>
#include<time.h>
#include "htslib/sam.h"
#define bam_is_read1(b) (((b)->core.flag&BAM_FREAD1) != 0)
typedef struct Link{//用于存储qname信息
char *qname;
int tie;
struct Link *next;
}Link,*LinkList;
int main(int argc,char **argv){
samFile *in = sam_open(argv[1], "r");
bam_hdr_t *header;
bam1_t *aln = bam_init1();
header = sam_hdr_read(in);
htsFile *outR1 = hts_open(argv[2], "wb");
htsFile *outR2 = hts_open(argv[3], "wb");
if (sam_hdr_write(outR1, header) < 0) {
fprintf(stderr, "Error writing output.\n");
exit(-1);
}
if (sam_hdr_write(outR2, header) < 0) {
fprintf(stderr, "Error writing output.\n");
exit(-1);
}
Link *head = (Link *)malloc(sizeof(Link));
head->next = NULL;
Link *temp = head;
Link *e = head;
char *name;
srand((unsigned int)time(NULL));//time函数返回的时间戳作为随机数生成器的初始值
while(sam_read1(in, header, aln) >= 0){
Link *t = head;
int sign = 0;
name = bam_get_qname(aln);
while(t->next != NULL){//查询是否已经录入相同qname的read
if(strcmp(name,t->next->qname) == 0){
if(t->next->tie == 1){
int a=sam_write1(outR1, header, aln);//写入数据
sign = 1;
break;
}else{
int a=sam_write1(outR2, header, aln);
sign = 1;
break;
}
}
else{
t = t->next;
}
}
if(sign == 0){//将新出现的qname录入
Link *b = (Link *)malloc(sizeof(Link));
b->qname =(char *)malloc(sizeof(char)*1000);
b->qname = strcpy(b->qname,bam_get_qname(aln));
int i = rand(); //生成一个随机数
if(i%2!=0){//存入一个bam文件中
int a=sam_write1(outR1, header, aln);
b->tie = 1;
}
else{
int a=sam_write1(outR2, header, aln);
b->tie = 0;
}
b->next = NULL;
temp->next = b;
temp = temp->next;
}
}
/* int n = 0;//统计录入的qname数量
while(e->next != NULL){
n++;
e = e->next;
}
printf("%d\n",n);
*/
sam_close(in);
sam_close(outR1);
sam_close(outR2);
}
将bam文件分成两个bam文件,属于同一个pe的两条reads分到一个bam文件中
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 1. 最近身边发生的真实事件,让我很不能理解:比如,因为拒绝分手,男方捅了女方数刀;婚前百依百顺,婚后变了个人甚至...
- 【蝴蝶效应】 蝴蝶效应:上个世纪70年代,美国一个名叫洛伦兹的气象学家在解释空气系统理论时说,亚马逊雨林一只蝴蝶...
- 问题描述: 当input类型为file时,前后两次重复选取同一个文件将不能触发相应的onchange()事件; 若...