bowtie2序列比对原理,Bowtie2

bowtie2  是bowtie的升级版,index不能混用。具体不同点,请参考这里。

1. 建立索引 bowtie2-build -f hg38.fa ./bowtie2_index/hg38# -f 可以省略,默认是fasta格式# 从索引导出序列bowtie2-inspect bowtie2-inedx > ref.fa# 查看参看基因组名称bowtie2-inspect -n bowtie2-inedx

注:时间很长,macbook(i5,16G)上运行四个多小时。生成.bt2 结尾的六个文件,某些基因组的index文件可以从这里下载。

2. 比对单端(single end,PE)测序数据

用法:bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | –interleaved <i> | -b <bam>} [-S <sam>]

# 利用参数 -Sbowtie2 -p 10 -x hg38 -U test_read.fq.gz -S bt_se_test.sam# 重定向bowtie2  -x hg38 -U test_read.fq.gz > bt_se_test.sam# 管道连接samtoolsbowtie2 -p 10 -x hg38 -U test_read.fq.gz|samtools view -bS|samtools sort > test_sorted.bam

参数解释:

-p 线程

-x  基因组索引文件前缀,不写路径表示当前路径下

-S <sam>      File for SAM output (default: stdout)

–end-to-end      entire read must align; no clipping (可以省略,默认开启)

–phred33          qualities are Phred+33 (可以省略,默认开启)

3. 比对双端测序(pair end,PE)数据 bowtie2 -x hg38 -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_test_pe.sam 4. 局部比对 bowtie2  -x hg38 –local -U test_read.fq.gz -S bt_local_se_test.sambowtie2 -x hg38 –local -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_local_test_pe.sam

–local  局部比对,read两头的序列不参与比对打分,相当于soft clipping。

参考

Bowtie 2: Manual

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注