标签归档:BS-Seq

bismark DNA甲基化测序比对-bisulfite-seq

bismark调用bowtie2进行比对,调用samtools生成bam文件,因此在运行bismark之前,需要安装bowtie2和samtools
请注意,fastq文件要进行质控,比如去掉低质量的reads,去掉adaptor等,可以看本文最下方推荐的PPT,本文不介绍,此外本本只介绍到序列比对,后续的统计分析没有介绍,有兴趣的朋友可以关注swDMR和methykit工具包。

安装bismark

wget http://www.bioinformatics.babraham.ac.uk/projects/bismark/bismark_v0.16.1.tar.gz
tar -xvzf bismark_v0.16.1.tar.gz 

生成转换后的基因组

# --path_to_bowtie后面跟的是文件夹
# --verbose 输出log信息
# ./ref 文件夹中有一个基因组fasta文件
# --bowtie2指明用的是bowtie2
./bismark_v0.16.1/bismark_genome_preparation --path_to_bowtie /home/zzx/bowtie2-2.2.9/ --bowtie2 --verbose ./ref/

因为在重亚硫酸盐甲基化测序中,因为未甲基化的C会变为T,在正链表现为C–>T,但是在负链有C变为T,转换为正链时,即为G–>A,所以基因组需要进行两种转化,才能用于比对。在基因组目录下产生Bisulfite_Genome目录,有CT_conversion和GA_conversion文件夹,这两个文件夹包含转换后的fasta文件和bowtie2建立的索引bt2文件。

fastq中的BS转换后的read与转换的参考基因组比对,得到在参考基因组中的位置,再与原始的参考基因组比较,确定methylate call

bismark比对

--non_bs_mm     Optionally outputs an extra column specifying the number of non-bisulfite mismatches a read during the alignment step. 
--nucleotide_coverage   该选项 会生成nucleotide_stats.txt文件。creates a '...nucleotide_stats.txt' file that is also automatically detected by bismark2report and incorporated into the HTML report.
--multicore   Sets the number of parallel instances of Bismark to be run concurrently.  一个实例已经将1个核分配给bismark,两个或者4个核分配给bowtie2,一个分给samtools
./bismark_v0.16.1/bismark --genome_folder ./ref --bowtie2 --nucleotide_coverage --non_bs_mm --basename test --temp_dir ./tmp --samtools_path ./samtools-1.2/ --path_to_bowtie ./bowtie2-2.2.9/ -1 1.fastq -2 2.fastq --output_dir ./

继续阅读