标签归档:BCL

BCL文件与BCL2FAFSTQ程序简介

BCL文件

测序产生的原始文件是BCL(binary base call)文件,测序仪在测序的时候,每个cycle都会测量编码不同颜色的通道强度,并确定最有可能的碱基类型。Real Time Analysis (RTA) 软件会将碱基类型和可信度(一个质量分数)。与FASTQ文件不同的是,BCL文件是实时产生,每个cycle的每个tile都会有一个对应文件,文件放在

<run directory>/Data/Intensities/BaseCalls/L<lane>/C<cycle>.1

文件的命名

s_<lane>_<tile>.bcl

bcl2fastq

该文件需要通过Illunima的软件或者第三方分析工具将BCL文件转成FASTQ文件。一般而言,数据下机之后,Illumina测序仪会自动将BCL转成FASTQ文件。有时候,根据实验需要,需要自己手工将BCL文件转成FASTQ文件,比如自己设计的index中含有简并碱基,或者需要调整一下转换的参数等。

Illumina提供bcl2fastq的程序包,共离线处理BCL文件,生成FASTQ文件。

bcl2fastq  -i /paht/to/run/Data/Intensities/BaseCalls/ \
       -o /output/dir --sample-sheet /paht/to/run/SampleSheet.csv \
       -R /paht/to/run/

bcl2fastq文件有很多参数可调,比如在FASTQ中记录read的index(fastq文件中会记录配对的index具体序列,以及会生成额外对应的index文件),可以添加–create-fastq-for-index-reads选项。

如果允许index有mismatch的话,可以通过–barcode-mismatches设置。

–fastq-compression-level可以设置生成的FASTQ.GZ文件的压缩比例

安装如下

unzip bcl2fastq2-v2.17.1.14.tar.zip
tar -xvzf bcl2fastq2-v2.17.1.14.tar.gz
./bcl2fastq/src/configure --prefix=/path/to/install/
make
make install

安装过程中,如果遇到一下问题,请更新gcc版本
问题1
cc1plus: error: unrecognized command line option “-std=c++11”
问题2
undefined reference to `boost::re_detail::perl_matcher
collect2: error: ld returned 1 exit status

软件选项说明如下:
继续阅读