小试shell中的神器zsh

很早就知道神器zsh的存在,一直没有用,今天手痒装了一下,哈哈,用起来还不错。

zsh是bash的增强版,可以兼容bash,可谓是shell中的战斗机,非常方便的命令提示、补全、忽略大小写等功能,一个字爽,可参见

https://www.zhihu.com/question/21418449

不过通常zsh配置起来比较复杂麻烦,于是诞生了oh-my-zsh,专门为简化zsh的配置而开发,http://ohmyz.sh,极大的简化了zsh的配置,还是一个字,爽。

VCF文件中的原始突变过滤--filter raw variants in vcf

Hard filter突变的传统过滤方式

此时VCF文件中的突变,与刚开始下机得到的FASTQ文件类似,称为raw data。此时的突变集合中,有很多假阳性突变,这些突变需要在突变分析之前过滤掉。

传统的过滤方式,直接根据每个突变的注释信息,进行过滤。最直接和最常见的是根据DP标签过滤,即根据该突变位点的测序深度进行过滤。通常,深度越低,支持该突变的reads数目越少,该突变越不可信。还可以根据前面提到的QUAL质量分值进行过滤,分值越低越不可信。Forward reads和Reverse reads的比例。通过,设定一定的阈值,看这些注释信息是高于还是低于该阈值。

GC偏好

GC偏好

测序中的GC偏好指的是基因组上GC含量在50%左右的区域更容易被测到,产生的reads更多,这些区域的覆盖度更高,在高GC或者低GC区域,不容易被测到,产生较少的reads,这些区域的覆盖度更少。用基因组单位长度的bin中的GC含量作为横坐标,覆盖度作为纵坐标作图,可以明显的看到该趋势。这种趋势在100kb为单位的bin中依然存在。