测序中加入Phix的作用

测序建库的时候,会加入一定比例的Phix,那么Phix文库有什么作用呢,我转了两篇文章,方便大家理解。Phix文库最主要的目的1)是调节碱基平衡,改善测序仪的空间校正,便于后期提高base calling的准确性,2)由于Phix序列已知基因组较小,在测序的过程中Illumina的测序仪就开始将测的read与phix基因组进行比较,预估测序指标。我也遇到过,Illumina工程师在维护测序仪时,用Phix文库测试。转载内容详见下文

Calculate phastCon Score for a gene ---- 计算基因的phastCon平均分,判断基因保守型

Calculate phastCon Score for a gene —- 计算基因的phastCon平均分,判断基因保守型

PhastCon socre is the score from 0 to 1 to show the conservation level.

A score showing the posterior probability that phastCons’s phylogenetic hidden Markov model (HMM) is in its most conserved state at that base position.

The phastCons scores represent probabilities of negative selection and range between 0 and 1.

Short highly-conserved regions and long moderately conserved regions can both obtain high scores.

也就是说如果某个位点或者一段序列的phastCon分值高的话,表示保守型较高。

思考---基因组中那些“看起来”很严重的突变往往不致病

在全基因组数据或者外显子数据得到的突变通过注释之后,每个人或多多少都含有一定数目的"看起来"很严重的突变,比如剪切位点上突变,终止密码子突变,移码突变等等(正如《ExAC-外显子组聚合数据库:揭露那些"披着狼皮的羊"基因》标题中的描述———披着狼皮的羊)。

但真实情况是,人并没有疾病表型,或者疾病只与其中的个别突变有关系,其他的突变都没有影响。这是我一直思考的问题,偶然机会,我向业内做遗传咨询的一个博士(感谢)提出这个问题,讨论之后认为主要有以下几点原因:

**一,**很多基因不是必须基因,即使全部删除也不影响机体的正常功能。

**二,**隐性基因即使有一份被破坏,不影响另外一份行使功能。

**三,**如果参考的是文献中的致病突变,有很多是假的。也就说参考文献有可能存在假的结果。

**四,**机体有很强的代偿能力,即使真的是有缺陷的基因,机体也有可能代偿其缺陷而不影响正常机体功能,比如有一些个体携带确定致病的基因突变,表型仍正常。

[转载]蛋白质组学及蛋白质鉴定常用的网站和数据库

PS:我不经常用蛋白质数据库,不过看到这个总结的挺详细的,就转过来了。

一、蛋白质数据库


1.UniProt (The Universal Protein Resource)

网址:http://www.uniprot.org/ http://www.ebi.ac.uk/uniprot/ 简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

Axel - Linux下多线程下载工具

在linux环境下,用wget下载大文件,实在是件痛苦的事情,下载速度慢。这非常的不科学,于是找到了axel这个工具,可以实现在linux下多线程下载。并且可以实现断点续传。 Axel项目网站 https://wilmer.gaa.st/main.php/axel.html

安装

1
2
3
4
5
6
wget -c https://wilmer.gaa.st/downloads/axel-1.0b.tar.gz
tar zxvf axel-1.0b.tar.gz
cd axel-1.0b/
./configure
make
make instal

或者

apt-get install axel 参数 -n 指定线程数 -o 指定另存为目录 -s 指定每秒的最大比特数 -q 静默模式