基于DNA或RNA的NGS数据进行HLA分型

写这个原因呢,最近又要对样本的HLA分子进行分型,然后看到某公司的微信公众号讲的HLA的分型软件,全文讲了那么多,要么巨难用,要么下载不到,反正不如我自己正在用的这两个。另外一方面,没必要太纠结非常高的精度,除非你用得到。4-digital resolution,我觉得已经够了。

HLA分子

先回顾下百度百科对HLA的介绍(https://baike.baidu.com/item/HLA/9504270?fr=aladdin):

HLA(human leukocyte antigen ,人类白细胞抗原)是人类的主要组织相容性复合体(MHC)的表达产物,该系统是所知人体最复杂的多态系统。

HLA是具有高度多态性的同种异体抗原,其化学本质为一类糖蛋白,由一条α重链(被糖基化的)和一条β轻链非共价结合而成。其肽链的氨基端向外(约占整个分子的3/4),羧基端穿入细胞质,中间疏水部分在胞膜中。HLA按其分布和功能分为Ⅰ类抗原和Ⅱ类抗原。

HLA-I类分子:内源性抗原的递呈分子, HLA-Ⅱ类分子:外源性抗原的递呈分子

立个走完麦理浩径的flag

麦理浩径一共十段,长达100公里,前几段风景比较优美,我只走过二段的一半,我想把十段都走完,先把flag立下(3年实现)。

2019-06-23 走了二段的一部分,景色真的非常好,山径、海岸、溪流、沙滩。又乘坐快艇去了西贡,享受海鲜大餐。

2020-06-20 走完了一段和剩余的二段的一部分。

2020-09-20 走了五段,并从中登狮子山顶Lion Rock Head。

2020-11-08 走了六段全部和七段一半。

2020-11-22 走了三段。

一段和部分二段图片

起点

分类模型的性能评估

最常用的就是灵敏度和特异性,不过还有其他的,比如阴性预测值(negative predictive value, NPV)。

通常,先画一个ROC曲线,计算曲线下面积。ROC上的每个点是特定阈值下,分类的sensitivity和specificity,没多点连起来组成ROC,曲线下面积就是AUC。面积越大越好,如果AUC是1,说明模型能够完全区分要预测的类别。

如果不是1,就要考虑阈值取哪里比较好,这里就涉及到Youden index。Youden index 其实就是为了找到使得sensitivity和specificity之和最大max(sensitivities+specificities)的阈值。

另外就是考虑其他指标来评估分类模型的性能:specificity, sensitivity, accuracy, npv, ppv, precision, recall, tpr, fpr, tnr, fnr, fdr。这些指标可谓琳琅满目,不过这之间有重复的,如下,都是基于tn(真阴), tp(真阳), fn(假阴), fp(假阳)的个数进行计算。

安装黑苹果

最近电脑老是蓝屏,很是恼人,怀疑是win10系统的原因,重装了好几次还是蓝屏,于是决定装个黑苹果,用macOS系统(装好黑苹果MacOS 10.15 Catalina之后,发现可能是硬盘的问题导致蓝屏的,pity)。总结一下过程,看教程的时候很麻烦,实操一遍之后,回顾一下,其实还是蛮简单的,大致过程和装windows一样,就是多了添加clover引导,方便黑苹果从硬盘引导而不是U盘。下面是总结了一下过程,不是详细,方便以后再装

1,设置好分区

此电脑-管理-磁盘管理

(1)确保格式为GPT格式(GUID)

(2)确保有EFI分区

(3)压缩卷,给空出来的卷新建卷,不要选择格式化这个卷(安装黑苹果的过程中会进行)

(4)这个新建的卷就是安装黑苹果的分区