Google Docs + PaperPile = 提高生产力

Google Docs的优点:

1,便于协作,多个人可以同时(注意是同时)编辑一个文件,当然有道云笔记,腾讯文档、office 365也可以。 2,可以追踪修订,版本控制 3,虽然office的功能很强大,但平常用的功能,Google Docs都有 4,不用考虑文件同步的问题,有网就有文件,直接编辑即可,实在不行,拿个PAD连个键盘都行 5,可以用插件,比如PaperPile

PaperPile:

我是来到HK之后才接触PaperPile的,和Google Docs配合,插入文件,简直太爽了。我也用百度搜了下看是否有人介绍 PaperPile,很少有介绍的。

可能的原因是大陆用Google Docs不方便,进而不经常用PaperPile。PaperPile有个编辑公司提到 “科研写作在云端:协同写作工具”。这个形容真的是太贴切了,有了PaperPile,感觉文献管理无敌了。

1,插入文献:随便提供文献的网址、题目等,插入即可,简单的不要不要的

2,文献管理:有PaperPile的Chrome插件,随时搜集你喜欢的文献,如果能下载到PDF,PaperPile一并帮你下载好,当然这个需要占用你的Google Drive的空间。你可以设置文件夹,管理不同的文献

3,文献阅读:有时候文献阅读,需要高亮、备注什么的,要用到PDF阅读器,还要考虑电脑间的文件的同步问题,PaperPile最近开发了自己的PDF阅读器,在PaperPile中设置成它自己的阅读器打开文献即可。这样的好处是,只要有网和浏览器,你就可以随时的阅读和标记。这比Endnote什么的方便多了。

Matlab error when running GISTIC

If you instal MCR (MATLAB Compiler Runtime) provided by GISTIC package, may have the following error. This error could disrupt GISTIC. libGL error: failed to load driver: swrast If this situation occurs, rename the file found at " $MATLAB_ROOT/sys/os/glnxa64/libstdc++.so.6" to “libstdc++.so.6.old”, This forces MATLAB to use the OS library. Works for me. Ref: https://ww2.mathworks.cn/matlabcentral/answers/296999-libgl-error-unable-to-load-driver-in-ubuntu-16-04-while-running-matlab-r2013b GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers

Prepare a data frame for sample CNV data

If we want to cluster samples based on CNV data, a dataframe is needed. However, CNV segments in each sample are not the same. Maybe overlap or distinct. I think CNTools package migh solve this challenge. An example is shown as below. The result is a reduced segment data frame.

1
2
3
4
5
BiocManager::install("CNTools")
data("sampleData")
seg <- CNSeg(sampleData)
rdseg <- getRS(seg, by = "region", imput = FALSE, XY = FALSE, what = "mean") 
View(rdseg@rs)

对Autoencoder(自编码器)的理解

通常数据的维度太大,可视化很难,也不利用模型的学习。有时候拿到数据做个PCA或者tSNE,就是把维度缩小到2维(当然也可以3维),便于看数据之间的关系。在机器学习中,Autoencoder也是一种降维的方式, Autoencoder输入层的神经元的数目和输出层的神经元的数目必须,而且要保证输出的结果尽最大可能和输入的结果一致。