ARCHS4:大规模转录组预处理数据库
文章目录
公开的转录组数据集多为原始形式,格式不统一、处理方式各异,难以有效利用,所以我想找一个经过标准流程清洗了GEO/SRA数据集的数据库,这样可以直接用清洗后的结果,而不用每个数据集单独处理。recount2(https://jhubiostatistics.shinyapps.io/recount/)就是类似的数据库,但只提供了2038个数据集,远远不够。
今天发现了ARCHS4(https://archs4.org/),感觉满足我目前的需求。ARCHS4数据源于GEO 和 SRA 数据库,还纳入了线虫、果蝇等其他物种的 35000 个样本数据,用的比对软件是Kallisto。数据维护一直在更新,还提供了分析和下载工具(https://github.com/MaayanLab/archs4py)。
RNA-Seq这块,提供了966693个样本比对结果,还提供了样本的tSNE结果,基因相关性结果。
参考:
https://www.nature.com/articles/s41467-018-03751-6
https://github.com/MaayanLab/archs4py
####################################################################
#版权所有 转载请告知 版权归作者所有 如有侵权 一经发现 必将追究其法律责任
#Author: Jason
#####################################################################
文章作者 zzx
上次更新 2025-03-26