Nat Protocols | 大数据精准癌症药物筛选开源系统

责编 | Qi

随着精准医疗和基因测序的发展，癌症分类越来越细化。根据病人临床或者分子特征定义的新的亚型越来越多。比如乳腺癌可粗分为ER+, HER2+和TNBC，而TNBC又可以再分为六种亚型。往往抗药的病人因具有不同的分子特征而被分开出来针对研究。药物研发也慢慢开始针对各种亚型。加上各种罕见癌症，新的癌症类型数越来越多。而分配到各特定病人群体的研究资源很有限。大规模的药物筛选在小的实验室很难实现。

过去几十年的基因测序能对各种癌症基因表达精确定义，同时也能对目前临床药物对基因调控有了清晰地了解。通过匹配疾病和药物的分子图谱，我们能快速找到合理的药物进行进一步实验验证。因为很多药物已经运用于临床，可以很容易实现药物再利用（drug repurposing）。来自美国密西根州立大学陈斌团队开发一种匹配算法，该算法能量化每个药物对特定疾病分子图谱的校正潜力（命名为RGES）。RGES的核心概念是如果药物对疾病高表达基因有下调作用而对低表达基因有上调作用，意味着该药物可能对此疾病有效。陈实验室和其他实验室运用此算法发现了很多候选药物。比如他们发现抗痢疾药可能能用来治疗肝癌 (PMID:28284560)。他们的研究表明用该算法来筛选药物能达到50%的成功率。然而，通过公用数据寻找正确的疾病分子图谱和合理利用此算法进行药物预测对大多数研究人员来说并不简单。

近日，陈斌团队在Nature protocols杂志上发表了一篇题为OCTAD: an open workspace for virtually screening therapeutics targeting precise cancer patient groups using gene expression features的文章，公布其最新开发的系统：OCTAD(http://octad.org/)。

在文章里，作者详细叙述了药物预测的每一步骤，从早期怎么选择合理的病人样本和匹配的样本到后期怎么选择靶点，评估预测效果和选择合理的实验模型。比如他们发现大部分的病人肿瘤样本没有直接可以用的正常组织样本来对比生成分子图谱。于是他们利用深度学习autoencoder来帮忙从GTEx，一大型正常组织数据库，来选择合理的正常样本。他们也发现好多细胞株虽然跟肿瘤组织来自同一细胞类 (cell of origin) ，但它们的基因表达完全不样。最明显的就是MDA-MB-231用来研究乳腺癌转移的细胞株跟转移的病人样本分子特点完全不一样（PMID:31092827）。OCTAD也加入了相应一模块来帮助选择细胞株。

目前，OCTAD收集了19127组织样本的基因表达数据涵盖了50多种癌症，每个样本包括了性别、年龄、癌症阶段（stage）、基因突变 (mutation)、基因拷贝数 (Copy number variation)，常见亚型等信息。同时OCTAD收集了12442药物的基因图谱。OCTAD的网络平台可以帮助无编程背景的人选择组织样本计算基因表达图谱和实验药物预测，OCTAD的R软件包能实现更多样式的大规模预测。

在文章最后，作者以肝癌为例一步步演示怎么通过网络版本和R软件包实现药物预测。同时他们也用MYC amplification 的肺癌和PIK3CA 变异的乳腺癌来说明OCTAD对癌症特定亚型的药物预测。OCTAD目前只支持现有药物的预测。

陈实验室在开发深度转移学习算法来实现对新化合物的筛选，并欢迎优秀博后和研究生加盟。

https://www.nature.com/articles/s41596-020-00430-z

制版人:嘉

Nat Protocols | 大数据精准癌症药物筛选开源系统

约翰逊“不做历史罪人”让俄罗斯愕然，乌军多条战线击退俄军

马斯克：贪婪的最高表现是独载，权利才是剥削的最大根源！

朝鲜全新国家宣传曲公布：片中演员将金正恩称为父亲

欧盟泼脏水：中国在俄乌冲突中坐山观虎斗还下场了

北京一四合院4.5亿元起即将开拍，3.6万余人围观，暂无人报名

很奇怪：面对油价上涨，为何油车车主都默不作声了，不在乎了吗？

一女子站在桥边哭泣留下手机，随后跳下河！

农业农村部：正会同有关部门编制逐步把永久基本农田全部建成高标准农田实施方案

上海世纪公园24小时开放首夜：游客不足百人，为谁留灯又为何熄灯

两大家族开撕？菲第一夫人公开指责副总统：不道歉，这事就没完

广交会吸引12万名境外采购商，俄罗斯客流显著增加

新华社快讯：据朝中社20日报道，朝鲜19日进行战略巡航导弹超大型战斗部威力试验和新型防空导弹试射

中国人民解放军信息支援部队成立大会在京举行

看到满满一车的坦克准备运往前线，绍伊古面带微笑表示感谢

商务部：1-3月全国吸收外资3016.7亿元人民币

这段视频看得生气！浙江一越野车驶入麦田来回碾压，车主找到了，他竟这样说

渣打在香港挂出10%的存款利率，以吸引内地资金

中国人为了争取双休日，花了40年

联合国安理会上，不满美以霸道行径，阿拉伯国家代表愤然离席

哈尔滨麦道啤酒被检出呕吐毒素，回应：符合国家标准

Nat Protocols | 大数据精准癌症药物筛选开源系统

约翰逊“不做历史罪人”让俄罗斯愕然，乌军多条战线击退俄军

马斯克：贪婪的最高表现是独载，权利才是剥削的最大根源！

朝鲜全新国家宣传曲公布：片中演员将金正恩称为父亲

欧盟泼脏水：中国在俄乌冲突中坐山观虎斗 还下场了

北京一四合院4.5亿元起即将开拍，3.6万余人围观，暂无人报名

很奇怪：面对油价上涨，为何油车车主都默不作声了，不在乎了吗？

一女子站在桥边哭泣留下手机，随后跳下河！

农业农村部：正会同有关部门编制逐步把永久基本农田全部建成高标准农田实施方案

上海世纪公园24小时开放首夜：游客不足百人，为谁留灯又为何熄灯

两大家族开撕？菲第一夫人公开指责副总统：不道歉，这事就没完

广交会吸引12万名境外采购商，俄罗斯客流显著增加

新华社快讯：据朝中社20日报道，朝鲜19日进行战略巡航导弹超大型战斗部威力试验和新型防空导弹试射

中国人民解放军信息支援部队成立大会在京举行

看到满满一车的坦克准备运往前线，绍伊古面带微笑表示感谢

商务部：1-3月全国吸收外资3016.7亿元人民币

这段视频看得生气！浙江一越野车驶入麦田来回碾压，车主找到了，他竟这样说

渣打在香港挂出10%的存款利率，以吸引内地资金

中国人为了争取双休日，花了40年

联合国安理会上，不满美以霸道行径，阿拉伯国家代表愤然离席

哈尔滨麦道啤酒被检出呕吐毒素，回应：符合国家标准

欧盟泼脏水：中国在俄乌冲突中坐山观虎斗还下场了