Bulling牛财金
新闻详情

MIT及哈佛联手企业联盟公开大规模细胞表型数据库

发表时间:2023-03-07 16:59作者:白州
如何发现并建立一种新型的药物或疗法?这是所有生物技术或制药公司长期面对的基本问题。

总体而言,当前的药物发现方式有两种:基于靶点的方法和基于表型的方法。其中,基于靶点的药物发现(Target-based Drug Discovery,TDD)需要率先了解致病机制或针对相关通路展开探索;而基于表型的药物发现(Phenotypic Drug Discovery,PDD)重点则在于识别出可改变细胞表型的化合物。

相较而言,后者更加乏味耗时、且成功率不高,这些客观因素导致基于靶点的药物筛选在过去的几十年间形成了主流。不过近年以来,随着细胞表型筛选技术、CRISPR-Cas 技术、类器官和成像分析技术等领域的飞速发展,表型药物发现方法重新回到了人们的视野。


对此,来自哈佛和麻省理工学院博德研究所的一组研究人员基于先进的机器学习方法,创建了表型分析技术“Cell Painting”。该技术旨在通过高通量成像实验生成大规模的多维数据集,其中包含每个细胞的可量化表型信息。基于这些图像信息,研究者可以使用深度学习等方法识别出化学或遗传扰动产生的影响,从而探究各种疾病的病因和治疗方法。

近期,由部分国际知名的生物技术企业的 “Cell Painting” 数据汇总并创建的大型数据库 JUMP Cell Painting Datasets 正式向公众开放。对此,创建该数据库的生物技术企业联盟表示,希望数据库能够帮助研究人员识别有潜力的化合物,并且在进入动物或人体试验之前对于目标化合物的功能,及潜在副作用进一步了解,最终加速药物发现进程。


早在上世纪 80 年代左右,受限于当时的生物科学技术水平,人们对于疾病的认知普遍停留在表型层面,很难建立其与靶点之间的关联。因此,大多数早期药物的发现主要是依靠表型药物发现方法(PDD)。

对于 PDD 模式而言,其工作重点在于评估某一化合物能否在生理模型中显示出预期的反应。这就需要研究者开展大量细胞实验,然后通过比较图像变化从而获得结果——比如荧光标记蛋白的变化,或者分裂细胞数量减少等等。可想而知,这些庞杂的工作既乏味又耗时,而且十分容易失败,因为可能导致的结果完全是随机的——研究人员也不确定究竟是哪一部分图像会发生变化。

由此也就不难理解,在过去的几十年间,基于靶点的药物发现(TDD)模式发展成为了药物发现领域的主流。由于靶点明确,对于该方法而言,药物发现的时间、过程和所需资源都是可以预测的。

然而,随着可用靶点的挖掘工作逐渐进入瓶颈,研究者逐渐意识到,单一的发现模式并不足以解决所有问题。因此,建立在生物系统之上,与疾病直接相关的表型筛选模型再次得到重视。

图丨基于图像的形态学分析策略概述(来源:Nature Protocols


在表型筛选模型中,目标化合物将直接“访问”相关的生物系统或细胞信号通路从而产生结果。“一切与靶点无关”,这是其与靶点发现模式的根本区别。不过,如何在海量图像中准确识别并抓取有效数据,仍是该领域发展的关键所在。

2013 年,来自博德研究所的一组研究人员于 PLoS ONE 在线发表论文,提出使用多达 6 种荧光染料来为细胞的主要成分“上色”,包括细胞核、内质网、线粒体、细胞骨架、高尔基体和 RNA。然后使用显微镜捕捉这些带颜色的图像,并通过软件测量其形态学特征从而绘制出细胞表型“指纹”,用其指示细胞所处的不同生理学状态。最终,使用基于 AI 的图像分析技术比较试验前后的图像变化,以评估分子或遗传干扰所产生的的影响。

“测量一切,继而评估”,这一思路很好地概括了 “Cell Painting” 的基本工作方式。特别是随着机器学习技术与各类分析方法的不断发展,研究人员能够以更轻松的方式获得大规模的生物信息数据。

2016 年,该方法被正式命名为“Cell Painting”,该技术由博德研究所的 Carpenter–Singh 实验室主导。其中,该实验室的领导者之一、计算生物学家 Anne Carpenter 表示,这“几乎是管理起来最简单的成像分析”。作为该方法的开发者之一,她强调,“我们的任务是选择最便宜、最简单的染料。”


该技术一经发布便受到了部分国际知名药企的追捧。在此之后,引入 “Cell Painting” 技术的制药公司共同成立了名为 JUMP–Cell Painting 的联盟,并将各企业的 “Cell Painting” 数据资源进行了汇总并创建成为一个大型数据库 JUMP Cell Painting Datasets,该数据库现已在 github 网站上线。据悉,数据库中包含了细胞对于 140,000 余种扰动做出反应的图像,包括药物治疗或其它一些可以提高或降低基因活性的修饰。



现阶段,越来越多的药物开发公司开始重视并积累来自各个维度的细胞数据,然后将其应用于机器学习。特别是对于表型分析而言,尽管目前看来该方法可能具备巨大的价值,然而研究者同时指出,该方法在分析软件方面提出了相当高的准入门槛。例如需要仔细研究分析方法,从而规避可能存在的过度拟合、数据混杂以及偏差等风险,这将有可能提高其后期的运算成本。

基于该数据集,Carpenter 和她的同事已经发现了十几种可能对肌肉癌造成影响的化合物。在此之后,Carpenter 计划与其合作者共同创办一家公司,以便进一步开发其中最有前途的候选化合物。

同样值得关注的还有新药研发企业 Recursion Pharmaceuticals。在 2014 年公司创立初期,Anne Carpenter 曾在该公司担任科学顾问。在她的帮助下,Recursion 很快基于表型组学分析技术建立起了药物发现平台 Recursion OS。发展至今,该公司已经建立起十余项涉及肿瘤学、神经科学、炎症和免疫学以及罕见病领域的研究项目,其中已有 5 条管线进入临床试验阶段。



在本次数据库公开发表之后,JUMP-Cell Painting 联盟还宣布将与华盛顿特区的健康与环境科学研究所开展合作,以期将 “Cell Painting” 数据与其它类型数据相结合,从而用于预测药物和农用化学品的毒性。

参考资料:
1.https://doi.org/10.1371/journal.pone.0080999
2.https://doi.org/10.1038/nprot.2016.105
3.https://www.technologyreview.com/2023/03/03/1069261/a-technique-called-cell-painting-could-speed-drug-discovery/
4.https://github.com/jump-cellpainting/datasets
5.https://jump-cellpainting.broadinstitute.org/partners


相关阅读

两家著名的细胞治疗公司合并,一家涨47%,一家跌28%

分享到:
会员登录
登录
其他账号登录:
我的资料
留言
回到顶部