关闭广告

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技1004人阅读

有了 AI,科学研究是否有一天可以摆脱对湿实验的高度依赖,通过在计算机中构建“虚拟细胞”,来模拟和理解新药可能产生的生物效应?如今,这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 VCWorld,构建了如同“生物世界模拟器”的虚拟细胞模型,为新药效果预测开辟了全新的计算路径。


图 | 郑双佳(来源:郑双佳)

他告诉 DeepTech:“其核心技术在于,我们基于 AI 科学家系统,发展了一种大语言模型与知识图谱混合增强的预测方式。我们构建了一个知识图谱,将人类已知的知识,如药物与靶点的关系、靶点与疾病的关系等,以显式、结构化的方式建模起来。”


(来源:https://arxiv.org/abs/2512.00306)

VCWorld:像侦探一样推理的白盒模型

VCWorld 的突破在于,它不是一个只会猜测的黑盒子,而是一个能像生物学家一样推理的白盒模型。它把 AI 变成了一个细胞侦探,既可以给出答案,还可以给你查看它的破案笔记。

VCWorld 的核心思想非常巧妙:

首先是构建一个生物知识宇宙,整合多个权威的生物数据库,把药物、基因、蛋白质、信号通路之间的关系,像地图一样连接起来,形成一个巨大的生物知识图谱;

其次,使用语言模型来理解知识,让一个大语言模型来读懂生物知识图谱中的复杂关系,并使用人类可以理解的语言描述出来;

最后,像侦探一样检索和推理,当被问到药物 A 对于基因 B 有什么影响的时候,VCWorld 不是去直接猜测,而是在知识图谱里查找药物 A 的作用机制和基因 B 的功能,以及去历史档案也就是训练数据里寻找最相似的案例比如作用机制相似的药物 C 是如何影响基因B的,然后像撰写推理报告一样,一步一步分析这些线索,综合得出一个结论并解释为什么。

在论文里,郑双佳等人举了一个例子:预测抗癌药物 Larotrectinib 对于增殖标记基因 MKI67 的影响。MKI67 基因产生的蛋白叫做 Ki-67,是细胞正在活跃分裂的指示灯。如果一种药物能够抑制癌细胞分裂,那么 Ki-67 的水平通常会下降。


(来源:https://arxiv.org/abs/2512.00306)

虽然之前没有直接实验证明 Larotrectinib 会影响 MKI67,但 VCWorld 是的推理是这样的:

第一步,寻找相似药物,借此发现 Larotrectinib 是一种激酶抑制剂。在历史案例中,作用机制相似的药物 Afatinib(另一种激酶抑制剂)被证明能够降低 MKI67 的表达;

第二步,寻找共同模式,其他一些能够引起 DNA 损伤或者细胞应激的药物,也会改变 MKI67 的水平。这说明,凡是干扰细胞生长和分裂过程的扰动,都有可能影响这个指示灯;

第三步,得出结论也就是 Larotrectinib 很可能通过抑制肿瘤细胞的增殖信号通路导致 MKI67 的表达出现下降。

这个预测与后来查到的真实实验结果完全一致。此前有文献记载称,使用 Larotrectinib 治疗之后,Ki-67 阳性的增殖细胞确实显著减少了,这证明 VCWorld 的推理不仅准确,而且有着坚实的生物学逻辑。

郑双佳表示:“我们的整个预测过程逻辑链路非常明确。模型能够解释为什么我认为这个药物会在这个细胞系上引起这个基因的差异化表达,并提供一套可追溯的知识推理链条。这就将传统的、黑箱式的虚拟细胞预测,变成了一个白箱式的、引入了因果推理引擎的过程。”


(来源:https://arxiv.org/abs/2512.00306)

什么是虚拟细胞?

细胞是我们身体里最小的生命单位,就像一个超级迷你的工厂,里面有无数的机器也就是蛋白质在不停地工作。科学家们一直想弄明白的是:如果给细胞喂一种新药,会有什么反应?哪些基因会被激活?哪些会被抑制?这对于治疗疾病和研发新药至关重要。

传统方法是在实验室里培养真实的细胞,加入药物之后再使用昂贵的仪器来检测变化。这个过程不仅耗时和耗钱,而且每次只能测试有限的药物。于是,虚拟细胞的概念诞生了:能不能在电脑里建设一个细胞的数字模型,让 AI 来预测药物的效果?

其实,已经有不少 AI 模型尝试过这个任务。但是这些模型非常挑食,它们需要海量的高质量数据来训练,如果遇到一种全新的、训练数据里没有出现的药物,就有可能预测不准。而且,这些模型依旧存在黑盒问题。而 VCWorld 则解决了这些问题。

郑双佳表示:“虚拟细胞这个概念其实已有二三十年的历史。近年再次兴起,有几个重要原因:单细胞多组学测序技术在前几年取得了重大突破,无论是蛋白质组学还是其他组学,高通量检测设备的水平提高、成本下降、精度提升,使得多组学数据大量积累。有了海量数据,人们自然会想到能否用这些数据构建类似 ChatGPT 的模型,去理解细胞尺度的语言,而不仅仅是 DNA、RNA 序列层面的语言。”

他继续说道,目前的虚拟细胞模型更像一个疾病解码器或基于表型的建模工具。但基于表型建模的最大问题是难以逆向设计药物:假设知道药物A会产生某种扰动信号,但很难根据想要的信号反向设计出分子 A。这是基于表型的药物发现的一个固有弊端。

因此,他和团队正在尝试向药物设计方向进行反向推理。例如,基于某种特定的、非药物手段(如敲低某个基因)或疾病状态产生的扰动信号,基于所期望逆转的细胞状态,能否根据这个期望的响应,反向设计出一个能实现该扰动的分子?“这是我们正在努力探索的方向。”他表示。

参考资料:

相关论文

https://arxiv.org/abs/2512.00306

排版:KIK

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

布朗复出27+7绿军19分逆转双杀热火 西蒙斯39+7三分赛季新高

醉卧浮生 浏览 973

业界首款攻克全金属与信号共存难题?华为Mate 80系列外观公布

IT之家 浏览 1459

男子去理发结果给店家投40多万 自称不好意思拒绝别人

极目新闻 浏览 6703

2025年净利至少增超78%!减肥药价格战凶猛,甘李药业:相关产品未上市,价格策略待定

时代周报 浏览 984

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 1831

记者:拓王之战转播源取自现场大屏,所以直播视角混乱+回放过多

懂球帝 浏览 1816

华为手机星闪车钥匙在鸿蒙 6 系统落地,适配尊界、享界部分车型

IT之家 浏览 1756

广东3配角齐爆太惊喜!杜润旺陈家政三分即插即用,焦泊乔终暴走

篮球资讯达人 浏览 1070

被欠钱球迷去世5天后 前国脚戴琳还清欠款多给了5000

封面新闻 浏览 4505

俄代表:美国侵略委内瑞拉意味着"无法无天时代的回归"

环球网 浏览 3830

美股半导体板块,集体下跌

第一财经资讯 浏览 934

万亿豪赌:OpenAI结盟芯片、云巨头,AI生态闭环了吗?

澎湃新闻 浏览 1956

马卡:比利亚雷亚尔将免签21岁阿根廷边锋蒂亚戈-费尔南德斯

懂球帝 浏览 1275

46岁董璇被曝怀二胎,本人现身机场脱外套辟谣,小腹平坦状态超好

扒虾侃娱 浏览 1931

耗时3000小时 近40万美元拿下完美修复的路虎卫士

CLauto酷乐汽车 浏览 899

戴墨镜出席达沃斯会议后 马克龙的支持率提升

参考消息 浏览 3007

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 1952

或将于2027年发布 宝马iX3 M测试谍照曝光

车质网 浏览 1735

波音圣路易斯地区罢工持续近三月,谈判陷入僵局

国际金融报 浏览 1777

直播电商迈步“全链条监管”

北京商报 浏览 1063

灵鹊150无人机成功首飞

新华社 浏览 1074
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1