你知道吗?过去研发一款新药平均要花10年、投入数十亿美元。而现在,AI正在让这一切“提速”。这篇文章将带你看清:AI如何帮助科学家更快找到候选分子、预...
2025-10-09 0
你知道吗?过去研发一款新药平均要花10年、投入数十亿美元。而现在,AI正在让这一切“提速”。这篇文章将带你看清:AI如何帮助科学家更快找到候选分子、预测药效、副作用,甚至提前判断临床试验成功率。
传统药物研发是高投入、长周期、低成功率的投资。一款新药从最初到最终获批上市,平均要走10-15年的漫长周期,而背后投入的资金更是惊人,平均成本超过20亿美元,而即便投入了如此多的时间和金钱,最终能成功通过临床试验、真正惠及患者的药物,比例不足10%,超过90%的研发项目会在某个环节失败,前期的投入也付诸东流。这不仅让药企背负着巨大的资金和时间压力,更让无数急需新药的患者在等待中失去生命。
随着高通量测序、冷冻电镜等技术的发展,我们产生数据的能力,已经远超我们依赖传统方法去理解和诠释它的能力。目前生命科学研究的瓶颈已经从“如何获取数据”转向“如何充分利用数据”。而AI通过对生物医学数据(如基因序列、蛋白质结构、临床试验数据等)的分析,尤其是在最关键的早期发现阶段(比如药物靶点筛选、候选分子设计),AI能快速从复杂的生物网络中锁定潜在靶点,甚至根据靶点特性定制出具有高活性、低毒性的分子结构,这相当于省去了过去非常多的试错过程,直接打破了传统药物研发的效率瓶颈。
基于当前AI在生命科学领域的发展,英矽智能的Pharma.AI平台、微软TamGen平台已经为靶点发现和分子设计提供了可能,通过数据驱动与生成式AI技术,从根本上突破了传统研发的效率瓶颈。
本文将探讨AI加速药物研发的方式,并结合最新的研究进展、关键技术平台和产品化思考,如有同道中人愿意一起讨论,也欢迎提出宝贵的建议。
药物靶点是药物分子在体内的结合位点,通常是与疾病发生发展密切相关的蛋白质或核酸。传统方法常常聚焦在少数几个明星通路,导致研发扎堆,且难以发现真正新颖的靶点。AI产品通过整合海量的、异构的生物医学数据,构建一个动态的、可计算的知识网络,并利用AI算法在网络中发现新的、与疾病强相关的潜在靶点。
构建数据整合与知识图谱
产品后台需要一个强大的数据管道,能够接入并处理来自全球公共数据库的数据,像BenevolentAI和Insilico Medicine等公司已经构建了这样的平台。包括:基因组学/转录组学、蛋白质组学与互作网络、文献与专利、临床试验数据。
利用自然语言处理(NLP)技术,特别是命名实体识别(NER)和关系抽取(RE),从论文中自动抽取出“基因-疾病”、“蛋白-蛋白”、“药物-靶点”等关系。这些关系与来自结构化数据库的信息一起,被编织成一个庞大的知识图谱。
Insilico Medicine是一个标志性案例。他们利用AI平台,通过分析大量组学数据和文献,发现了一个与特发性肺纤维化(IPF)相关的新型抗纤维化靶点。基于此靶点,他们又利用AI设计了候选药物分子,该药物已进入临床试验阶段。这一成果发表在 Nature Biotechnology上,标题为 “A small molecule TNIK inhibitor targets fibrosis in preclinical models”,展示了从AI靶点发现到AI药物设计的完整链条。
下图是该文献的内容截图。
靶点确定后,下一步就是设计能够与之结合并发挥药效的分子。传统方法主要依赖高通量筛选,在庞大的化合物库中测试,不仅效率低而且成本高。AI产品在此阶段的核心是生成与评估,AI不仅要能设计出全新的、结构合理的分子,还要能快速预测这些分子的多种关键属性,从而指导生成过程。
分子除了能结合靶点之外,还必须具备良好的药代动力学特性,即ADMET(吸收、分布、代谢、排泄、毒性)这是判断候选药物 “安全有效质量可控” 的核心标准:比如 “吸收” 决定药物能否被人体有效摄入;“分布”指药物在体内的分布,来评价靶向药的靶向效果;“代谢” 影响药物在体内的作用时长;“毒性” 更是直接关系用药安全。传统研发中常因 ADMET 特性不达标,导致候选分子在临床后期甚至上市后被淘汰,前期投入全部沉没。
而AI的介入,彻底改变了传统依赖动物实验、体外实验逐个测试、周期长、成本高的模式。AI通过在大型ADMET实验数据库上训练,AI模型能直接根据分子的二维结构(如化学键连接方式)或三维构象(如空间折叠形态),快速预测出溶解度、肠道渗透性、肝脏代谢稳定性、CYP450 酶抑制率、心脏毒性(如 hERG 通道抑制)等数十种关键ADMET属性。
蛋白质的三维结构决定了其功能,也是结构化药物设计的基础。通过X射线晶体学或冷冻电镜等实验方法解析蛋白质结构,过程昂贵且耗时,且对许多蛋白质(如膜蛋白)来说极其困难。
AI从氨基酸序列高精度预测蛋白质结构,对于大量过去因缺乏结构信息而难以设计的靶点,研究者现在可以利用AlphaFold2预测的结构,进行虚拟筛选和从头设计。可以快速模拟致病基因突变如何改变蛋白质的结构和功能,为疾病机理研究和精准治疗提供意见。AI的下一个前沿是预测蛋白质-蛋白质相互作用(PPI)、蛋白质-配体复合物的结构,这将进一步颠覆药物设计领域。
将这些强大的AI技术转化为研究人员日常使用的、稳定可靠的产品,是一项充满挑战但意义非凡的任务。这要求我们不仅要懂算法,更要深刻理解科研工作流的痛点。
目前存在的主要难点有:AI模型的性能高度依赖于训练数据的质量,当前生物医学数据来源多样,格式不一,存在大量批次效应。构建强大的、自动化的数据清洗、标准化和整合管道,是所有上层应用成功的基石。其次是模型的可解释性与可信度问题, 科学家不仅想知道AI的预测是什么,更想知道为什么。对于一个新发现的药物靶点,如果AI无法提供其背后的生物学证据链,研究人员就很难信任并投入资源进行后续验证。因此,发展和应用可解释性AI(XAI)技术至关重要。
当前多数AI应用仍停留在发现相关性。下一个突破将是构建能够进行因果推断的AI工具。这样的产品将能模拟虚拟实验,预测对系统进行特定扰动(如敲除一个基因、施加一种药物)后会产生什么后果,从而以更高的效率指导实验设计。
基于目前多模态的发展成熟,未来的AI产品将能更深入地整合来自不同维度的数据——空间组学、单细胞多组学、组织病理图像、患者电子病历(EHR),从而实现对疾病机理更全面的理解和更精准的干预策略设计。
AI并非要取代科学家,它将人类科学家从繁重、重复的数据处理和模式识别任务中解放出来,让我们能专注于更具创造性的工作:提出深刻的科学问题、设计巧妙的实验、并对AI给出的结果进行批判性的思考和诠释。
本文由 @乔安Joanne 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
相关文章
你知道吗?过去研发一款新药平均要花10年、投入数十亿美元。而现在,AI正在让这一切“提速”。这篇文章将带你看清:AI如何帮助科学家更快找到候选分子、预...
2025-10-09 0
湖北日报评论员 常少华当地时间10月6日,诺贝尔奖委员会在公布今年诺贝尔生理学或医学奖的获奖者后,却无法联系上获奖者之一:美国科学家弗雷德·拉姆斯德尔...
2025-10-09 0
证券日报网讯 立昂技术10月9日在互动平台回答投资者提问时表示,立昂云数据(四川)有限公司已成功入库国补算力供给单位。作为国补算力供给单位,公司具备为...
2025-10-09 0
证券日报网讯 英思特10月9日在互动平台回答投资者提问时表示,稀土永磁材料一体化应用项目已在包头市高新区正式开工,目前正处于基础建设阶段,各项工作均在...
2025-10-09 0
证券日报网讯 兆驰股份10月9日在互动平台回答投资者提问时表示,公司在MicroLED光互连领域目前处于研发阶段。公司旗下兆驰半导体在LED芯片端已具...
2025-10-09 0
小米继在海外发表15T系列后,正式于中国市场公布了小米17系列手机。 据了解,此系列命名为「17」是为了与 iPhone 17 系列展开正面竞争。小米...
2025-10-09 0
都知道接下来的这波骁龙8 Elite Gen5子系旗舰都很猛,但没有相对真我GT8 Pro会这么猛,因为真我官宣和理光GR达成影像战略合作,小米徕卡、...
2025-10-09 0
今天分享的是W1-W39(2024.12.30-2025.9.28)国内手机激活量榜单,从时间上来看大致可以理解为前三季度,而激活量和销量是比较接近的...
2025-10-09 0
发表评论