人类蛋白质组中,30–40% 的蛋白在生理条件下没有稳定三级结构。它们被称为固有无序蛋白(IDPs),参与信号转导、分子识别、细胞周期调控,与癌症、糖尿病、阿尔茨海默病密切相关。AlphaFold 对它们束手无策,传统分子动力学模拟又极其昂贵。
IDPFold 是专为 IDPs 设计的构象系综生成算法。它采用微调扩散模型,通过两阶段训练:先在 PDB 实验结构数据库预训练,再在 IDRome 大规模分子动力学轨迹数据集微调。模型直接从氨基酸序列生成主链级构象系综,无需 MSA,无需实验数据。

基准测试覆盖 27 个 IDP 系统。IDPFold 的回转半径(Rg)相对误差仅 −0.06,Cα 二级化学位移与实验值 RMSD 低至 0.65 ppm。这一精度显著优于所有现有生成式深度学习方法,媲美甚至超越传统全原子 MD 模拟。
对药物设计而言,IDPFold 的价值在于动态。静态结构预测只能看到蛋白的"快照",而 IDPFold 提供的是"电影"。无序蛋白与配体的相互作用、构象变化驱动的功能开关,现在可以被系统性地研究。这为针对 IDP 相关疾病的药物筛选提供了全新工具。
模型代码已完全开源,支持单条或批量 FASTA 序列推理。
该成果发表于 Advanced Science(2025)。
微信客服