多肽药物设计长期面临一个结构性难题:如何让小分子的结合智慧"迁移"到多肽序列上?传统多肽生成模型依赖序列语言模型或结构预测,缺乏对靶标-配体相互作用模式的显式学习。
PharmaPepGen 是业界首款基于药效团引导的图扩散多肽生成模型。输入不是序列,而是小分子药效团的 3D 特征——药效团类型、空间坐标。输出是匹配目标理化性质与结合模式的多肽序列。图卷积网络负责学习靶标口袋与小分子配体的相互作用模式,扩散模型负责在该模式下生成多肽。
模型基于约 360 个晶体复合物结构训练。测试集上,对每个靶标生成 10 条序列,高度亲和序列的平均 ipTM 达到 0.79,接近天然配体水平(0.83)。这意味着生成的多肽不仅序列合理,而且与靶标的结合姿态可信。
在工业落地中,PharmaPepGen 已支撑超长效 GLP-1 受体激动剂的设计。团队生成 10,000 条全新序列,筛选 60 条候选肽,体外实验成功率 52%。候选肽 D13 的半衰期达到司美格鲁肽的 3 倍,糖尿病小鼠模型中降糖效果更优。
靶向多肽发现、环肽设计、口服多肽先导化合物生成——PharmaPepGen 将"小分子结合逻辑"与"多肽成药性"打通,实现了跨模态的定向设计。
微信客服