De novo 设计
蛋白质设计是蛋白质工程的一个基本方面,具有广泛的应用,例如抗体、肽和酶。蛋白质设计包括三个步骤:指定热点结合位点、蛋白质主链骨架生成和固定主链骨架序列设计
图1. 蛋白质设计的工作流程:指定所需功能、蛋白质主链骨架生成和固定主链骨架序列设计
热点结合位点搜索/预测
识别这些热点对于理解蛋白质功能和设计蛋白质至关重要。智药元创使用ScanNet从3D结构中检测蛋白质-蛋白质和蛋白质-抗体结合位点。
蛋白质主链骨架生成
蛋白质主链骨架生成办法
蛋白质主链骨架生成可以分为两种不同的类型:无条件生成和条件生成(基于motif功能位点)。智药元创使用蛋白质语言模型作为监督,开发了GPDL模型,用于精确和高效的功能motif设计。GPDL在24个通用案例的功能motif设计任务中的成功率最高。
图2. GPDL的框架
蛋白质主链骨架生成方法的严格评估
智药元创开发了一个统一的框架,用于评估主链骨架生成方法的性能。该框架系统评估了无条件生成和基于功能motif的有条件生成。表1显示了代表性蛋白质主链骨架生成方法的性能及适用范围。
无条件生成
智药元创评估了无条件生成模型在设计性、多样性、新颖性、效率和结构特性等指标。FrameFlow和Genie方法在生成短蛋白质上表现最好,RFdiffusion方法在生成长蛋白质方面表现出色。
图3. 无条件生成的评估结果
基于motif功能位点设计
对于条件生成,智药元创在24个通用案例中进行了全面实验。GPDL展示了表现最好,平均成功率最高。
图4. 基于24个案例的成功率与多样性总体分布