
7月10日,微软研究科学团队发表了《科学杂志的结果》,名为“可扩展的联合蛋白质与广义深度学习的平衡”。 Document: https://www.science.org/doi/10.1126/science.adv9817code: github.com/microsoft/bioemu-benchmumuksColabfold Foundry: https://ai.azure.com/catalog/models/bioemu precision, opens a new way to understand protein functional mechanisms and accelerate biological发现。从结构性预测到功能模拟:诸如Alfafold之类的蛋白质研究模型的下一个边界已经在蛋白质结构的预测中取得了创新的进步,但是这些方法通常可以预测一种单个静态结构,这使得很难捕获蛋白质在功能过程中受到蛋白质受到的动态变化。在不断变化的构象集中发现蛋白质不是静态分子,它们的功能通常取决于这些结构之间的过渡tures。 Biom天生就是解决这个问题。当结合Alfafold数据库的静态结构时,超过200 ms的分子动力学模拟数据(MD)和500,000个实验蛋白稳定性数据,我们训练一个生成模型,该模型可以在单个GPU中每小时生成数千种独立的蛋白质结构。生成建模BioeMu正在Microsoft Research的Graphriboyional(DIG)图形刷(DIG)中进行初步工作。基于扩散模型的结构,可以从构象蛋白分布中有效地对其进行采样,并结合Alfafold不断发展的编码器和全面的方形采样技术。然后,共同创新是可以模拟在功能过程中蛋白质中发生的重要结构变化,例如隐藏的口袋,局部部署和域的重新定位。在自由能预测的术语中,1 kcal/mol的误差水平与MILIS的MD模拟非常一致与分子动力学的模拟相比,ECOND和实验数据达到了几个数量级。突变稳定性变化的预测(δ级别)非常出色,绝对平均误差低于1 kcal/mol,而Spearman的相关系数高于0.6。开源启动设备为Github和HuggingFace提供了参数和开源模型代码,并启动了超过100毫秒的MD仿真数据,这些数据涵盖了数千种蛋白质系统和成千上万的突变体,为随后的调查提供了丰富的资源。 BioEmu还可以在Azure AI Foundry和ColabFold等平台上实施,这使用户更容易执行模型。回到未来:从生物膜单体蛋白到最大系统的开源解放是一个关键的步骤,因此Microsoft促进了开放科学。当前,生物emu建模对象主要是单体蛋白。研究人员调查扩展n在更复杂的生物系统中,例如蛋白质复合物和蛋白质配体相互作用,并结合实验数据以进一步改善模型的概括和解释性。在蛋白质科学领域,药物和合成生物学的设计,生物EMU有望成为结构和功能,理论和实验之间的桥梁。