生物所基于人工智能预测模型实现异源蛋白的高水平表达

近日,生物所微生物蛋白设计与智造团队与国内外多家科研单位开展合作,成功构建人工智能预测模型MPEPE,基于深度学习和分子进化的策略模拟分析异源基因在大肠杆菌中表达,提高了异源蛋白在大肠杆菌中的表达量。该研究促进了对基因序列与蛋白可溶性表达之间关系的认识,并为酶蛋白的理性分子设计提供了新方法。相关研究成果发表在《计算与结构生物技术期刊(Computational and Structural Biotechnology Journal)》上。

酶蛋白是一类具有生物学功能的特殊材料,广泛用于工业、医药、农业、化学分析、环境保护、能源开发和生命科学研究等领域。实现酶蛋白的异源高水平表达对于酶的理论研究及大规模工业化生产都非常重要,但目前相关理论基础尚不明晰,对酶蛋白定向设计的方法仍然缺乏。当前,以深度学习为代表的计算技术不断突破, 为提升酶蛋白异源表达量的分子设计提供了新思路。

本研究尝试采用深度学习和分子进化相结合的研究手段,构建了基于多层深度神经网络(DNN) 的预测模型MPEPE,并选择6438种在大肠杆菌中已知表达量的蛋白对该模型进行训练。分子进化分析显示,该模型可虚拟筛选出可提升酶蛋白异源表达量但不会破坏酶功能的突变位点。将该策略应用于漆酶13B22 和葡萄糖脱氢酶(FAD-AtGDH) 两种酶蛋白的异源表达时,发现分子设计的多点突变体可大幅度提升其在大肠杆菌中的可溶性表达量。这些结果进一步表明MPEPE策略的有效性,可应用于外源蛋白表达量的分子设计。

生物所博士生丁尊丹和关菲菲博士为本论文共同第一作者,生物所田健研究员、北京畜牧兽医研究所黄火清研究员,以色列特拉维夫大学Tamir Tuller 教授为论文的共同通讯作者。该研究得到国家重点研发计划、中央公益性科研机构基础研究基金的资助。

微信图片_20220303181347_1.jpg

基于深度学习和进化分析的高表达异源蛋白分子设计流程MPEPE

原文链接:https://doi.org/10.1016/j.csbj.2022.02.030