蛋白质功能改造开篇-定向进化

定义:

定向进化是在实验室中模拟达尔文进化过程,通过随机突变和重组,人为制造大量的突变体,按照特定的需要和目的给予选择压力,筛选出具有期望特征的蛋白质,实现分子水平的模拟进化。

异议:

目前大部分学者认为定向进化与半理性设计、理性设计等概念是并列关系。强调定向进化是基于酶的结构、催化机理等信息未知的情况下通过诱变、易错PCR、 DNA重组、定点饱和突变等技术创建序列多样的随机突变体文库,并通过给予一定选择压力或条件,筛选出具有期望特征的突变体。而理性设计和半理性设计则是基于对酶的序列、结构、催化机理具有一定理解之后进行的有目的性的改造。该观点更多的是将定向进化的概念偏向于非理性设计。

笔者对这样的观点存在一些异议,认为定向进化应该是个总领性的概念,只要是有目的性的对目标酶的特定功能进化改造,都应称作定向进化,区别在于基于的信息和使用的手段。即定向进化包括非理性设计、半理性设计和理性设计。

非理性设计:

一般采用易错PCR、 DNA重组等技术,该方法旨在构建庞大的突变体文库并从中筛选阳性突变体。尽管有些声音认为该方法工作量大,效率低,将被淘汰。但是笔者认为,没有不合适的方法,只有不合适的应用。如果能配套理想的高通量筛选方案,非理性设计依然是不错的手段。例如利用营养缺陷型宿主的生长状态评估酶活;利用产物或者底物对宿主细胞的毒性(影响生长)判断酶活(生长耦合高通量筛选法);利用荧光蛋白作为报告基因改造启动子等基因调控元件。

理性设计:

该方法对蛋白的理化性质、三维结构、构效关系、催化机理等信息要求比较高,对计算机辅助设计依赖较大。目前分子对接、分子动力学模拟、量子力学等计算技术的发展为蛋白质全理性设计奠定基础。笔者认为蛋白质从头设计也应归类为理性设计,该方法主要通过催化空间结构的预制、蛋白支架选择、能量计算等过程,从头设计预制功能的蛋白。但是由于该方法对信息和技术的要求较高,实现困难较大,目前使用单一理性设计实现蛋白质功能改造的例子不多,利用从头设计获得蛋白质功能提高的成功案例也较少。

半理性设计:

对蛋白的理化性质、三维结构、构效关系、催化机理等信息有一定理解的基础上,在计算机辅助下,对活性中心或者活性口袋的热点氨基酸进行定点突变、饱和突变、组合突变。该方法介于非理性设计和理性设计之间,克服了两者的缺点,降低了技术需求。构建一定规模的突变体(~104),利用合理的高通量筛选方法,就能快速获得目标突变体。目前,该方法应用最广泛,成功案例最多。

最近两年,机器学习在蛋白质设计领域风生水起,作为一项技术,本文不对其进行分类,仅仅是一项蛋白质定向进化的技术。机器学习对数据量的要求较大,在蛋白质序列和结构方面的应用较为成熟,但是在结构和功能方面的应用面临较大的障碍,主要是样本量小的问题,需要配合极高通量获得改造数据。该方法强调输入和输出,是一种黑箱模型。其全面、广泛应用于蛋白质功能改造,还需要很长的路要走。

PS: 笔者在蛋白质改造中比较倾向于半理性设计,理性设计对个人计算能力和硬件算力要求较高,同时比较耗时。就拿定点饱和突变举例子,往往实验都做完了,计算结果可能都没出来。不过,湿实验与干实验结合必定是未来很长一段时间最高效的进化方法。期待机器学习在蛋白质定向进化中有所突破,有朝一日解放双手。

编辑于 2022-04-15 17:31