发布信息

从基因到生产线:重组蛋白生产的高通量工艺开发全流程策略

作者:本站编辑      2026-05-20 14:58:47     0
从基因到生产线:重组蛋白生产的高通量工艺开发全流程策略
欢迎加入“艺药荟”知识星球,享有全部资源!

经典阅读:

摘要

在后基因组时代,公共实验室和工业界对更快、更高效的蛋白质生产的需求均有所增长。与此同时,随着数据库中蛋白质序列的不断扩展,在特定应用中可能具有研究价值的酶的范围也在持续扩大。面对同行竞争、预算限制以及时间紧迫的压力,各类公司和研究机构必须寻找有效方法,以开发用于重组蛋白生产的稳健生产工艺。在本综述中,我们系统探讨了当前用于重组蛋白表达的高通量技术,并提出了一种涵盖从基因到蛋白质全过程的整体性高通量工艺开发策略。此外,我们还讨论了该领域面临的主要挑战、已有研究的局限性以及未来的发展方向。

NO.1】背景

重组蛋白已被广泛应用于食品、化工、生物制药和生物材料等多个行业。根据最新的蛋白质表达市场研究报告,全球蛋白质表达市场正在迅速扩张,尤其是在新冠疫情爆发之后。2022年,该市场规模估值为31.8亿美元,预计从2023年到2030年将以9.36%的复合年增长率持续增长。传统上,重组蛋白生产的工艺开发遵循数十年建立的标准流程。该流程通常包括通过反复试验从现有表达工具包中选择合适的遗传元件,然后在摇瓶、微量滴定板或实验室规模生物反应器中逐一优化与工艺相关的参数。毫无疑问,这是一种耗时的过程,一种蛋白质从实验室研究发展到工业生产往往需要数年时间。然而,后基因组时代对快速蛋白质生产的需求促使研究人员对先前的工艺开发策略进行重塑和优化。为满足这一需求,实验室和企业开始将高通量技术整合到工作流程中。这种整合不仅加速了重组蛋白的生产,还简化了从基因到蛋白质的整个过程,从而构建了一个更加全面、高效的工艺流程。

在过去几十年中,研究人员已开发出多种方法用于实现菌株的高通量构建。高通量蛋白质检测方法与培养平台(如微量滴定板、微生物反应器和平行发酵系统)的整合,使得培养、筛选和优化过程更加高效。此外,采用新颖的工艺优化策略也显著缩短了工艺开发的时间。在此,我们综述了学术和工业实验室为加速蛋白质生产所做的调整与发展,并提出了一种从基因到蛋白质的整体高通量开发策略,以确保蛋白质生产过程的稳健性和经济高效性。

NO.2】菌株文库的高通量构建

目前,研究人员已开发出包括细菌、酵母、昆虫和哺乳动物细胞在内的多种表达系统,用于重组蛋白的生产。由于目标蛋白可能具有不同的来源和特性,预测最佳表达系统仍然具有挑战性,且往往伴随着大量的试验和错误。此外,即使选定了表达系统,如何选择合适的表达元件(如启动子和信号肽)仍然是一个难题。为了最大化蛋白质产量,建议构建一个具有遗传多样性的文库,即包含大量起始菌株的群体。迄今为止,已开发出多种用于表达菌株文库高通量构建的方法,包括随机诱变、实验室进化、人工合成、基因敲除和过表达等。其中,通过表达元件的组合构建克隆文库是最常用的方法,它能够实现对蛋白质表达元件的系统优化。

因此,针对给定的蛋白质序列,可以通过启动子、信号肽、目标基因序列和宿主细胞的不同组合,构建出数量高达n≥1000的克隆文库,以筛选出最佳的候选菌株(图1)。多年来,研究人员已开发出多种DNA组装技术,以简化和降低表达载体的构建成本。根据基本原理,这些方法主要分为以下三类:基于限制性内切酶的克隆、基于重组的克隆以及不依赖连接的克隆。

2.1 基于限制性内切酶的克隆

基于限制性内切酶的克隆是一种经典且广泛使用的分子克隆方法,其过程包括用限制性内切酶消化DNA,随后将所得片段进行连接。几种常见的系统,如Flexi Cloning系统和GoldenGate,均基于这一原理。2003年,Knight, T. 在提出用于生物部件物理组装的BioBrick标准时,这种方法重新引起了广泛关注。BioBrick标准要求每个BioBrick部件包含两个特殊序列,即前缀和后缀序列,其中分别包含用于EcoRI/XbaISpeI/PstI的限制性内切酶识别位点。在这些酶中,XbaISpeI属于同尾酶,能够实现多个BioBrick部件的组装。BioBrick组装的关键创新在于,任何两个BioBrick部件都可以进行组装,且所得的复合物本身也是一个可以再次组装的BioBrick部件。后来,在2011年,Shetty等人在此基础上进一步开发了三抗生素组装方法,用于构建BioBrick部件。3A组装需要三个质粒参与分子克隆,且目的质粒必须携带与其他两个质粒不同的抗生素抗性基因。图2展示了3A组装的示意图。最终,通过基于抗生素抗性的正负筛选,可以轻松获得阳性克隆。与传统的基于限制性内切酶的克隆方法相比,3A组装省去了质粒构建过程中诸如柱纯化和琼脂糖凝胶纯化等耗时费力的步骤,从而提高了分子克隆的通量。该系统还支持遗传元件的迭代组装,使其成为重组蛋白生产中表达元件组合高通量构建的理想工具。然而,3A组装的使用会引入两个额外的氨基酸,这限制了其在需要严格控制蛋白质序列的情况下应用。

2.2 基于重组的克隆

重组克隆系统的发展极大地改变了多质粒构建的方式。其中,Gateway系统可能是最成功且应用最广泛的技术。该技术利用最初在λ噬菌体中发现的位点特异性重组系统,在两个带有侧翼兼容重组附着位点的载体之间转移异源DNA序列。为了进一步提高Gateway克隆的通量和特异性,研究人员进行了一些改进,例如改变att位点的序列或长度,以实现多个基因或片段的同时克隆。然而,该方法的广泛应用受到高成本的限制。为解决这一问题,Zhang等人开发了一种名为SLiCE(无缝连接克隆提取物)的替代重组克隆系统。该系统直接利用从表达λ原噬菌体Red/ET重组系统的大肠杆菌DH10B菌株制备的细胞裂解物中的同源重组活性,能够在单个体外反应中将多个DNA片段组装到载体中。Motohashi进一步改进了该方法,通过直接利用几种常见实验室RecA⁻大肠杆菌菌株(包括DH5αJM109DH10BXL10-goldMach1T1)的细胞裂解物来实现克隆(图3A)。由于SLiCE方法不需要使用限制性内切酶和连接酶,且许多标准实验室细菌菌株均可作为SLiCE提取物的来源,因此SLiCE已成为一种简单、高效且超低成本的替代商业试剂盒的方法,适用于高通量克隆。

重组菌株文库的构建。根据试错原则构建大量重组菌株,以实现最有效的表达组合。在此例中,考虑了五个启动子、五个信号肽、四种靶基因优化方案和宿主菌株的五种表型,以筛选最佳克隆候选物。

2.3 不依赖连接的克隆

不依赖连接的克隆是三十年前开发的一种方法,在生成包含单链互补末端的DNA序列后,能够实现对任何片段的定向克隆。LIC方法主要利用T4 DNA聚合酶或T5核酸外切酶的核酸外切酶活性,生成单链互补末端。在此,我们以基于T4 DNA聚合酶的LIC为例,展示了生产重组DNA的示意图(图3B)。由于LIC不需要限制性内切酶、连接酶或重组酶,因此成为一种廉价且易于应用的高通量克隆方法。迄今为止,已开发出多种基于LIC原理的商业试剂盒,包括ClontechIn-FusionNEBGibson Assembly。后来,为了进一步提高LIC的通用性和效率,研究人员开发了一些改进方法,如序列和连接不依赖克隆、改进的SLIC、基于切口内切核酸酶的LIC以及基于尿嘧啶切除的克隆。近年来,LIC与自动控制设备及微孔板的结合进一步提高了基于LIC的质粒构建效率。

用于组装BioBrick部件的3A组装过程示意图。为进行3A组装,目的质粒、上游部件质粒和下游部件质粒必须彼此具有不同的抗生素抗性标记。缩写说明:A=氨苄青霉素抗性基因,K=卡那霉素抗性基因,C=氯霉素抗性基因,S123=序列123E=EcoRIX=XbaIS=SpeIP=PstI3A组装过程如下:用EcoRISpeI消化上游部件质粒;用XbaIPstI消化下游部件质粒;用EcoRIPstI消化目的载体。随后将所有消化后的质粒混合、连接,并转化至补充有与目的载体抗性标记对应的抗生素的固体平板上进行筛选。疤痕代表混合的XbaI/SpeI位点。

NO.3】蛋白质表达的高通量分析技术

高通量蛋白质表达分析在工艺开发的早期阶段具有重要意义。然而,对于许多重组蛋白而言,其表达水平的准确定量仍然依赖于劳动密集型的SDS-PAGE分析,特别是对于那些缺乏特异性检测方法的蛋白。尽管已有几种高通量蛋白质分析平台,如Octet™LabChip GXII,但仍处于早期采用阶段,尚未广泛普及。对于大多数实验室来说,高通量蛋白质分析的常用方法是将目标蛋白质与荧光蛋白融合表达。由于其分子量小且荧光强度高,维多利亚水母绿色荧光蛋白及其突变体,如增强型绿色荧光蛋白和超折叠GFP,被广泛用作融合标记。例如,Kovačević及其同事的研究将葡萄糖氧化酶的活性与GFP荧光相关联。近年来,还开发了分裂EGFP技术。该技术不是使用全长GFP,而是将GFP分成多个片段,使目标蛋白仅与一个小的GFP片段融合,从而最大程度减少对目标蛋白活性的干扰。该系统已成功用于大肠杆菌中热稳定酯酶Aaeo1表达文库的高通量检测。另一种替代策略是基于双顺反子设计的与荧光蛋白的转录融合,其中目标基因的翻译与编码荧光蛋白的报告基因相偶联。该系统允许通过监测荧光强度来检测目标蛋白的表达,而无需在目标蛋白中引入额外氨基酸。此外,荧光激活和吸收转移标签的使用也成为高通量蛋白质分析的另一种新型替代方法。FAST标签可以连接到目标蛋白上,实现快速、特异性和高灵敏度的检测,从而提高高通量蛋白质表达分析的效率和精度。

3 SLiCE方法和LIC方法的示意图及原理。 (A) SLiCE克隆概述。目标基因两侧带有15-19 bp的重组位点。实验室大肠杆菌菌株中同源臂之间的SLiCE介导的重组生成最终载体。(B) 通过LIC克隆生产重组DNA的示意图。线性化的表达载体和含有互补末端的目标基因经T4 DNA聚合酶消化,退火后转化至大肠杆菌中进行体内连接。

尽管融合表达策略方便且准确,但在检测半衰期短的瞬时表达或快速降解的蛋白质方面仍存在局限性。为克服这一问题,研究人员已开发出如STEP传感器等生物传感器,为蛋白质表达的高通量检测提供了解决方案,特别是对于瞬时表达的蛋白质。

3.1 高通量培养平台

由于其耗时且成本高昂的特性,开发一个可靠且具有成本效益的高通量培养平台至关重要。在过去几十年中,研究人员已开发出各种小型化培养设备,能够在毫升、微升甚至皮升规模上进行培养。这类设备的一个典型例子是基于微流控的培养系统。迄今为止,已开发出各种微流控生物反应器、单细胞栖息地、捕获腔和培养室。根据细胞的自由度,这些微流控培养设备可分为不同维度(从0维到3D)(图4A)。尽管具有优势,但基于微流控的培养系统由于使用连续单相流而增加了污染风险。为克服这一问题,研究人员进一步开发了微滴技术(图4B)。通过将载液与培养基分离并将微生物细胞封装在液滴中,微滴技术有效消除了污染。这些创新的微滴系统已成功用于微生物富集、菌株的高通量表征和筛选、适应性进化等领域。另一个具有代表性的培养平台是微升级别的微孔板系统。MTPs的高通量、易操作以及低成本优势使其成为广泛使用的培养平台。迄今为止,已开发出多种规格的MTPs,且许多辅助设备如移液机器人、自动进样器和微孔板读数器已实现与MTPs的兼容。MTPs现已成为用于菌株培养的摇瓶的廉价替代品。

为了更好地满足蛋白质生产高通量工艺开发的需求,研究人员还开发了大量小型化生物反应器,如微型10毫升搅拌罐生物反应器、10毫升规模微生物反应器、5毫升Applikon微反应器、3毫升Biocurve以及μ-生物反应器系统BioLector,其中部分已成功实现商业化。在表1中,我们列出并比较了几种商业小型生物反应器系统。根据培养液混合机制,这些系统可分为基于鼓泡塔或微孔板的小型生物反应器以及搅拌式小型罐生物反应器。这些平台有助于菌株筛选:它们不仅允许在受控条件下对菌株进行高通量筛选,而且部分系统还能够在线收集每个克隆的大量工艺信息(如蛋白质滴度、蛋白质质量、比生产率、细胞适应性或稳健性)。然而,由于缺乏独立进料系统且难以实现高细胞密度,这些小型化生物反应器被认为不太适合高通量优化。一些新型小型反应器,如微生物Ambr 15f发酵系统,已在一定程度上克服了这一限制。Ambr 15f中的泵送液体管线可以根据需要向每个容器进料,使其成为发酵参数优化的理想缩小模型。

基于微流控的微培养系统。 (A) 微生物单细胞反应器的几何原理概述。包括用于3D培养的纳升腔、用于容纳细胞单层的皮升2D腔以及用于1D线性单细胞行和单细胞陷阱的飞升通道。(B) 基于液滴的微流控微培养系统。

除上述小型化生物反应器外,研究人员还开发了各种平行发酵系统,如微生物Ambr 250系统、4×1Biocuber系统、Multifors 2系统、BioXplorer系统、多生物反应器系统BIOSTAT® Qplus以及Dasgip平行生物反应器系统(表2)。这些系统由多个同时运行的小型搅拌生物反应器组成,与传统的单个生物反应器设置相比,具有多项优势,包括提高通量、减少资源消耗以及降低空间需求。与微型生物反应器相比,平行发酵系统具有更大的培养体积,可支持完整的下游分析。这些系统现已被广泛用于发酵参数的优化。

3.2 工艺优化的高通量策略

1)培养基成分的优化

在选择生产菌株后,进一步优化培养基成分成为必要环节。摇瓶中传统的一次一因素方法通量较低,且未能考虑培养基成分之间的相互作用。为克服这一限制,可以利用高通量培养平台与实验设计的组合。DoE能够研究变量之间的相互作用,并在未探索的条件下可靠预测结果,从而显著减少所需实验数量并提高实验通量。此外,模型预测控制也可集成到这种基于DoE的框架中,允许根据预测模型对培养条件进行精确、实时的调整。这种综合方法考虑了不同培养基成分和工艺参数之间的相互依存关系,有助于高效确定最佳培养基组成。

几种商业微型生物反应器系统的比较及其在现代生物工艺开发/研究中的应用

2)发酵参数的优化

溶解氧、补料速率、pH值和搅拌速度等发酵参数会显著影响蛋白质表达。鉴于这些参数在工业规模中的重要性,在搅拌式生物反应器中对其进行优化至关重要。基于实验室规模生物反应器中迭代实验的传统优化方法既昂贵又耗时。因此,搅拌式微型罐生物反应器或与DoE策略相结合的平行发酵系统越来越多地被采用。例如,Janakiraman等人通过使用Ambr系统与DoE相结合,确定了中国仓鼠卵巢细胞中单克隆抗体生产的最佳生长温度、生产温度和pH值。我们之前的研究通过结合Biocuber系统与DoE,优化了OmlA抗原生产的发酵参数。高通量搅拌式生物反应器的最新进展,如Ambr 15f系统软件与DoE软件包的兼容性以及BioPAT®MFCS/win模块对自动化优化实验的促进作用,极大地简化了基于DoE的工艺优化,提高了可靠性和可重复性。成功的应用包括在毕赤酵母中优化疟疾疫苗生产。

基于这些创新,多参数控制可以通过实现发酵参数的动态实时调整来进一步优化工艺。同时,全面的数字基础设施能够增强数据管理、分析和自动化能力,从而实现更高效、可靠的基于DoE的发酵工艺优化。

几种商业平行发酵系统的基本特征总结

3)当前的局限性

尽管高通量工艺开发已取得令人满意的成果,但仍存在一些需要解决的局限性。首先,高通量技术缺乏系统整合,难以覆盖蛋白质生产的全过程。以往高通量技术的应用主要集中在蛋白质生产全过程中的某一小部分。尽管部分研究人员已开始尝试以综合方式使用高通量技术,但这种做法仍需更广泛推广,以覆盖整个过程。其次,以往大多数研究很少关注发酵过程的可靠放大。他们往往在小型生物反应器中建立发酵过程后即告结束,或仅将小型反应器中建立的发酵参数简单复制到大规模反应器中。由于大型容器中氧气和底物等梯度的形成,微生物表型异质性在放大过程中可能会加剧,这一问题尚未得到充分重视和讨论。最后,工艺开发策略需要根据现有的高通量平台进行调整。例如,以往研究中的大多数生产菌株仅在不受控的培养平台上根据蛋白质滴度进行筛选。随着带有在线监测系统的微型生物反应器的发展,应采用多轮筛选并进行多种性能标准评估(如蛋白质滴度、蛋白质质量、比生产率、细胞适应性或稳健性)。此外,随着培养平台通量的提高,应仔细探索实验变量与DoE的组合以获得最佳结果。

3.3 重组蛋白生产的高通量工艺开发

在此,我们总结了重组蛋白生产的代表性开发过程。整个过程包括高通量克隆构建与筛选、高通量生产工艺优化以及生产工艺的可靠放大(图5)。

1)高通量筛选

构建表达文库被广泛用于确定生产给定蛋白质的最佳表达元件组合。如上所述,已开发出多种高通量克隆方法,使研究人员能够在短时间内构建大量菌株文库。对于从大量候选菌株中筛选生产菌株,采用多轮筛选策略非常有益(图5)。第一轮筛选通常在不受控的MTPs系统中进行,基于蛋白质滴度等选择标准筛选最有前景的克隆,从而将下一轮的克隆数量减少。在此阶段,可采用葡萄糖限量补料分批技术,通过精确控制葡萄糖供应来优化发酵过程,以充分释放克隆的生产潜力。第二轮筛选可在高度平行的受控平台上进行,如Micro-24或微矩阵,进一步减少候选克隆数量。最后,在更接近实际生产的培养系统中,如搅拌式微型生物反应器和平行发酵系统,对这些选定菌株的性能进行综合评估,以确定最佳生产菌株。值得注意的是,平行发酵系统和微型生物反应器中的菌株排名可能与MTPs中的排名存在差异,这反映了环境因素对微生物性能的影响。

2)高通量生产工艺优化

一旦选定生产菌株,就需要进一步进行实验优化,以确定生产目标蛋白的最佳培养基和发酵参数。考虑到大量实验变量的存在,在此阶段强烈推荐结合DoE策略的高通量培养平台(图5)。在这种情况下,MPC与综合数字基础设施的整合可进一步加强优化过程。按照此策略,建议在MTPs中进行培养基成分的DoE优化,而发酵参数的优化最好在搅拌式微型生物反应器或平行发酵系统中进行。这些由MPC和综合数字基础设施支持的高通量优化策略,使我们能够快速识别关键工艺变量并确定其设计空间。最终,通过有限数量的实验可以轻松确定关键变量的最佳设定水平。

当前生物产业领域从基因克隆到蛋白质生产的高通量工艺开发代表性流程图。模型预测控制(MPC)和综合数字基础设施可集成以加速此过程。

3)生产工艺的可靠放大

在缩小模型中建立的发酵工艺需要进一步放大到更大规模的生物反应器中,以进行进一步评估或实际商业化生产(图5)。为确保放大的可靠性,采用合适的放大标准至关重要。恒定的氧气传质系数、恒定的比功率输入、恒定的叶轮尖端速度和恒定的溶解氧浓度是发酵工业中常用的四种放大标准。然而,由于细胞培养过程的复杂性和重组蛋白的多样特性,目前尚无一种标准能够以高成功率普遍适用。放大标准的实际选择应基于发酵过程的具体特性。一般而言,对于需氧微生物的放大,推荐采用恒定kLa策略。而恒定P/V常被用作早期工业青霉素发酵和低能量输入发酵的放大标准,但在需要高能量输入的发酵过程中(如重组大肠杆菌培养)则受到限制。恒定的尖端速度对于抗生素发酵的放大以及评估分支酵母、丝状细菌和真菌发酵中菌丝破裂的可能性较为理想,但对单细胞发酵的适用性较差。当传热成为发酵放大的限制因素时,例如以甲醇为碳源的毕赤酵母高密度发酵,基于恒定溶解氧浓度的放大策略是首选。此外,还可采用菌株和诱导剂修饰、细胞生理操作以及脉冲式补料策略,以减少放大过程中细胞表型异质性的产生。最后,值得注意的是,实验者的直觉和专业知识在放大过程中同样至关重要。

NO.4】结论与未来展望

在本文中,我们回顾了已开发并应用于重组蛋白表达的高通量技术,并提出了一种整体性的高通量工艺开发策略。为进一步加速蛋白质生产的工艺开发,仍有许多工作有待完成。首要任务是广泛整合自动化实验室流程。通过使自动化样品制备与培养平台协调一致,并使其与高通量分析工具相对接,这种整合有助于减少人为误差,同时提高实验室效率。连接蛋白质生产工作流程中的这些不同环节,使我们能够创建一个统一、高效且高度自动化的流程,这可能会重新定义未来蛋白质生产的标准。未来发展的潜在领域在于改进检测工具和实验设备。例如,代谢工程中的主要工具——生物传感器,可针对蛋白质表达检测进行进一步优化,特别是对于分泌蛋白的检测。引入一次性、预灭菌的生物反应器可减轻样品污染并减少劳动密集型的准备工作。此外,随着各种高通量技术应用的增加,数据量呈指数级增长,亟需开发可靠的数据管理、存储和分析系统。可以建立一个全面的数字基础设施,用于在整个开发过程中管理、共享和分析实验数据。同时,创建蛋白质表达数据的公共数据库并引入生物信息学分析也具有重要意义。公共数据库可以收集和共享来自全球实验室的蛋白质表达条件和结果。通过对已有数据进行生物信息学分析并归纳规律,研究人员可以预测哪些表达元件和培养条件可能适用于具有特定特征的蛋白质表达,从而大幅减少克隆构建和工艺优化的工作量。最后,预计新的人工智能和机器学习技术将在这一发展过程中发挥关键作用。它们可以提高工艺效率、提升产品质量并降低生产成本。此外,AIML还可以支持放大过程、数据集成与可视化以及自动化操作,从而实现生物产品更快且更具成本效益的生产。

欢迎加入“艺药荟”知识星球,免费享有行业资源,联系星主享受9折优惠。

邀您加入“艺药荟社群”交流学习!

备注:姓名+单位+方向


版权说明:本文欢迎个人转发至朋友圈,谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权或其他合作需求,请联系梓树ZiShu(微信:Z07302256)。

免责声明:本文仅作信息交流之目的,文中观点不代表“艺药荟”立场,亦不代表“艺药荟”支持或反对文中观点。本文不作为治疗方案推荐。如需治疗指导,请前往正规医院就诊。

相关内容 查看全部