楊云彭,馬曉焉,霍毅欣,2
生物工程與大健康

霍毅欣 北京理工大學生命學院教授,博士生導師。1999年在南開大學獲得微生物學學士學位,2005年同時獲得北京大學的生物化學與分子生物學專業博士學位和法國巴黎七大的分子微生物學及病毒學專業博士學位。2006–2011年在加州大學洛杉磯分校做博士后研究,2015年10月起在北京理工大學任教。現任中國生物工程學會青年工作委員會副主任、中國化工學會生物化工青年學者工作委員會常務委員、中國生物工程學會氨基酸專業委員會委員。主要研究方向是代謝工程和合成生物學,已在、、、、等刊物發表論文30余篇。
密碼子優化策略在異源蛋白表達中的應用
楊云彭1,馬曉焉1,霍毅欣1,2
1 北京理工大學 生命學院 分子醫學與生物診療工業和信息化部重點實驗室,北京 100081 2 蘇州工業園區洛加大先進技術研究院 (蘇州),江蘇 蘇州 215123
酶在醫療和生物藥物方面有著廣泛的應用,不僅可以用來治療各種疾病,還在臨床診斷和人體健康等方面有著重要的影響。利用微生物來表達異源蛋白已經成為獲取酶最簡單快速的方法。為獲得高濃度和高質量的異源蛋白,常用的方法是對基因序列進行密碼子優化。傳統的密碼子優化策略主要基于密碼子偏好性和GC含量,忽略了翻譯動力學和代謝水平等復雜多樣的變化因素。文中從基因水平、轉錄水平、翻譯水平、翻譯后水平以及代謝水平等多方面考慮出發,提供了一個較為全面的密碼子優化策略,主要包括密碼子偏好性、密碼子協調性、密碼子敏感性、調整基因序列結構以及一些其他影響因素。同時對每種策略的內容、理論支持以及應用范圍等方面作了全面的總結,并將各策略的優缺點進行了系統的比較,為異源蛋白表達提供了全方位、多層次、多選擇的優化策略,也為酶工業和生物藥物等方面提供參考。
密碼子優化策略,異源蛋白表達,密碼子偏好性,密碼子協調性,密碼子敏感性
酶是各種反應的生物催化劑,在醫療和生物制藥等方面有著廣泛的用途,可用于疾病診斷治療、臨床檢測和養生保健等方面[1-3]。例如,在大腸桿菌中生產的1-天冬酰胺酶可用于治療白血病[4],在枯草芽孢桿菌生產的納豆激酶在血栓藥物治療上有著巨大前景[5]。微生物酶還可以用于治療由于遺傳問題、酶缺乏或消化紊亂引起的疾病,同時,還可以用于診斷行業的糖尿病檢測等診斷程序[6]。目前在背景清晰的模式菌株里表達異源蛋白已成為獲取微生物酶的最簡單方法。但在進行異源蛋白表達時,密碼子優化策略還存在很大的局限性。現有的優化策略主要從宿主本身出發,意在消除稀有密碼子、調整GC含量和mRNA的穩定性等,但該策略僅局限于tRNA濃度、基因結構和mRNA穩定性等,忽略了翻譯動力學、翻譯后折疊及代謝水平等這些復雜多樣的變化因素,導致一些異源蛋白的表達量仍很低[7-8]。此外,目前常用的密碼子優化策略的另一個弊端是更多地強調蛋白的表達數量,對蛋白的質量沒有嚴格的要求,常常出現蛋白翻譯或折疊錯誤等[7]。隨著生物技術的飛速發展,人們對于生物的作用機制更加了解,也為密碼子優化提供了一些新的策略,包括密碼子的協調性[9]、密碼子的敏感性[10]以及一些其他轉錄和翻譯水平影響因素(圖1A)。密碼子協調性不同于密碼子偏好性,該策略更加注重蛋白的質量,通過增加基因的耐受性來減少蛋白翻譯后折疊錯誤的出現,從而維持了蛋白表達數量和質量的協調性。密碼子敏感性策略則考慮到了氨酰化tRNA在脅迫條件下的波動性,為在底物不足或氨基酸饑餓條件下提供了一條新的密碼子優化策略。
本文綜合考慮蛋白表達的各個影響因素,將密碼子的優化策略分為5大類,即密碼子偏好性、密碼子協調性、密碼子敏感性、調整基因序列和其他影響因素。同時,總結了各個策略的內容、理論支持、優缺點以及應用范圍等方面,為異源蛋白的表達提供一個較為全面的密碼子優化策略,也為酶工業、生物藥物的制備和精準醫療等方面提供參考。
在遺傳密碼中,mRNA上3個相鄰的堿基組成一個密碼子,一個密碼子可編碼一種氨基酸。在生物體中有61種密碼子、20種氨基酸[11],這是由于遺傳密碼具有簡并性,同一氨基酸對應的多個密碼子被稱為同義密碼子[12-13]。但這些同義密碼子在翻譯的過程中使用的頻率并非一致,這種現象被稱為“密碼子偏好性”[14-15]。密碼子偏好性對蛋白的表達有著直接的影響,能通過tRNA在翻譯水平上改變蛋白的翻譯速度[16]。在同一生物中,攜帶同一種氨基酸的不同tRNA稱為同功受體tRNA,tRNA的濃度通常與其讀取的密碼子的頻率正相關[14-15]。在高度表達的基因中,編碼同種氨基酸的密碼子中往往有一個密碼子在頻率上占主導地位,并且該密碼子通常由最豐富的tRNA的同種受體讀取[17]。研究表明,這樣有偏好性使用的機制可加快蛋白質合成,減少氨基酸取代錯誤[18]。因此,密碼子偏好性和同功受體tRNA濃度可能共同進化[19-21],并且與低水平表達的基因相比,高水平表達的基因的選擇壓力更為顯著[22]。
密碼子偏好性優化策略是目前最常用的密碼子優化策略,主要是將供體密碼子與宿主基因組中具有最高頻率的同義密碼子進行替換,利用 宿主中最豐富的密碼子來編碼優化序列中的氨基酸[23-24]。該理論假定tRNA和蛋白翻譯呈直接線性關系,且忽略了蛋白翻譯的動力學相關影響[7],當宿主細胞內的密碼子頻率較高時,相應的tRNA水平較高,翻譯速率較快,更利于蛋白含量的表達(圖1B)。密碼子使用偏好性的分析在生物醫藥方面具有重要應用,通過改變密碼子分配從而產生更多蛋白質的策略已經廣泛用于蛋白質藥物和核酸療法的生物生產中。例如,根據密碼子的偏好性在大腸桿菌中成功地表達出了抗生素、胰島素和疫苗等[25]。
利用密碼子偏好性策略來提高異源蛋白的表達水平已得到人們的廣泛認可,但也有部分實驗結果表明,利用密碼子偏好性的優化策略來進行蛋白表達時,非但沒有增加蛋白的表達含量,反而使蛋白的含量降低[7-8]。密碼子偏好性策略主要基于高頻密碼子對應的tRNA濃度較高,可直接加快蛋白的翻譯速率。但隨后人體內翻譯速率實驗已證明tRNA濃度與翻譯水平并不呈直接相關[26-28],甚至有實驗證明,相同的tRNA可以以顯著的差異速率解碼不同的密碼子[29]。因此,當將供體密碼子替換成宿主細胞內高頻密碼子時,相應密碼子的tRNA濃度較高,但實際用于蛋白質合成的氨酰化tRNA濃度并不一定較高,相應的合成蛋白的速率就會受到很大影響。同時,當采用該方法策略獲得異源性蛋白時,高頻密碼子的使用消除了稀有密碼子使用時造成的核糖體暫停效應,導致部分蛋白折疊錯誤[7,18,30],最終形成包涵體,影響蛋白的質量,不利于微生物酶工業化生產(表1)。
有研究表明,在mRNA翻譯較慢的區域將使用頻率較低的密碼子改為使用頻率較高的同義密碼子可能對酶活性產生有害影響。在氯霉素乙酰轉移酶(CAT) 基因上將16個稀有密碼子替換成高頻密碼子,可影響mRNA突變區域的核糖體運輸并消除特定的翻譯暫停,導致蛋白質錯誤折疊水平增加,比活率下降了20%[31]。相反,將稀有密碼子引入含有高頻密碼子使用的區域則會改變底物特異性。P-糖蛋白 (P-gp) 是多藥耐藥基因1 (MDR1) 的表達產物,也是ATP驅動的外排泵,與P-gp底物藥物的藥物代謝動力學和癌癥的多藥耐藥性相關。在P-gp表達的過程中,將高頻密碼子替換成稀有密碼子,tRNA則成為蛋白表達的限制因素,影響共翻譯折疊和P-gp插入細胞膜的時間,從而改變藥物和抑制劑相互作用位點的結構[32]。如果引入密碼子的頻率不當,可能會使蛋白的天然結構和功能發生變化,增加重組蛋白藥物的免疫原性,降低治療效果。因此,選擇合適頻率的密碼子是成功表達有活性蛋白的關鍵因素。為了最大限度地模擬宿主內供體的天然翻譯動力學,順利表達異源蛋白,我們可以采用密碼子協調性的優化策略。該策略主要是將供體密碼子與宿主中使用頻率最為相似的密碼子進行替換,利用頻率相似的密碼子來編碼蛋白。密碼子協調性優化策略對酶工業生產過程的經濟性具有重大影響,可顯著地降低生產成本。例如,在小牛血清凝乳酶生產的過程中,通過協調密碼子的使用,使凝乳酶原的量增加70%,為商業化生產帶來了極大效益[33]。此外還有文獻報道,將mRNA緩慢翻譯的區域段用小于或等于天然供體密碼子的同義密碼進行編碼,最終使異源蛋白的表達含量提高了4–1 000倍,可用于疫苗生產[34]。同時,還可以利用密碼子的隨機分布[33]來維持密碼子的協調,該方法主要是基于整個基因組中密碼子的頻率分布或高度表達基因的翻譯表來將供體密碼子分配到宿主的每個密碼子上。在這種情況下,密碼子被隨機分配,其概率由宿主密碼子頻率表給出[35-38]。隨后,可通過計算“用于替換供體密碼子的可能性(Likelihoods for selection to replace the donor codon,LSR-值)”來尋找最佳的密碼子(圖1C)[9]。目前,已有大量文獻報道根據密碼子協調性優化策略成功地提高了異源蛋白的表達量,為微生物酶生產的迅速發展提供了支持[7, 9, 34, 39-42]。
在進行異源蛋白表達時,如果僅引入最高頻率的密碼子,則有可能造成相應氨酰化tRNA的濃度快速消耗,使底物成為蛋白翻譯的限制因 素[43],造成翻譯的過早終止或者錯誤的氨基酸摻入,從而影響蛋白的含量和質量。利用密碼子協調性,將頻率最相似的密碼子引入到宿主中,則能在一定水平上增加基因的耐受性,減少和避免出現同功受體tRNA缺乏的情況出現。且該策略更加強調模擬宿主內供體的天然翻譯動力學,防止由于強制過表達時造成分子伴侶系統被破壞,從而使蛋白能最大限度地在宿主細胞內高質量表達。在翻譯中,同功受體tRNA的種類和氨酰化的總濃度決定了密碼子的翻譯速度[29]。在密碼子協調性策略中,最佳密碼子并非最高頻密碼子,因此,其tRNA需要更長的時間才能到達核糖體的A位點,導致核糖體在同源密碼子上的轉運延遲[44]。這樣的延遲調節了共翻譯折疊和分子伴侶相互作用的時間范圍,特別是在多結構域蛋白質中,增加了成功折疊事件的機會,避免了包涵體的形成(表1)。
根據氨酰化tRNA的可利用性在不同的生長和脅迫條件下有顯著不同[45-46],提出了“密碼子敏感性”這一概念[10]。密碼子敏感性指的是在細胞內氨基酸缺乏的條件下,tRNA與氨基酸結合能力的強弱。結合能力隨氨基酸濃度降低呈緩慢降低的tRNA的敏感性較低,其相應的密碼子被稱為低敏感性密碼子;結合能力隨氨基酸濃度降低呈快速降低的tRNA的敏感性較高,其相應的密碼子被稱為高敏感性密碼子。隨后的實驗直接證實了該理論預測,在細胞缺乏相對應氨基酸時,絲氨酸、亮氨酸、蘇氨酸和精氨酸家族中同功受體tRNA選擇性氨酰化[30, 45, 47]。并根據tRNA可用性估算了密碼子翻譯速率,展示了tRNA在整個大腸桿菌基因組翻譯過程中敏感性的動態變化[48],為微生物酶的工業化增加了新元素。
理論上,蛋白的合成速度與細胞內tRNA和氨基酸的濃度相關[49-50],但是,大腸桿菌tRNA的濃度在所有代謝條件下基本恒定[51],因此,在底物缺乏的條件下,即當核糖體翻譯機制對某種氨基酸的需求大于其生物合成速率時,氨基酸的供應成為了蛋白合成的限制性因素。由于密碼子的頻率與敏感性并不呈對應的關系[10],頻率較高的密碼子,其敏感性并不一定低。在饑餓條件下表達異源蛋白時,如果宿主中頻率較高的密碼子正好敏感性也較高,那么,采用密碼子偏好性來進行密碼子優化不僅不會使蛋白的表達量提高,反而會使蛋白的表達量降低。在這種情況下,如果采用的是低敏性的密碼子,即使氨基酸的濃度 降低,該低敏性密碼子對應的tRNA相較其他的同功受體tRNA也有較高的氨酰化水平,也能維持蛋白的持續表達(圖1D)。反之,高敏性的密碼子所對應的tRNA的氨酰化水平會隨著氨基酸的濃度降低呈現較快的下降趨勢,即使細胞內其他同功受體tRNA仍維持高水平的氨酰化狀態也不能被細胞加以利用,會造成蛋白表達的暫緩甚至停止。
密碼子敏感性的優化策略可廣泛地應用于極端條件下或對于培養基有嚴格要求的蛋白表達,也可將其用于對蛋白質量要求較高的結構生物學、抗體或生物藥物的研究中。目前,利用密碼子敏感性的優化策略還未得到推廣,只有文獻報道了關于大腸桿菌的密碼子敏感性數值[10],其他物種尚未見報道(表1)。
在異源蛋白表達中,研究者關注更多的是轉錄和翻譯過程,但基因序列本身對蛋白的表達也有一定影響。常見的對基因序列優化方法有調整GC含量[52-54]、避免堿基重復[55-56]、消除限制酶識別位點[57]、Chi-site延伸重組熱點[57-58]等(圖1E,表1)。有研究表明,不同物種的GC含量顯著不同,基因序列中的GC含量能影響基因的表達和調控[59]。GC含量過高(大于70%) 會造成RNA二級結構穩定性增加,減慢或暫停翻譯;GC含量過低(小于30%) 則會減慢轉錄延伸,不利于蛋白的表達。GC含量的調整可通過相關的軟件進行分析。例如,在大腸桿菌中,通過調整GC含量實現了肽脫甲酰酶的表達,成為了治療癌癥的潛在藥物[60]。此外,密碼子進行優化時還需避免與位于開放閱讀框中可能干擾mRNA加工和翻譯功能的重要RNA基序相似,如Shine-Dalgarno序列[28],這可能會造成核糖體暫停[61]。在真核生物中則需要考慮到CpG的含量[62]和TATA盒[63]等因素,這對轉錄的啟動有著重要的影響。
影響異源蛋白表達的因素復雜多樣,除了上述因素外,還包括一些其他的轉錄水平和翻譯水平的影響因素。如mRNA二級結構的穩定性[64]、消除串聯稀有密碼子[65]、避免密碼子重復[66]、調整核糖體結合位點[67]和注意起始終止密碼的環境[68-69]等(圖1F,表1)。mRNA的折疊能量對翻譯效率具有顯著影響,特別是在起始密碼子附近,因為更穩定的RNA二級結構在翻譯起始前需要更多的能量展開。在大腸桿菌中,非最高頻密碼子與降低的折疊能量相關,因為它們與其最高頻密碼子相比更傾向于富含AT,因此當非最高頻密碼子位于編碼DNA序列的5′末端附近時,翻譯效率提高[70]。這表明密碼子最優性必須與松散的RNA二級結構相平衡,以便最大限度地提高翻譯效率[59, 71-72],此外,胞內直接翻譯速率的測量[73-74]和核糖體起始和延伸的計算機模擬[75]證明了翻譯起始通常是蛋白質合成中的限速步驟。在翻譯起始過程中,使用低頻密碼子不僅會減慢核糖體翻譯速率,甚至還可以通過降低核糖體從mRNA起始位點移出的速率來影響同一轉錄物上其他核糖體的翻譯啟動[76-77]。在細菌中核糖核酸酶E位點也可以影響mRNA結構的穩定性[78]。而在真核生物中還需考慮潛在的polyA位點,防止提前終止翻譯[79]。

圖1 密碼子優化策略示意圖

密碼子優化是實現異源蛋白高效表達的關鍵技術手段。密碼子偏好性策略適用性較廣,能用于大多數異源蛋白表達,但由于蛋白表達量過高易造成折疊錯誤,形成包涵體。此時,可采用密碼子協調性優化策略,將供體中密碼子與宿主中頻率最相似的同義密碼子進行替換或將供體密碼子根據密碼子頻率分配到宿主每個密碼子上,避免了因密碼子頻率過高而引起的翻譯終止或折疊錯誤等現象出現。密碼子協調性策略在異源蛋白表達中的使用可提高功能性蛋白表達的可靠性,對結構生物學和生物技術有著重要的影響。此外,該策略為大腸桿菌等模式菌株進行異源蛋白表達提供了極好的發展前景,也為許多潛在的疫苗和生物藥物的開發和制備提供了大力支持。密碼子敏感性優化策略則考慮到了氨酰化tRNA的可利用性,將高敏感性的密碼子替換成低敏感性的密碼子,使蛋白在體內氨基酸缺乏的條件下也能維持穩定表達。該策略在蛋白質工程、酶工程、代謝工程以及合成生物學中有著廣泛應用,可用于在脅迫條件或其他極端條件下異源蛋白的表達,也可用于氨基酸衍生物的發酵生產。但該策略還未得到廣泛應用,因其研究還未完善,目前只報道了關于大腸桿菌的密碼子敏感性數值,其他生物密碼子敏感性尚在研究中。密碼子偏好性、密碼子協調性和密碼子敏感性優化策略主要是在不同培養條件下,調整細胞體內mRNA、tRNA、氨酰化tRNA、氨基酸含量以及蛋白表達的關系,最大可能地模擬天然蛋白的翻譯過程。因此,上述3種策略不受物種限制,可廣泛地應用于大腸桿菌和酵母表達系統。基因結構和其他轉錄翻譯水平的影響因素復雜多樣,原核生物和真核生物的轉錄翻譯機制不同,在密碼子優化中考慮的因素也不同,可根據宿主和異源蛋白的基因序列進行適當調整,從而提高蛋白的表達水平。
異源蛋白的表達已成為酶工業和疫苗制造過程的重要內容,密碼子的優化策略則是其中的關鍵因素。隨著科技的飛速發展,生物的生命活動解析會更為清晰,密碼子的優化策略也將更加豐富多樣,從而為酶工業生產和生物藥物制備帶來新策略,為人類生命健康帶來新期望。
[1] Singh R, Kumar M, Mittal A, et al. Microbial enzymes: industrial progress in 21st century. 3 Biotech, 2016, 6(2): 174.
[2] Gurung N, Ray S, Bose S, et al. A broader view: microbial enzymes and their relevance in industries, medicine, and beyond. Biomed Res Int, 2013, 2013: 329121.
[3] Jin C. Preface for special issue on enzyme engineering (2018). Chin J Biotechnol, 2018, 34(7): 1021–1023 (in Chinese). 金城. 2018酶工程專刊序言. 生物工程學報, 2018, 34(7): 1021–1023.
[4] Jain R, Zaidi DK, Verma Y, et al. L-Asparaginase: A promising enzyme for treatment of acute lymphoblastic leukiemia. People’s J Sci Res, 2012, 5(1): 29–35.
[5] Cho YH, Song JY, Kim KM, et al. Production of nattokinase by batch and fed-batch culture of. New Biotechnol, 2010, 27(4): 341–346.
[6] Vellard M. The enzyme as drug: application of enzymes as pharmaceuticals. Curr Opin Biotechnol, 2003, 14(4): 444–450.
[7] Buhr F, Jha S, Thommen M, et al. Synonymous codons direct cotranslational folding toward different protein conformations. Mol Cell, 2016, 61(3): 341–351.
[8] Zhu D, Cai G, Wu D, et al. Comparison of two codon optimization strategies enhancing recombinant Sus scrofa lysozyme production in. Cell Mol Biol (Noisy-le-grand), 2015, 61(2): 43–49.
[9] Rehbein P, Berz J, Kreisel P, et al. “CodonWizard”–An intuitive software tool with graphical user interface for customizable codon optimization in protein expression efforts. Prot Expres Purif, 2019, 160: 84–93.
[10] Elf J, Nilsson D, Tenson T, et al. Selective charging of tRNA isoacceptors explains patterns of codon usage. Science, 2003, 300(5626): 1718–1722.
[11] Crick FHC, Barnett L, Brenner S, et al. General nature of the genetic code for proteins. Nature, 1961, 192(4809): 1227–1232.
[12] Lagerkvist U. “Two out of three”: an alternative method for codon reading. Proc Natl Acad Sci USA, 1978, 75(4): 1759–1762.
[13] Ikemura T. Correlation between the abundance oftransfer RNAs and the occurrence of the respective codons in its protein genes. J Mol Biol, 1981, 146(1): 1–21.
[14] Sharp PM, Cowe E, Higgins DG, et al. Codon usage patterns in,,,,and: a review of the considerable within-species diversity. Nucleic Acids Res, 1988, 16(17): 8207–8211.
[15] Plotkin J B, Kudla G. Synonymous but not the same: the causes and consequences of codon bias. Nat Rev Genet, 2011, 12(1): 32–42.
[16] Sabi R, Tuller T. Modelling the efficiency of codon-tRNA interactions based on codon usage bias. DNA Res, 2014, 21(5): 511–526.
[17] Tuller T, Waldman YY, Kupiec M, et al. Translation efficiency is determined by both codon bias and folding energy. Proc Natl Acad Sci USA, 2010, 107(8): 3645–3650.
[18] Hanson G, Coller J. Codon optimality, bias and usage in translation and mRNA decay. Nat Rev Mol Cell Biol, 2017, 19(1): 20–30.
[19] Sharp PM, Emery LR, Zeng K. Forces that influence the evolution of codon bias. Philos Trans Roy Soc B Biol Sci, 2010, 365(1544): 1203–1212.
[20] Yannai A, Katz S, Hershberg R. The codon usage of lowly expressed genes is subject to natural selection. Genome Biol Evol, 2018, 10(5): 1237–1246.
[21] Hershberg R, Petrov DA. Selection on codon bias. Ann Rev Genet, 2008, 42(1): 287–299.
[22] Ehrenberg M, Kurland CG. Costs of accuracy determined by a maximal growth rate constraint. Quart Rev Biophys, 1984, 17(1): 45–85.
[23] Quax TEF, Claassens NJ, S?ll D, et al. Codon bias as a means to fine-tune gene expression. Mol Cell, 2015, 59(2): 149–161.
[24] Villalobos A, Ness JE, Gustafsson C, et al. Gene Designer: a synthetic biology tool for constructing artificial DNA segments. BMC Bioinformat, 2006, 7: 285.
[25] Kane JF. Effects of rare codon clusters on high-level expression of heterologous proteins in. Curr Opin Biotechnol, 1995, 6(5): 494–500.
[26] Curran JF, Yarus M. Rates of aminoacyl-tRNA selection at 29 sense codons. J Mol Biol, 1989, 209(1): 65–77.
[27] Bonekamp F, Dalb?ge H, Christensen T, et al. Translation rates of individual codons are not correlated with tRNA abundances or with frequencies of utilization in. J Bacteriol, 1989, 171(11): 5812–5816.
[28] Li GW, Oh E, Weissman JS. The anti-Shine- Dalgarno sequence drives translational pausing and codon choice in bacteria. Nature, 2012, 484(7395): 538–541.
[29] S?rensen MA, Pedersen S. Absolutetranslation rates of individual codons in: the two glutamic acid codons GAA and GAG are translated with a threefold difference in rate. J Mol Biol, 1991, 222(2): 265–280.
[30] Gong M, Gong F, Yanofsky C. Overexpression of tnaC ofinhibits growth by depleting tRNA2Proavailability. J Bacteriol, 2006, 188(5): 1892–1898.
[31] Komar AA, Lesnik T, Reiss C. Synonymous codon substitutions affect ribosome traffic and protein folding duringtranslation. FEBS Lett, 1999, 462(3): 387–391.
[32] Kimchi-Sarfaty C, Oh JM, Kim IW, et al. A “Silent” polymorphism in thegene changes substrate specificity. Science, 2007, 315(5811): 525–528.
[33] Menzella HG. Comparison of two codon optimization strategies to enhance recombinant protein production in. Microb Cell Fact, 2011, 10: 15.
[34] Angov E, Hillier CJ, Kincaid RL, et al. Heterologous protein expression is enhanced by harmonizing the codon usage frequencies of the target gene with those of the expression host. PLoS ONE, 2008, 3(5): e2189.
[35] Welch M, Govindarajan S, Ness JE, et al. Design parameters to control synthetic gene expression in. PLoS One, 2009, 4(9): e7002.
[36] Kodumal SJ, Patel KG, Reid R, et al. Total synthesis of long DNA sequences: Synthesis of a contiguous 32-kb polyketide synthase gene cluster. Proc Natl Acad Sci USA, 2004, 101(44): 15573–15578.
[37] Wang XX, Li XJ, Zhang ZL, et al. Codon optimization enhances secretory expression of Pseudomonas aeruginosa exotoxin A. Prot Expres Purif, 2010, 72(1): 101–106.
[38] Menzella HG, Reid R, Carney JR, et al. Combinatorial polyketide biosynthesis bydesign and rearrangement of modular polyketide synthase genes. Nat Biotechnol, 2005, 23(9): 1171–1176.
[39] Chowdhury DR, Angov E, Kariuki T, et al. A potent malaria transmission blocking vaccine based on codon harmonized full lengthexpressed in. PLoS One, 2009, 4(7): e6352.
[40] Angov E, Legler PM, Mease RM. Adjustment of codon usage frequencies by codon harmonization improves protein expression and folding//Evans TC Jr, Xu MQ, Eds. Heterologous Gene Expression in: Methods and Protocols. Totowa, NJ: Humana Press, 2011: 1–13.
[41] Mignon C, Mariano N, Stadthagen G, et al. Codon harmonization-going beyond the speed limit for protein expression. FEBS Lett, 2018, 592(9): 1554–1564.
[42] Asam C, Roulias A, Parigiani MA, et al. Harmonization of the genetic code effectively enhances the recombinant production of the major birch pollen allergen bet v 1. Int Arch Allergy Immunol, 2018, 177(2): 116–122.
[43] Fuglsang A. Codon optimizer: a freeware tool for codon optimization. Prot Expres Purif, 2003, 31(2): 247–249.
[44] Chu D, Barnes DJ, von der Haar T. The role of tRNA and ribosome competition in coupling the expression of different mRNAs in. Nucleic Acids Res, 2011, 39(15): 6705–6714.
[45] Dittmar KA, S?rensen MA, Elf J, et al. Selective charging of tRNA isoacceptors induced by amino-acid starvation. EMBO Rep, 2005, 6(2): 151–157.
[46] Dong HJ, Nilsson L, Kurland CG. Co-variation of tRNA abundance and codon usage inat different growth rates. J Mol Biol, 1996, 260(5): 649–663.
[47] Lindsley D, Bonthuis P, Gallant J, et al. Ribosome bypassing at serine codons as a test of the model of selective transfer RNA charging. EMBO Rep, 2005, 6(2): 147–150.
[48] Wohlgemuth SE, Gorochowski TE, Roubos JA. Translational sensitivity of thegenome to fluctuating tRNA availability. Nucleic Acids Res, 2013, 41(17): 8021–8033.
[49] Ingolia NT. Ribosome profiling: new views of translation, from single codons to genome scale. Nat Rev Genet, 2014, 15(3): 205–213.
[50] Mazumder GA, Uddin A, Chakraborty S. Comparative analysis of codon usage pattern and its influencing factors inand. Acta Parasitol, 2017, 62(4): 748–761.
[51] Yamao F, Andachi Y, Muto A, et al. Levels of tRNAs in bacterial cells as affected by amino acid usage in proteins. Nucleic Acids Res, 1991, 19(22): 6119–6122.
[52] Kiktev DA, Sheng ZW, Lobachev KS, et al. GC content elevates mutation and recombination rates in the yeast. Proc Natl Acad Sci USA, 2018, 115(30): E7109–E7118.
[53] Newman ZR, Young JM, Ingolia NT, et al. Differences in codon bias and GC content contribute to the balanced expression of TLR7 and TLR9. Proc Natl Acad Sci USA, 2016, 113(10): E1362–E1371.
[54] Kudla G, Lipinski L, Caffin F, et al. High guanine and cytosine content increases mRNA levels in mammalian cells. PLoS Biol, 2006, 4(6): e180.
[55] Gustafsson C, Govindarajan S, Minshull J. Codon bias and heterologous protein expression. Trends Biotechnol, 2004, 22(7): 346–353.
[56] Chamary JV, Parmley JL, Hurst LD. Hearing silence: non-neutral evolution at synonymous sites in mammals. Nat Rev Genet, 2006, 7(2): 98–108.
[57] Parret AHA, Besir H, Meijers R. Critical reflections on synthetic gene design for recombinant protein expression. Curr Opin Struct Biol, 2016, 38: 155–162.
[58] Taylor AF, Amundsen SK, Smith GR. Unexpected DNA context-dependence identifies a new determinant of Chi recombination hotspots. Nucleic Acids Res, 2016, 44(17): 8216–8228.
[59] Kudla G, Murray AW, Tollervey D, et al. Coding-sequence determinants of gene expression in. Science, 2009, 324(5924): 255–258.
[60] Han JH, Choi YS, Kim WJ, et al. Codon optimization enhances protein expression of human peptide deformylase. Prot Expres Purif, 2010, 70(2): 224–230.
[61] Mohammad F, Woolstenhulme CJ, Green R, et al. Clarifying the translational pausing landscape in bacteria by ribosome profiling. Cell Rep, 2016, 14(4): 686–694.
[62] Bauer AP, Leikam D, Krinner S, et al. The impact of intragenic CpG content on gene expression. Nucleic Acids Res, 2010, 38(12): 3891–3908.
[63] Jonkers I, Kwak H, Lis JT. Genome-wide dynamics of Pol II elongation and its interplay with promoter proximal pausing, chromatin, and exons. eLife 2014, 3: e02407.
[64] Kertesz M, Wan Y, Mazor E, et al. Genome-wide measurement of RNA secondary structure in yeast. Nature, 2010, 467(7311): 103–107.
[65] Clarke IV TF, Clark PL. Increased incidence of rare codon clusters at 5? and 3? gene termini: implications for function. BMC Genom, 2010, 11: 118.
[66] Gustafsson C, Minshull J, Govindarajan S, et al. Engineering genes for predictable protein expression. Prot Expres Purif, 2012, 83(1): 37–46.
[67] Mackie GA. RNase E: at the interface of bacterial RNA processing and decay. Nat Rev Microbiol, 2012, 11(1): 45–47.
[68] Shell SS, Wang J, Lapierre P, et al. Leaderless transcripts and small proteins are common features of the mycobacterial translational landscape. PLoS Genet, 2015, 11(11): e1005641.
[69] Srivastava A, Gogoi P, Deka B, et al.analysis of 5′-UTRs highlights the prevalence of Shine–Dalgarno and leaderless-dependent mechanisms of translation initiation in bacteria and archaea, respectively. J Theor Biol, 2016, 402: 54–61.
[70] Goodman DB, Church GM, Kosuri S. Causes and effects of N-terminal codon bias in bacterial genes. Science, 2013, 342(6157): 475–479.
[71] Gu WJ, Zhou T, Wilke CO. A universal trend of reduced mRNA stability near the translation- initiation site in prokaryotes and eukaryotes. PLoS Comput Biol, 2010, 6(2): e1000664.
[72] Tsao D, Shabalina SA, Gauthier J, et al. Disruptive mRNA folding increases translational efficiency of catechol--methyltransferase variant. Nucleic Acids Res, 2011, 39(14): 6201–6212.
[73] Morisaki T, Lyon K, Deluca KF, et al. Real-time quantification of single RNA translation dynamics in living cells. Science, 2016, 352(6292): 1425–1429.
[74] Wu B, Eliscovich C, Yoon YJ, et al. Translation dynamics of single mRNAs in live cells and neurons. Science, 2016, 352(6292): 1430–1435.
[75] Shah P, Ding Y, Niemczyk M, et al. Rate-limiting steps in yeast protein translation. Cell, 2013, 153(7): 1589–1601.
[76] Mitarai N, Sneppen K, Pedersen S. Ribosome collisions and translation efficiency: optimization by codon usage and mRNA destabilization. J Mol Biol, 2008, 382(1): 236–245.
[77] Potapov I, M?kel? J, Yli-Harja O, et al. Effects of codon sequence on the dynamics of genetic networks. J Theor Biol, 2012, 315: 17–25.
[78] Del Campo C, Bartholom?us A, Fedyunin I, et al. Secondary structure across the bacterial transcriptome reveals versatile roles in mRNA regulation and function. PLoS Genet, 2015, 11(10): e1005613.
[79] Proudfoot NJ. Ending the message: poly(A) signals then and now. Genes Dev, 2011, 25(17): 1770–1782.
Application of codon optimization strategy in heterologous protein expression
Yunpeng Yang1, Xiaoyan Ma1, and Yi-Xin Huo1,2
1 Key Laboratory of Molecular Medicine and Biotherapy, School of Life Sciences, Beijing Institute of Technology, Beijing100081, China 2 SIP-UCLA Institute for Technology Advancement (Suzhou), Suzhou215123, Jiangsu, China
Enzymes are widely used in medical and biopharmaceuticals. They can be used not only for various disease treatments, but also clinical diagnosis. The use of microorganisms to express heterologous proteins has become the easiest and fastest way to obtain enzymes. In order to obtain high concentration and high-quality heterologous proteins, a common method is codon optimization of gene sequences. The traditional codon optimization strategy is mainly based on codon bias and GC content, ignoring complex and varied factors such as translational dynamics and metabolic levels. We provide here comprehensive codon optimization strategy based on gene level, transcriptional level, translational level, post-translational level and metabolic level, mainly including codon bias, codon harmonization, codon sensitivity, adjustment of gene sequence structure and some other influencing factors. We also summarize the aspects of strategy content, theoretical support and application. Besides, the advantages and disadvantages of each strategy are also systematically compared, providing an all-round, multi-level and multi-selection optimization strategy for heterogeneous protein expression, and also providing references for the enzyme industry and biopharmaceuticals.
codon optimization strategies, heterologous protein expression, codon bias, codon harmonization, codon sensitivity
June 26, 2019;
September 3, 2019
National Key Research and Development Program of China (No. 2017YFD0201400), National Natural Science Foundation of China (No. 21676026).
Yi-Xin Huo. Tel: +86-10-68918158; E-mail: huoyixin@bit.edu.cn
國家重點研發計劃 (No. 2017YFD0201400),國家自然科學基金 (No. 21676026) 資助。
2019-10-31
http://kns.cnki.net/kcms/detail/11.1998.Q.20191031.1130.001.html
楊云彭, 馬曉焉, 霍毅欣. 密碼子優化策略在異源蛋白表達中的應用. 生物工程學報, 2019, 35(12): 2227–2237.
Yang YP, Ma XY, Huo YX. Application of codon optimization strategy in heterologous protein expression. Chin J Biotech, 2019, 35(12): 2227–2237.
(本文責編 郝麗芳)