劉昱輝、賈士榮**
中國農業科學院生物技術研究所,北京100081
摘要:介紹了植物種子中油體和油體蛋白(oleosin)的結構特征及其編碼基因的調控,闡述了用植物油體表達體系這壹新型植物生物反應器生產目的蛋白的研究進展和前景。
關鍵詞:油體;油體蛋白;表達體系;植物生物反應器;目的蛋白
現有外源基因表達系統主要包括:細菌、絲狀真菌、酵母、哺乳動物細胞、動物乳腺、昆蟲(昆蟲細胞、昆蟲桿狀病毒和昆蟲整體)和植物表達系統(植物整體、病毒載體和油體)等。這些外源基因表達系統在表達量、表達產物的分離純化及活性、成本等方面各有優缺點。從近年的研究進展看,利用植物表達系統大規模生產各種目的蛋白還受到諸多因素的限制,表達量低、提取和純化成本高是主要的限制因素。植物油體表達體系將目的蛋白的編碼基因插入油體蛋白(oleosin)編碼基因的3`端,以oleosin啟動子驅動目的蛋白與oleosin壹起在轉基因植物的油體中特異表達,獲得轉基因植物種子後,將種子粉碎, 利用油體的疏水性,離心將油相和水相分開,回收上層油體部分,即可去除種子中大部分的非目標成分,從而顯著降低目的蛋白的分離純化成本,因此近年來倍受關註。作為壹種新型的植物生物反應器,為最終利用轉基因植物生產外源蛋白提供了新的途徑。
1 油體(oil body)
植物種子中貯存的營養物質主要包括蛋白質、脂肪和碳水化合物。其中脂類物質壹般以三酰甘油(triacylglycerols,tag)的形式存在,荷荷芭(jojoba)例外,它貯存蠟酯(wax esters)。種子中的tag分子之間不是彼此聚合的,而是分散成許多小的穩定的亞細胞微滴,被稱為油體。油體作為生物體中最小的細胞器有其自身的結構和特征。
1.1 油體大小
油體為直徑0.5-2.5μm的球體,其大小因植物種類的不同而不同,且受營養和環境的影響。即使同壹粒種子,不同組織中的油體大小也不相同。從生物學角度講,油體的大小主要決定於兩個因素:(1)種子發芽時為脂酶催化tag提供最大的作用表面;(2)消耗最少量的油體蛋白和磷脂(phospholipids, pl)。如果油體的直徑小於0.2μm,雖可為脂酶的催化提供更大的作用表面,但卻需耗費大量pl和oleosin。相反,如果油體直徑大於2.5μm,雖節省了pl和oleosin的用量,但由於作用表面過小,在種子發芽及幼苗生長時,脂酶不以迅速水解脂類為植物提供生長所需的能量。
1.2 油體成分
油體的成分包括:(1)92%-98%的中性脂類:主要為tag,約占95%,少量的二酰甘油(dag)和自由脂肪酸;(2)1%-4%的磷脂(pl):主要為磷脂酰膽堿,約占60%-70%,少量的為磷脂酰絲氨酸、磷脂酰乙醇胺和磷脂酰肌醇;(3)1%-4%油體蛋白:其中90%為oleosin,少量的為caleosin、細胞色素c還原酶等。某些植物(如蓖麻和大豆)成熟種子的油體膜上還有脂酶和酰基脂酶存在。花粉粒油體中未檢測到oleosin,橄欖和鱷梨果實中皮層油體中也沒有oleosin。由於這些油體中的脂類物質不是用於長期貯存,因此murphy和vance提出oleosin可能僅為儲藏器官油體所特有,但n?sted等發現根尖油體中有oleosin存在。
1.3 油體的基本結構
根據tzen等提出的油體結構模型,油體內部為液態tag,外部是由單層磷脂分子及其鑲嵌蛋白-oleosin組成的半單位膜,這個半單位膜的基本單位是由13個pl分子和1個oleosin分子組成(圖1)。pl占油體表面的80%,其余20%是oleosin。每個pl分子的2個疏水酰基朝向內部疏水的tag基質,與tag分子相互作用;pl親水的頭部基團朝向胞漿。oleosin分子中間的疏水區域形成壹個約11nm的柄狀結構占oleosin分子的2/5,伸入pl的疏水酰基部分及油體內部的tag中,該部分為由68-74個氨基酸組成的發夾結構,發夾結構的頂端是由3個脯氨酸和壹個絲氨酸構成的“脯氨酸結”(圖1)。oleosin分子其余的3/5部分則覆蓋在油體表面,阻止外部的磷脂酶作用於磷脂半單位膜。等電聚焦結果顯示,油體的等電點為5.7-6.6,即在ph值為中性時,油體表面帶負電荷。植物種子經長期貯存,油體結構仍保持穩定,彼此之間不會相互聚合,普遍認為油體表面電荷和oleosin蛋白的存在是維持油體結構穩定的主要因素。最近的研究結果顯示,油體表面除主要鑲嵌有oleosin外,還鑲嵌少量其它蛋白,如caleosin,因此油體作為植物中最小的細胞器,其結構可能較上述模型更加復雜。oleosin和caleosin是迄今為止研究得較多的兩種油體蛋白。
2 油體蛋白
2.1 oelosin及其結構特點
oleosin最早是從芥菜中發現的,目前許多種植物(如芝麻、油菜、向日葵、胡蘿蔔、玉米、大豆、擬南芥和棉花)的oleosin基因序列和氨基酸序列均已報道。oleosin是高度疏水的堿性小分子量蛋白,分子量為15-26kd,主要在種子中特異表達。壹般認為oelosin為油體所特有, 最近發現約有5%的oelosin存在於靠近油體的內質網上,另外在根尖油體中也發現有oelosin存在。oelosin是在內質網上合成的,由與內質網結合的核糖體負責合成。oelosin鑲嵌在油體表面,對維持油體的穩定極為重要,壹方面在空間上阻礙油體分子間相互聚合,另壹方面在種子發芽時,oleosin被認為是脂酶與油體間的結合位點。某壹植物中含量最高的oleosin的抗體也能識別同科植物中分子量相近的oleosin,如十字花科的19-20kd、菊科的20kd和豆科的24kdoleosin;不僅如此,不同科間的oleosin也可發生這種交互反應。
不同植物來源的oleosin蛋白具有相同的結構特性,都具有3個基本的結構域,即(1)n端40-60個氨基酸組成的兩親性區域(兼具親水性和親脂性)。這壹區域分布於油體朝向胞漿的壹面。(2)中間68-74個氨基酸組成的高度疏水區域。tzen和huang根據這壹區域中氨基酸殘基極性的分布,推測其為伸入tag基質中的反式平行的β-折疊結構,其頂部具有由3個脯氨酸和1個絲氨酸組成的“脯氨酸結”。這壹區域尤其是“脯氨酸結”在不同來源的oleosin中高度保守,因此從進化上講,該區域可能對植物有重要意義。(3)c端的33-40個氨基酸組成α-螺旋結構域。該結構域兼具親水和親脂性,其帶正電荷的基團朝向pl層帶負電荷的部分(磷脂酰絲氨酸、磷脂酰肌醇、自由脂肪酸等),帶負電荷的部分朝向油體表面(圖2)。對每個oleosin蛋白分子而言,約20%的氨基酸殘基鑲嵌在pl層上,30%浸在tag中,其余50%暴露在油體表面。對oleosin二級結構進行的生化分析支持tzen的這壹模型。lacey等提出新的oleosin二級結構模型:即oleosin中部疏水區域是由“脯氨酸結”連接的兩個分開的α-螺旋結構,並由這個“脯氨酸結”形成180度轉角;n端為β-折疊結構;c端是兼具親水和親脂性的α-螺旋結構,上述兩種模型均有待進壹步的實驗驗證。
2.2 oleosin基因及其表達調控
研究發現裸子植物中只有壹種oleosin,被子植物中的oleosin基因常以基因家族的形式存在,壹種植物中常有幾個oleosin異構體(表1)。各異構體在植物中的表達量、表達部位及表達速度均不相同。如玉米中18kdoleosin的表達量僅為16kd的10%-20%,油菜油體中24kdoleosin僅為20kd的10%。
oleosin基因表達調控的特點:
(1)oleosin基因主要受發育調控,在種子成熟過程中表達。oleosin基因受水分逆境、茉莉酮酸、aba和滲透穩定劑(如山梨糖醇)誘導表達,如油菜的20kdoleosin基因受aba誘導後0-4h檢測到mrna和蛋白質積累;滲透穩定劑(如山梨醇)處理1h可測到mrna,3-6h檢測到oleosin蛋白的積累。在油菜和擬南芥oleosin基因的啟動子區均存在abre(aba-responsive element)基元序列(t/c acgtggc),特異地受aba誘導。(2)oleosin基因的表達具有組織特異性,主要在種子的胚(盾片和胚軸)及糊粉層中表達,de-oliveira等、robert等報道在花粉中發現有壹類特殊的oleosin。油菜小孢子培養來源的球形胚和心形胚中可測出20kd的oleosin,心形胚中可測到相應的mrna,說明oleosin在種子發育的早期就有表達。(3)oleosin基因5`端上遊區域還具有其它調控序列,如在水稻oleosin基因上遊存在谷物貯藏蛋白基因的調控元件catgcang。油菜oleosin啟動子上存在的aatgcatg序列,與控制豆科植物基因種子特異表達的保守序列ry基元序列(catgcatg)高度同源。擬南芥oleosin基因啟動子上存在豆科植物種子蛋白普遍具有的caca(taacaca)序列。(4)oleosin基因雖為組織特異表達,但其5`端卻沒有信號肽序列存在,與此相應的是oleosin蛋白n端也沒有剪切信號序列,推測oleosin基因內部可能有某些序列,或者oleosin蛋白能夠形成某種構象使其定位到油體表面,例如oleosin中部缺失,嚴重影響其在油體上的定位,而n端或c端缺失則影響較小或根本無影響。“脯氨酸結”中的3個脯氨酸突變為亮氨酸的實驗,證明“脯氨酸結”為oleosin定位於油體所必須。oleosin中部疏水區域可能是oleosin的內質網定位信號,但在體外實驗中,“脯氨酸結”突變不影響oleosin內質網上的定位。
2.3 caleosin
用不同方法分離多種植物油體蛋白,發現除oleosin外,還含有少量其它蛋白。1998年chen等首次以免疫標記法確定了芝麻油體中的另外3個種蛋白sop1、sop2和sop3。sop1經氨基酸序列測定,發現它與水稻的壹個鈣結合蛋白同源,因此將這類蛋白命名為caleosin。 caleosin在高等植物中廣泛存在,藻類和真菌中也有類似蛋白。不同來源的caleosin表達特性不同。如水稻caleosin主要在胚形成後期表達,受aba或水分逆境誘導可在幼苗和營養生長組織中表達。與水稻caleosin水同,芝麻caleosin似乎僅為種子特異表達。幹旱狀態下,擬南芥受aba誘導可檢測到caleosin同源蛋白mrna。已知高等植物caleosin蛋白分為3個結構域:(1)n端親水區,含有壹個與ca2+結合的ef-hand。大腸桿菌中表達的ef-hand融合蛋白,在體外實驗中可與ca2+結合。從芝麻油體中分離得到的caleosin1也能與ca2+結合。(2)中部疏水區,該區包括n端的壹個胞外膜定位區和與之相鄰的壹個富脯氨酸區。已知這壹結構僅存在於某些高等植物如芝麻、水稻和擬南芥的caleosin。(3)c端親水區。多數植物caleosin的c端親水區壹般都包括4個激酶磷酸化位點。不同來源caleosin的結構和生物學功能尚不清楚,推測可能參與油體生物合成、脂類的胞內運輸和代謝。
3 植物油體表達體系
3.1 oleosin目的蛋白表達載體的構建
如前所述,所有oleosin均有3個結構域,3個結構域加起來約15kd,但oleosin分子量的判別卻很大(15-26kd),多出的1-11kd以c-端或n-端的延伸形式存在。不同來源的oleosin除中部疏水區域高度保守外,n端和c端核苷酸序列差異很大。這使人們想到,將外源小分子量蛋白編碼基因插入oleosin基因的5`端或3`端,構建由oleosin啟動子驅動的“oleosin目的蛋白”植物表達載體,轉化受體植物,不會影響oleosin在植物油體上的定位。由於oleosin為種子特異表達,並鑲嵌在油體表面,目的蛋白在轉基因植物中是以融合蛋白的形式與oleosin壹起在油體中特異表達。
3.2 植物油體表達體系的優點
3.2.1融合蛋白易於分離 oleosin為種子特異蛋白表達,並鑲嵌在油體表面。外源基因插入oleosin的n端和c端,構成融合蛋白並未改變oleosin的特性。因此利用油體親脂疏水的特性,將轉基因植物種子經粉碎→液體抽提→離心處理,回收上層油相即可將融合蛋白與細胞內其它組分分開,可去除90%以上的種子蛋白。當融合蛋白中插入的目的蛋白為酶時,oleosin-融合蛋白可直接作為酶使用,酶催化反應結束後還可回收,用於下壹次酶促反應(作為固定化酶),壹般重復使用2-3次後,仍保持較強的酶活力。若融合蛋白不具活性,則需將目的蛋白從oleosin上切下來。為此,需在目的蛋白和oleosin基因之間引入壹個蛋白酶酶切位點,比較常用的是溶血酶(thrombin),融合蛋白經酶切後,再設法將兩者分開。
3.2.2融合蛋白在種子中可長期穩定貯存 成熟種子中水解酶活性降低,因此融合蛋白可在種子中長期穩定貯存而不會被降解。據van rooijen和moloney報道,oleosin-gus(β-葡糖醛酸苷酶)融合蛋白在轉基因油菜種子中4℃貯存1年以上,也不降解。
3.2.3種子易於運輸,有利於工業化生產 種子成熟過程中95%以上的水分被蒸發,較植物的其它部分更易於運輸,為大規模生產目的蛋白帶來方便。
3.2.4現在加工機械適用於種子粉碎和油體的分離 例如谷物的加工粉碎用水磨,而乳制品工業中用於分離奶制品的設備可用於液體抽提後油體的離心分離。
3.2.5增加農產品的附加值 分離目的蛋白後的油體仍可作為食用油或工業用油,目的蛋白則可大大增加農產品的附加值。
3.3 用植物油體表達體系已表達的外源蛋白
1991年lee等首次報道將玉米的oleosin基因轉入油菜,玉米oleosin的mrna僅在轉基因植物成熟種子中存在,表達量為種子總蛋白的1%,表達產物90%定位在油體上。單子葉植物玉米的oleosin基因在轉基因油菜油體上的正確轉錄、翻譯和定位,說明單子葉來源的oleosin基因上有足夠的信息可以使它在雙子葉植物中起作用。1996年holbrook等用基因槍轟擊油菜種胚,在短暫表達檢測中發現oleosin-gus融合蛋白在油體上正確定位,進壹步驗證了lee等的實驗結論果。vanrooijen和moloney將gus基因插入擬南芥oleosin基因的3`端,構建以oleosin啟動子驅動的植物表達載體,以農桿菌介導法轉化油菜,在轉基因植株中80%的gus活性在油體上。該實驗還發現oleosin-gus融合蛋白本身就具有β-葡糖醛酸苷酶的活性,而不必將gus從oleosin上切下來。由於融合蛋白結合在油體上,因此可作為固定化酶多次重復使用。1995年parmenter等構建了由擬南芥oleosin啟動子驅動的oleosin-水蛭素融合蛋白表達載體,轉化油菜,經免疫熒光檢測,融合蛋白定位在油體表面,表達量占種子總蛋白的1%。將水蛭素與oleosin蛋白酶切分離後,得到具有生物學活性的水蛭素。該實驗發現雖然oleosin-gus融合蛋白具有生物學活性,但oleosin-水蛭素融合蛋白卻沒有水蛭素特有的抗凝血酶活性,必需將其從融合蛋白上酶切下來。1997年liu等利用植物油體表達體系在轉基因油菜中成功地表達了來自瘤胃真菌的木聚糖酶。
3.4 受體作物和目的蛋白的選擇
受體作物應選擇油脂含量高、遺傳轉化容易的作物。目的蛋白的選擇應考慮:(1)分子量不宜太大,以防影響融合蛋白在油體表面的正確定位。目前利用油體表達的目的蛋白最大的是67kd的gus;(2)目的蛋白應有壹定的親水性,尤其當需將目的蛋白從融合蛋白上切下時;(3)功能清楚,基因序列已知;(4)價格昂貴,有良好的商業價值,可顯著提高農產品的附加值。
基於以上考慮,我們實驗室選擇以油菜、棉花為受體。為研究植物油體表達體系的適用性,我們選擇以c端需酰胺化才有生物學活性的降鈣素作為目的蛋白,目前已獲得轉基因棉花第4代株系和轉基因油菜植株。轉基因油菜經pcr檢測,證明降鈣素基因已整合到油菜基因組中。轉基因棉花經pcr-southern和western檢測,證明目的基因已在棉花中整合並在油體中表達。轉基因植株中目的蛋白的表達量和生物學活性檢測正在進行中。“壹種新型鮭魚降鈣素類似物及利用植物油體表達體系生產外源蛋白的方法”已申請國家專利(另文報道)。
4 前景和問題
用油體表達體系成功地表達gus、水蛭素、木聚糖酶、降鈣素等外源蛋白,尤其是與固定化酶技術結合,無疑使人們看到了其在工業化生產目的蛋白方面的應用前景,但作為壹種新型植物生物反應器,還有許多問題需要進壹步的研究和探討,包括:(1)如何進壹步提高蛋白表達量和降低目的蛋白的分離純化成本。當oleosin-融合蛋白不具生物活性時,這壹問題就更加突出,目的蛋白酶切、分離和純化成本高,將嚴重影響這壹體系的實際應用。(2)已知有些蛋白糖基化、酰胺化後才具有生物活性,油體表達體系中目的蛋白能否糖基化和酰胺化以及糖基化、酰胺化程度如何,還有待更多的實驗研究。油體表達體系的局限性還表現在對目的蛋白的分子量、親水和疏水性有壹定的要求。沒有壹種表達體系是萬能的,如何揚長避短,充分利用不同表達體系的優點,表達適當的目的蛋白以造福人類,這是今後需要深入研究的課題。
摘自:《農業生物技術》2003,11(5):531-537