与片段CAGAp互补商品的片段是TCTGp为什么不是UCUGp

适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶的制作方法
专利名称适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶的制作方法
技术领域本发明是生物技术领域。更具体地,本发明设计鉴定编码Δ12脂肪酸去饱和酶的核酸片段,所述酶可用于破坏或者增强油质微生物,如油质酵母中多不饱和脂肪酸的产生。
背景技术很久就认识到某些多不饱和脂肪酸,或者PUFA,是健康细胞的重要生物组分。例如,认识到此类PUFA为·“必需”脂肪酶,其不能在哺乳动物中从头合成,必须在食物中获得或者通过亚油酸(LA)或者α-亚麻酸(ALA)的进一步去饱和和延长得到;·细胞的质膜成分,其中他们可以以诸如磷脂或者甘油三酯的形式发现;·对于本身发育,尤其在正发育的婴儿脑中,和对于组织形成和修复是必须的;和·在哺乳动物中重要的一些生物活性类花生酸的前体,包括前列环素、类花生酸、白三烯和前列腺素。
在20世纪70年代,Greenland Eskimos的观察将心脏病的低发病率和长链ω-3 PUFAs的大量摄入联系起来(Dyerberg,J.等人,Amer.J.Clin Nutr.75);Dyerberg,J.等人,Lancet 2((July 15,1978))。更近的研究已经证实了ω-3 PUFAs的心血管保护作用(Shimokawa,H.,World Rev NutrDiet,01);von Schacky,C.,和Dyerberg,J.,World Rev Nutr Diet,1))。此外,已经发现一些病症响应ω-3脂肪酸的治疗,所述病症为诸如血管成形术后再狭窄率、炎症和类风湿性关节炎、哮喘、银屑病和湿疹的症状。已经表明γ-亚麻酸(GLA,一种ω-6 PUFA)降低与压力相关的血压升高和改善算术测验的表现。已经表明GLA和二同型-γ-亚麻酸(DGLA,另一种ω-6 PUFA)抑制血小板聚集、导致血管舒张、降低胆固醇水平和抑制血管壁平滑肌和纤维组织的增殖(Brenner等人,Adv.Exp.Med.Biol.6))。已经表明GLA或者DGLA单独或者与二十碳五烯酸(EPA,一种ω-3 PUFA)联合施用减少或者预防非甾体抗炎药导致的胃肠道出血和其他副作用(U.S.4,666,701)。此外,已经表明GLA和DGLA预防或者治疗子宫内膜异位和月经前期综合征(U.S.4,758,592)和治疗病毒感染后的肌痛性脑脊髓炎和慢性疲劳(U.S.5,116,871)。其他证据表明PUFAs可能涉及钙代谢的调节,提示它们可用于治疗或者预防骨质疏松和肾和尿道结石。最后,PUFAs可以用于治疗癌症和糖尿病(U.S.4,826,877;Horrobin等人,Am.J.Clin.Nutr.57(Suppl.)732S-737S(1993))。
PUFAs通常分成两种主要类别(由ω-6和ω-3脂肪酸组成),所述类别通过必需脂肪酸LA和ALA的去饱和和延长得到。尽管存在来自天然途径的多种通过商业途径可以获得的PUFAs[例如,月见草、琉璃苣和黑加仑的种子;丝状真菌(被孢霉属,Mortierella),Porphyridium(红藻),鱼油和海洋浮游生物(Cyclotella,Nitzschia,Crypthecodinium)],但是这些生产方法具有一些缺点。首先,天然来源如鱼和植物倾向于具有高度异质的油组分。因此,从这些来源得到的油需要多方面纯化以分离或者富集一种或多种所希望的PUFAs。天然来源在有效性方面也受到不可控制的波动性(例如,由于天然、痰病或者对于鱼原料,由于过度捕捞);并且,产生PUFAs的作物通常与开发用于食物生产的杂交作物在经济上没有竞争性。天然产生PUFAs的一些生物(例如,Porphyridium,被孢霉属)的大规模发酵也可能是昂贵和/或难以在商业规模上培养。
由于上述限制,已经进行了大量工作以1)开发容易经济生产的PUFAs的重组来源;和2)修饰脂肪酸生物合成途径以能够产生所希望的PUFAs。例如,在过去几年里已经在分离、克隆和操作来自多种生物的脂肪酸去饱和酶和延伸酶(elongase)基因中取得了进展。这些基因序列的知识提供了在不天然产生PUFAs的新的宿主生物中产生所希望的脂肪酸和/或脂肪酸组合物的前景。文献报导了在酿酒酵母(Saccharomyces cerevisiae)中的许多实例,如Domergue,F.,等人(Eur.J.Biochem.3(2002)),其中,将来自海洋硅藻(Phaeodactylum tricornutum)的两种去饱和酶克隆到酿酒酵母中,导致产生EPA;Beaudoin F.,等人(Proc.Natl.Acad.Sci.U.S.A.97(12)0)),其中使用来自秀丽隐杆线虫(Caenorhabditis elegans)的基因,在酿酒酵母中重构ω-3和ω-6PUFA生物合成途径;Dyer,J.M.,等人(Appl.Eniv.Microbiol.,02)),其中在酿酒酵母中表达植物脂肪酸去饱和酶(FAD2和FAD3),和U.S.6,136,574(Knutzon等人,AbbottLaboratories),其中将来自Brassica napus的一种去饱和酶和来自真菌Mortierella alpina的两种去饱和酶克隆到酿酒酵母中,导致产生LA、GLA、ALA和STA。然而,仍然需要适宜的微生物系统,在所述系统中可以表达这些类型的基因以提供一种或多种PUFAs的经济量的商业生产。此外,需要富含特定PUFAs的油,特别是EPA和DHA。
以前未调查作为PUFAs的生产平台的一类微生物是油质酵母。这些生物积累高达它们的干细胞重量的80%的油。生长具有高油含量的油质酵母的技术是成熟的(例如,见EP 0 005 277Bl;Ratledge,C.,Prog.Ind.Microbiol.82)),并且与商业微藻发酵生产ω-3-或ω-6 PUFAs相比可以提供成本优势。完整酵母细胞还可以代表封装富含ω-3或ω-6 PUFA的油用于功能性食物和动物饲料补充物的方便的方法。
尽管具有上述优点,但是多数油质酵母天然缺乏ω-3和ω-6PUFA,因为这些生物中天然产生的PUFAs通常局限于18:2脂肪酸(较不常见地;18:3脂肪酸)。从而,待解决的问题是开发积累富含ω-3和/或ω-6脂肪酸的油。为此,不仅必需引入允许在油质酵母中合成和积累ω-3和/或ω-6脂肪酸的所需要的去饱和酶和延伸酶,而且必需增加18:2底物(即,LA)的有效性。通常,该底物的有效性受到Δ12去饱和酶的活性的控制,Δ12去饱和酶催化油酸向LA的转化。
在公共文献中公开了多种已知的Δ12去饱和酶,它们的一些来自真菌来源(例如,高山被孢霉(Mortierella alpina)、Emericellanidulans、鲁西毛霉(Mucor rouxii))。还未知这些去饱和酶可以有效改变油质酵母中的脂肪酸组成,尽管例如,高山被孢霉去饱和酶以前已经在非油质酵母酿酒酵母中表达并且能够积累18:2(Sakuradani E.,等人,Eur J Biochem.261(3)812-20(1999))。WO 描述了来自粗糙脉孢霉(Neurosporacrassa)和灰葡萄孢(Botrytis cinerea)的Δ12去饱和酶。在酿酒酵母中的随后表达证实了粗糙脉孢霉能够将油酸转化成18:2;然而,该反应的百分数底物转化为仅68%(计算为([18:2]/[18:1+18:2])*100)。从而,需要鉴定和分离编码Δ12去饱和酶的基因,所述Δ12去饱和酶能够支持在产油宿主生物(例如,油质酵母)中产生高水平18:2(LA)以用于生产PUFAs。
通过从真菌串珠镰孢(Fusarium moniliforme)分离编码Δ12去饱和酶的基因并阐明当在油质酵母中表达是将油酸转化成18:2(LA)的令人惊奇的有效转化,申请人解决了所陈述的问题。此外,在构巢曲霉(Aspergillus nidulans)、黄曲霉(Aspergillus flavus)、烟曲霉(Aspergillus fumigatus)、Magnaporthe grisea,粗糙脉孢霉和禾本科镰孢(Fusarium graminearium)中已经鉴定了该Δ12去饱和酶的直向同源物(ortholog)。
发明概述本发明涉及从镰孢菌(Fusarium)分离的编码Δ12去饱和酶的基因,其用于操作生物化学途径,导致产生ω-3和ω-6脂肪酸。因此,本发明提供了编码真菌Δ12去饱和酶的分离的核酸片段,其选自由(a)分离的核酸片段,其编码如SEQ ID NO4中给出的氨基酸序列;(b)分离的核酸片段,其与(a)在下面的条件下杂交0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗涤;或者(c)分离的核酸片段,其与(a)或者(b)互补,构成的组。
在一个特定实施方案中,本发明提供了分离的核酸片段,其包含第一种核苷酸序列,该核苷酸序列编码Δ12去饱和酶,基于Clustal比对方法与具有SEQ ID NO3中给出的序列的核酸片段比较时具有至少89.2%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
类似地,本发明提供了分离的核酸片段,其包含编码至少477个氨基酸的Δ12去饱和酶的第一种核苷酸序列,所述Δ12去饱和酶基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少95%同一性;或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。
类似地,本发明提供了本发明的分离的核酸编码的多肽以及这些核酸的遗传嵌合体和包含该遗传嵌合体的经转化的宿主细胞。
在另一实施方案中,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)用本发明的核酸序列探测基因组文库;(b)鉴定与本发明的核酸片段杂交的DNA克隆;和(c)对包含步骤(b)中鉴定的基因组片段测序,其中所测序的基因组片段编码Δ12去饱和酶。
类似地,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括(a)合成对应于SEQ ID NOs4,8,12,16,20,21和22中给出的序列的部分的至少一种寡核苷酸引物;和(b)使用步骤(a)的寡核苷酸引物扩增克隆载体中存在的插入片段;其中所扩增的插入片段编码Δ12去饱和酶的氨基酸序列的一部分。
在另一实施方案中,本发明提供了产生亚油酸的方法,其包括a)提供油质酵母,其包含(i)编码具有Δ12去饱和酶活性的真菌多肽的分离的核酸,所述多肽当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)油酸来源;b)在其中嵌合去饱和酶基因表达并且油酸转化成亚油酸的条件下生长步骤(a)的酵母;和c)任选回收步骤(b)的亚油酸。
类似地,本发明提供了产生ω-3或ω-6多不饱和脂肪酸的方法,其包括a)提供油质酵母,其包含
(i)编码具有Δ12去饱和酶活性的蛋白质的分离的核酸片段,所述蛋白质当基于Clustal比对方法与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(ii)编码功能ω-3/ω-6脂肪酸生物合成途径的基因;b)提供包含油酸的去饱和酶底物的来源;和c)将(a)的油质酵母与(b)的去饱和酶底物在其中产生多不饱和脂肪酸的条件下接触;和d)任选回收步骤(c)的多不饱和脂肪酸。
此外,本发明提供了通过本发明的方法产生的微生物油。
附图简述和序列描述附图说明
图1显示了油质酵母中脂质积累的生物化学机制的示意图。
图2阐明了ω-3和ω-6脂肪酸生物合成途径。
图3阐明了构建用于在Yarrowia lipolytica中基因表达的质粒载体pY5。
图4显示了使用Megalign DNASTAR软件产生的来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质的系统树。
图5显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质之间的逐对比较(%同一性)。
图6显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌的与Yarrowia lipolytica Δ12去饱和酶具有同源性的蛋白质和来自一些其他真菌和非真菌物种的Δ12去饱和酶蛋白质之间的逐对比较(%同一性)。
图7提供了pKUNF12T6E的质粒图。
从下面的详细描述和所附序列描述可以更完全地理解本发明,所述序列描述形成本申请的一部分。
下面的序列符合37C.F.R.§1.821-1.825(“Requirements forPatent Applications Containing Nucleotide Sequences and/orAmino Acid Sequence Disclosures-the Sequence Rules”)并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列表要求(5.2和49.5(a-bis)条,和Section 208和Annex C of theAdministrative Instructions)一致。用于核苷酸和氨基酸序列数据的符号和格式符合37C.F.R.§1.822中给出的条例。
SEQ ID NOs1-22,51和52是表1中鉴定的ORFs编码基因或者蛋白质。
表1去饱和酶基因和蛋白质SEQ ID号概述
SEQ ID NOs23和24分别是引物TEF 5’和TEF 3’,它们用于分离TEF启动子。
SEQ ID NOs25和26分别是用于分离XPR2转录终止子的引物XPR5’和XPR 3’。
SEQ ID NOs27-38对应于用于质粒构造的引物YL5、YL6、YL9、YL10、YL7、YL8、YL3、YL4、YL1、YL2、YL61和YL62。
SEQ ID NOs39和41分别是用于分离Yarrowia lipolytica Δ12去饱和酶基因的鉴定为P73和P76的简并引物。
SEQ ID NOs40和42分别是对应于简并引物P73和P76的简并引物P73和P76的氨基酸共有序列。
SEQ ID NOs43-46分别对应于用于天然Yarrowia lipolyticaΔ12去饱和酶基因的定向破坏的引物P99、P100、P101和P102。
SEQ ID NOs47-50分别对应于筛选所破坏的Y.lipolytica Δ12去饱和酶基因的定向整合的引物P119、P120、P121和P122。
SEQ ID NOs53和54分别对应于扩增全长Y.lipolytica Δ12去饱和酶编码区的引物P147和P148。
SEQ ID NOs55和56分别对应于扩增全长串珠镰孢Δ12去饱和酶编码区的引物P194和P195。
SEQ ID NO57提供了质粒pKUNF12T6E的DNA序列。
SEQ ID NO58对应于Yarrowia lipolytica FBAIN启动子区。
SEQ ID NO59是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的延伸酶1基因的957bp核苷酸序列,而SEQ IDNO60是对应的318个氨基酸的序列。
SEQ ID NO61是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的Δ6去饱和酶基因的1374bp核苷酸序列,而SEQ ID NO62是对应的457个氨基酸的序列。
SEQ ID NO63对应于Yarrowia lipolytica FBA启动子区。
SEQ ID NO64是经密码子优化用于在Y.lipolytica中表达的来自Thraustochytrium aureum的合成的延伸酶2基因的819bp核苷酸序列,而SEQ ID NO65是对应的272个氨基酸的序列。
SEQ ID NO66对应于最适在Yarrowia sp中表达的密码子优化的翻译起始位点。
发明详述根据主题发明,申请人已经分离并证实了编码Δ12去饱和酶的串珠镰孢(Fusarium moniliforme)基因的身份并鉴定了它的在其他真菌中的直向同源物。此外,提供了允许修饰长链多不饱和脂肪酸(PUFA)含量和油质酵母如Yarrowia lipolytica的组分的方法和组合物。
本发明涉及新的Δ12去饱和酶和其编码基因,所述基因可以用于操作用于产生健康PUFAs的生物化学途径。从而,主题发明发现了许多应用。通过本文公开的方法产生的PUFAs或者其衍生物可以用作饮食替代品或者补充物,尤其婴儿配方,用于经历静脉内营养法的患者或者用于预防或者治疗营养不良。备选地,所纯化的PUFAs(或者其衍生物)可以掺入到所配制的烹调油、脂肪或者人造黄油中,从而在正常使用中,受者将接受所希望量的饮食补充。PUFAs还可以掺入到婴儿配方、营养补充品或者其他食品中并且可以用作抗炎剂或者胆固醇降低剂。任选地,组合物可以用于药物用途(人或者兽)。在该情况中,PUFAs通常经口施用但是可以通过任意途径施用,只要通过所述途径PUFAs可以被成功地吸收,所述途径为例如肠胃外(例如,皮下、肌内或者静脉内)、直肠、阴道或者局部(例如,作为皮肤软膏剂或者洗剂)。
用通过重组方法产生的PUFAs补充人或者动物可以导致所加入的PUFAs以及它们的代谢物的水平增加。例如,用花生四烯酸治疗不仅导致ARA水平增加,而且导致ARA的下游产物,如前列腺素的水平增加。复杂调节机制使得希望组合多种PUFAs,或者加入PUFAs的不同缀合物,以便防止、控制或者克服此类机制以实现个体中特定PUFAs的所希望的水平。
定义在本公开中,使用了许多术语和缩写。提供了下面的定义。
“可该框”缩写为ORF。
“聚合酶链式反应”缩写为PCR。
“美国典型培养物保藏中心”缩写为ATCC。
“多不饱和脂肪酸”缩写为PUFA(s)。
术语“串珠镰孢”与“Fusarium verticillioides”同义。
术语“脂肪酸”指约C12到C22的不同链长的长链脂族酸(链烷酸)(尽管更长和更短的链长是已知的)。主要的链长为C16到C22。脂肪酸的结构由简单标记系统“X:Y”代表,其中X是特定脂肪酸中碳原子总数,Y是双键数。
通常,将脂肪酸分类为饱和或不饱和的。术语“饱和脂肪酸”指在它们的碳主链之间没有“双键”。相比,“不饱和脂肪酸”具有“双键”以及它们的碳主链(其最通常为顺式构型)。“单不饱和脂肪酸”沿着碳主链具有仅一个“双键”(例如,对于棕榈油酸(16:1)和油酸(18:1)通常在第9个和第10个碳原子之间),而“多不饱和脂肪酸”(或者“PUFAs”)沿着碳主链具有至少两个双键(例如,对于亚油酸(18:2)为第9和第10个和第12和第13个碳原子之间);对于α-亚麻酸(18:3)为第9和第10、第12和第13和第15和第16个碳原子之间)。
可以将“PUFAs”分类成两个主要家族(根据最接近脂肪酸碳链的甲基末端的第一个双键的位置(n))。从而,“ω-6脂肪酸”(ω-6或n-6)具有距离该分子的ω(甲基)末端6个碳原子的第一个不饱和的双键和额外具有共两个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。相比,“ω-3脂肪酸”(ω-3或n-3)具有距离分子的ω末端三个碳原子的第一个不饱和双键并且额外具有共三个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。
对于本发明,将使用ω参照系统指出碳原子数、双键数目和与ω碳最接近的双键的位置,从ω碳(其对于该目的编号为1)的计数。该命名在下面的表2中标题为“Shorthand Notation”的列中显示。该表达剩余内容总结了ω-3和ω-6脂肪酸的普通名、将用于说明书全文的缩写和每种化合物的“化学名”。
表2多不饱和脂肪酸的命名
术语“基本上脂肪酸”指特定PUFA,个体为了生存必须摄入该PUFA,不能从头合成该特定必需脂肪酸。亚油酸(18:2,ω-6)和亚麻酸(18:3,ω-3)脂肪酸是“必需脂肪酸”,因为人不能合成它们并且必须从他们的饮食得到它们。
术语“脂肪”指在25℃为固体并且通常是饱和的脂类物质。
术语“油”指在25℃为液态并且通常是不饱和的脂类物质。在一些藻类、油质酵母和丝状真菌的油中发现了PUFA。“微生物油”或者“单细胞油”为由微生物在它们的寿命中天然产生的油。此类油可以含有长链PUFA。
术语“PUFA生物合成途径酶”指与PUFA的生物合成相关的下列酶的任一种(和编码所述酶的基因),包括Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、aΔ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶。
术语“ω-3/ω-6脂肪酸生物合成途径”指一组基因,其当在适当条件下表达是编码催化产生ω-3和ω-6脂肪酸的一种或两种的酶。通常,涉及ω-3/ω-6脂肪酸生物合成途径的基因编码一些或者所有下面的酶Δ12去饱和酶、Δ6去饱和酶,延伸酶、Δ5去饱和酶、Δ17去饱和酶,Δ15去饱和酶、Δ9去饱和酶、Δ8去饱和酶和Δ4去饱和酶。代表性途径在图2中阐明,提供了油酸通过多种中间物向DHA的转化,该图阐明了怎样可以从普通来源产生ω-3和ω-6脂肪酸。该途径自然地分成两个部分,其中一个部分将产生ω-3脂肪酸和其他部分,另一部分仅产生ω-6脂肪酸。仅产生ω-3脂肪酸的部分将在本文中称作ω-3脂肪酸生物合成途径,而仅产生ω-6脂肪酸的部分将在本文中称作ω-6脂肪酸生物合成途径。
本文所用术语“功能的”在ω-3/ω-6脂肪酸生物合成途径的上下文中表示该途径中一些(或者所有)基因表达活性酶。将理解“ω-3/ω-6脂肪酸生物合成途径”或者“功能ω-3/ω-6脂肪酸生物合成途径”不暗含上面段落中所列的所有基因都是需要的,因为许多脂肪酸产物将仅需要表达该途径基因的亚组。
术语“去饱和酶”指在一种或多种脂肪酸中去饱和,即引入双键以产生单-或者多不饱和脂肪酸的多肽。尽管在说明书全文中参考特定脂肪酸时使用ω参照系统,但是使用Δ系统通过从底物的羧基末端计数指出去饱和酶的活性更加方便。本文中尤其重要的是Δ12去饱和酶,其去饱和从分子的羧基末端编号的第12到第13个碳原子之间的脂肪酸并且催化油酸向LA的转化。与本公开相关的其他去饱和酶包括Δ15去饱和酶,其催化LA向ALA的转化;Δ17去饱和酶,其催化DGLA向ETA和/或ARA向EPA的转化;Δ6去饱和酶,其催化LA向GLA和/或ALA向STA的转化;Δ5去饱和酶,其催化DGLA向ARA和/或ETA向EPA的转化;Δ4去饱和酶,其催化DPA向DHA的转化;Δ8去饱和酶,其催化EDA向DGLA和/或ETrA向ETA的转化;和Δ9去饱和酶,其催化棕榈酸向棕榈油酸(16:1)和/或硬脂酸向油酸(18:1)转化。在本领域中,Δ15和Δ17去饱和酶还偶然称作“omega-3去饱和酶”,“w-3去饱和酶”,和/或“ω-3去饱和酶”。一些去饱和酶对两种或多种底物(例如,Saprolegnia diclina Δ17去饱和酶的底物,包括ARA和DGLA,而秀丽隐杆线虫ω-3去饱和酶的底物包括LA和GLA)。
术语“具有与Yarrowia lipolytica.Δ12去饱和酶同源性的蛋白质”指在本文中鉴定为SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22并且具有与本文中鉴定为SEQ ID NO52(在共同待决的美国专利申请10/840325中表征,此处将该专利完整引入作为参考)的Y.lipolytica去饱和酶具有同源性的蛋白质。系统进化分析法确定,这些蛋白质(即,SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22)聚簇成两种不同的亚家族,在本文中称作“亚家族1”和“亚家族2”。特别地,亚家族1蛋白质似乎编码Δ15去饱和酶(即,SEQ ID NOs2、6、10、14和18;见共同待决的美国临时申请60/519191,将其完整引入本文作为参考)。相比,亚家族2蛋白质编码如此处表征的具有Δ12去饱和酶活性(即,SEQ ID NOs4、8、12、16、20、21和22)的蛋白质。
术语“转化效率”和“底物转化百分数”指特定酶(例如,去饱和酶或延伸酶)可以将底物转化成产物的效率。根据下面的公式测量转化效率([产物]/[底物+产物])*100,其中,“产物”包括直接产物和该产物所来源的途径中的所有产物。在本申请中,希望鉴定特征是当在油质酵母宿主中表达时具有高底物转化百分数的那些Δ12去饱和酶;从而,例如,优选向LA的转化效率为至少70%,至少80%的向LA的转化效率是尤其适宜的,至少85%的向LA的转化效率是最优选的。
术语“延伸酶”指可以延伸脂肪酸碳链以产生酸的多肽,所述酸比延伸酶所作用的脂肪酸底物长2个碳。该延伸过程以多步机制与脂肪酸合酶联合作用,其中CoA是酰基载体(Lassner等人,The PlantCell 6))。简言之,丙二酸单酰辅酶A与长链酰基辅酶A缩合产生CO2和β-酮酰基-CoA(其中酰基部分已经被延长2个碳原子)。随后反应包括还原成β-羟基酰基-CoA,脱水成烯酰辅酶A,和再次还原产生延伸的酰基-CoA。延伸酶催化的反应的实例是GLA向DGLA,STA向ETA,和EPA向DPA的转化。因此,延伸酶可以具有不同特异性。例如,C16/18延伸酶将优选为C16底物,C18/20延伸酶将优选C18底物,C20/22延伸酶将优选C20底物。以相似的方式,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。
术语“油质的”指倾向于以脂质的形式保存它们的能源的那些生物(Weete,InFungal Lipid Biochemistry,2nded.,Plenum,1980)。这些包括油料种子植物(例如,大豆、玉米、红花、向日葵、芸苔、油菜籽、亚麻、玉米和报春花)和微生物(例如,破囊壶菌(Thraustochytrium sp.,)、Schizochytrium sp.,被孢霉(Mortierella sp.)和某些油质酵母)。
术语“油质酵母”指分类为可以产油的酵母的那些微生物。通常,油质微生物的细胞油或者甘油三酯含量遵循S形曲线,其中脂质浓度增加直到晚对数或者早静止生长期的最大值,然后在晚静止和死亡期期间逐渐减少(Yongmanitchai和Ward,Appl.Environ.Microbiol.1))。油质微生物积累超过它们的干重的约25%的油是常见的。油质酵母的实例包括,但不限于下面的属Yarrowia,假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球菌属(Cryptococcus)、毛孢子菌属(Trichosporon)和油脂酵母属(Lipomyces)。
术语“可发酵的碳底物”指微生物将代谢以产生能量的碳源。本发明的典型的碳底物包括,但不限于单糖、寡糖、多糖、烃类、脂肪酸、脂肪酸酯、甘油单酯、二氧化碳、甲醇、甲醛、甲酸和含碳胺。
术语“密码子优化的”当涉及用于转化多种宿主的核酸片段的基因或者编码区时,指改变核酸分子的基因或者编码区中的密码子以反映宿主生物的典型的密码子选择而不改变DNA编码的多肽。
本文所用的“分离的核酸片段”是单链或者双链RNA或者DNA聚合物,其任选含有合成的、非天然或者改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包含cDNA、基因组DNA或者合成DNA的一个或多个片段。
当核酸片段的单链形式能够与另一种核酸片段在适宜的温度和溶液离子强度条件下退火时,所述核酸片段与所述另一种核酸片段,如cDNA、基因组DNA或者RNA分子是“可杂交的”。杂交和洗涤条件是公知的并且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular CloningA Laboratory Manual,2nded.,Cold SpringHarbor LaboratoryCold Spring Harbor,NY(1989),尤其第11章和表11.1中例证。温度条件和离子强度的条件决定杂交的“严格性”。可以调节严格条件以从中等相似的片段(如来自远相关生物的同源序列)筛选高度相似的片段(如来自近相关生物的一式两份的功能酶)。杂交后洗涤决定严格条件。一组优选条件使用一些列洗涤,其以6X SSC,0.5%SDS在室温下15分钟开始,然后用0.2X SSC,0.5%SDS在50℃30分钟重复两次。一组更优选的严格条件使用更高的温度,其中洗涤与上面的相同,只是最后两次在0.2X SSC,0.5%SDS30分钟洗涤的温度增加到60℃。另一组优选的高度严格条件使用在0.1X SSC,0.1%SDS中65℃下最后两次洗涤。额外组的严格条件包括例如,在0.1X SSC,0.1%SDS,65℃杂交和用2X SSC,0.1%SDS然后用0.1X SSC,0.1%SDS洗涤。
杂交需要两种核酸含有互补序列,尽管取决于杂交的严格性,但是碱基之间的错配是可能的。杂交的核酸分子的适宜严格性取决于核酸的长度和互补程度——本领域公知的变量。两种核酸序列之间相似性或者同源性程度越大,具有那些序列的核酸的杂交分子的Tm值越大。核酸杂交的相对稳定性(对应于较高的Tm)以下面的顺序减小RNA:RNA,DNA:RNA,DNA:DNA。对于长度大于100个核苷酸的杂交分子,已经推导了计算Tm的方程(见Sambrook等人,上文,9.50-9.51)。对于与较短核酸,即寡核苷酸的杂交,错配的位置变得重要,并且寡核苷酸的长度决定了它的特异性(见,Sambrook等人,上文,11.7-11.8)。在一个实施方案中,可杂交的核酸的长度为至少约10个核苷酸。优选地,可杂交的核酸的最小长度为至少约15个核苷酸,更优选至少约20个核苷酸;最优选地,长度为至少约30个核苷酸。此外,技术人员将认识到如必要,可以根据诸如探针长度的因子调节温度和洗涤溶液盐浓度。
氨基酸或者核苷酸序列的“实质部分”是包含包含多肽的氨基酸序列或者基因的核苷酸序列的足够部分的部分,推定所述部分鉴定该多肽或者基因,所述鉴定可以通过由本领域技术人员通过序列的手工评价或者通过计算机自动化的序列比较进行和使用诸如BLAST(BasicLocal Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.(1993))的算法鉴定。通常,为了假定鉴定与已知蛋白质或者基因同源的多肽或者核酸序列,10或更多连续氨基酸或者30或更多核苷酸的序列是必要的。此外,关于核苷酸序列,包含20-30个连续核苷酸的基因特异的寡核苷酸探针可以用于基因鉴定(例如,DNA杂交)和分离(例如,细菌菌落或者噬菌体噬菌斑的原位杂交)的依赖序列的方法。此外,12-15个碱基的短寡核苷酸可以用作PCR中的扩增引物以便得到包含引物的特定核酸片段。因此,核苷酸序列的“实质部分”包含足够序列以特异鉴定和/或分离包含所述序列的核酸片段。本说明书教导了编码特定真菌蛋白质的完整氨基酸和核苷酸序列。技术人员拥有本文所报导的益处,现在可以为了本领域技术人员已知的目的使用所公开序列的所有或者实质部分。因此,本发明包含如所附序列表中报导的完整序列,以及如上面定义的那些序列的实质部分。
术语“互补的”用于描述能够相互杂交的核苷酸碱基之间的关系。例如,关于DNA,腺苷与胸苷互补,胞苷与鸟苷互补。因此,本发明还包括与所附序列表中报导的完整序列互补的分离的核酸片段,以及那些实质上相似的核酸序列。
如本领域已知的术语“同一性百分数”是如通过比较序列确定的两种或多种多肽序列或者两种或多种多核苷酸序列之间的关系。在本领域中,“同一性”还指多肽或者多核苷酸序列之间的序列相关性程度,根据具体情况而定,如通过此类序列的字符串之间的匹配决定。“同一性”和“相似性”可以通过已知方法容易地计算,所述方法包括但不限于如下文献中描述的1.)Computational MolecularBiology(Lesk,A.M.,Ed.)Oxford UniversityNY(1988);2.)BiocomputingInformatics and Genome Projects(Smith,D.W.,Ed.)AcademicNY(1993);3.)Computer Analysis ofSequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,Eds.)HumaniaNJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.,Ed.)Academic(1987);and 5.)SequenceAnalysis Primet(Gribskov,M.and Devereux,J.,Eds.)StocktonNY(1991)。设计确定同一性的优选方法以得到所测试序列之间的最佳匹配。确定同一性和相似性的方法在公众可利用的计算机程序中编码。序列比对和同一性百分数计算可以用LASERGENE生物信息学计算套件(DNASTAR Inc.,Madison,WI)的Megalign程序进行。除非另外说明,序列的多重比对使用Clustal比对方法(Higgins和Sharp,CABIOS.9)),使用默认参数(GAP PENALTY=10,GAPLENGTH PENALTY=10)进行。使用Clustal方法进行逐对比对的默认参数为KTUPLE 1,GAP PENALTY=3,WINDOW=5和DIAGONALS SAVED=5。
适宜的核酸片段(本发明的分离的多核苷酸)编码与本文报导的氨基酸序列具有至少约70%同一性,优选约75%同一性,更优选约80%同一性的多肽。优选的核酸片段编码与本文报导的氨基酸序列具有约85%同一性的氨基酸序列。更优选的核酸片段编码与本文报导的氨基酸序列具有约90%同一性的氨基酸序列。更优选的为编码与本文报导的氨基酸序列具有约95%同一性的氨基酸序列。适宜的核酸片段不仅具有上面的同源性而且通常编码具有至少50个氨基酸,优选至少100个氨基酸,更优选至少150个氨基酸,更优选至少200个氨基酸,最优选至少250个氨基酸的多肽。
术语“同源性”指序列之间的关系,所述序列中存在一定程度的相似,其通常是由于从共同的祖先序列演化。同源序列可以具有基因的、结构的、功能的和/或行为的性质而具有同源性。术语“直向同源物”或者“直向同源序列”在本文指其中物种形成后序列趋异的关系(即,不同物种中的同源序列从物种形成期间的共同祖先基因产生)。相比,术语“共生同源的”指一个物种内由于基因复制引起的同源序列。本领域技术人员将熟悉鉴定同源、直向同源和共生同源序列所需的技术。
“密码子简并”指遗传密码中的性质,其允许改变核苷酸序列而不影响所编码的多肽的氨基酸序列。本领域技术人员熟知核苷酸密码子选择中特定宿主细胞显示出的“密码子偏爱”以指定给定氨基酸。因此,当合成用于在宿主细胞中提高表达的基因时,希望设计该基因使得它的密码子选择频率接近该宿主细胞的优选密码子选择的频率。
“化学合成的”当涉及DNA序列时,指在体外装配组分核苷酸。DNA的手工化学合成可以使用成熟的方法完成;或者自动化化学合成可以使用许多通过商业途径可获得的机器来进行。使用本领域技术人员公知的步骤,可以从化学合成的寡核苷酸构件装配“合成基因”。这些构件连接并退火形成基因片段,其然后酶促装配以构造完整基因。因此,可以基于核苷酸序列的优化以反映宿主细胞的密码子偏爱来定制基因用于最佳基因表达。技术人员明白如果密码子选择偏向宿主喜爱的那些密码子,那么可能进行成功的基因表达。可以基于来自宿主的基因的考察确定优选的密码子,其中所述基因的序列信息是可得的。
“基因”指表达特定蛋白质的核酸片段,并且可以指仅编码区或者可以包括编码序列前(5’-非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”指在自然中发现的基因与其自己的调节序列。“嵌合基因”指不是天然基因的任意基因,其包含未在自然界中发现在一起的调节序列和编码序列。因此,嵌合基因可以包含不同的来源的调节序列和编码序列,或者来自相同来源,但是以不同于在自然中发现的方式排列的调节序列和编码序列。“内源基因”指位于生物的基因组中它的天然位置中的天然基因。“外源”基因指通过基因转移导入宿主生物的基因。外源基因可以包含导入非天然生物的天然基因、导入天然宿主内的新位置的天然基因,或者嵌合基因。“转基因”是通过转化方法导入基因组中的基因。“密码子优化的基因”是这样的基因,将其密码子选择频率设计成模拟宿主细胞的优选密码子选择的频率。
“编码序列”指编码特定氨基酸序列的DNA序列。“适宜的调节序列”指位于编码序列的上游(5’非编码序列)、内部或者下游(3’非编码序列)并且影响相关编码序列的转录、RNA加工或者稳定性,或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。
“启动子”指能够控制编码序列或者功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3’。启动子可以完整地来自天然基因,或者可以由来自自然界中发现的不同启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域技术人员发现不同启动子可以指导基因在不同组织或者细胞类型,或者在不同发育阶段中,或者应答不同环境或者生理条件表达。导致基因在多数细胞类型中在多数时间表达的启动子通常称作“组成型启动子”。还认识到因为在多数情况中,调节序列的确切边界还没有被完全限定,所以不同长度的DNA片段可能具有相同启动子活性。
术语“3’非编码序列”和“转录终止子”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常的特征是影响多腺苷酸序列向mRNA前体的3’末端的加入。3’区可以影响相关编码序列的转录、mRNA加工或稳定性,或者翻译。
“RNA转录物”指DNA的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列完全互补拷贝时,它称作初级转录物,或者它可以是来自初级转录物的转录后加工的RNA序列并且称作成熟RNA。“信使RNA”或者“mRNA”指没有内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补或者来自mRNA的双链DNA。“有义”RNA指包括mRNA并且可以因此由细胞翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或者mRNA的所有或者部分互补并且阻断靶基因的表达的RNA转录物(U.S.5,107,065;WO 99/28508)。反义RNA的互补性可以是与特定基因转录物的任意部分,即在5’非编码序列、3’非编码序列或者编码序列处互补。“功能RNA”指没有翻译然而对细胞过程具有影响的反义RNA、核酶RNA或者其他RNA。
术语“可操作地连接”指一个核酸片段上核酸序列的结合使得一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,编码序列处于启动子的转录控制下)时,启动子可操作地连接编码序列。编码序列可以以有义或者反义方向可操作地连接调节序列。
本文所用术语“表达”指来自本发明的核酸片段的有义(mRNA)或者反义RNA的转录和稳定积累。表达还可以指mRNA翻译成多肽。
“成熟”蛋白质指翻译后加工的多肽;即已经从初级转录产物除去任何前肽的多肽。“前体”蛋白质指mRNA翻译的初级产物;即仍然存在前肽。前肽可以是(但是不限于)细胞内定位信号。
“转化”指将核酸片段转移到宿主生物,导致基因稳定的遗传。核酸片段可以是例如自主复制的质粒;或者它可以整合到宿主生物的基因组中。含有所转化的核酸片段的宿主生物称作“转基因的”或者“重组的”或者“转化的”生物。
术语“质粒”、“载体”和“盒”指染色体外元件,其通常携带不是细胞的中心代谢部分的基因,并且通常为环形双链DNA片段的形式。此类元件可以是来自任意来源的线性或环状的单链或者双链DNA或者RNA的自主复制的序列、基因组整合序列、噬菌体或者核苷酸序列,其中许多核苷酸序列已经连接或者重组成独特的结构,其能够例如,将启动子片段和所选基因产物的DNA序列以及合适的3’非翻译序列导入细胞中。“转化盒”指特定载体,其含有外源基因并且具有除了外源基因之外的元件,所述元件方便转化特定宿主细胞。“表达盒”指特定载体,其含有外源基因和除了该外源基因之外的元件,所述元件允许该基因在外来宿主中增强的表达。
术语“同源重组”指两个DNA分子之间DNA片段的交换(在交换期间)。被交换的片段的侧翼是两个DNA分子之间相同核苷酸序列的位点(即,“同源区”)。术语“同源区”指核酸片段上的核苷酸序列段,其参与相互同源的核酸片段的同源重组。当同源区具有至少约10bp长度,优选具有至少约50bp长度时,通常将发生同源重组。通常,意在用于重组的片段含有至少两个同源区,其中希望靶基因破坏和替换。
术语“序列分析软件”指可用于分析核苷酸或者氨基酸序列的任意计算机算法或者软件程序。“序列分析软件”可以通过商业途径获得或者独立开发。通常,序列分析软件将包括,但不限于1)GCG程序套包(Wisconsin Package版本9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(Gene Codes Corporation,AnnArbor,MI);和5.)FASTA程序,其整合Smith-Waterman算法(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date .Editor(s)Suhai,Sandor.PlenumNew York,NY)。在本申请的上下文内,将理解除非另外指出,当使用序列分析软件进行分析时,分析的结果将基于所参考程序的“默认值”。本文所用的“默认值”将指当软件首次初始化时最初加载的任何一组值或者参数。
用于本文的标准重组DNA和分子克隆技术是本领域公知的并且由Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular CloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1989)(下文中,“Maniatis”);Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1984);和Ausubel,F.M.等人,Current Protocols inMolecular Biology,published by Greene Publishing Assoc.andWiley-Interscience(1987)描述。
脂肪酸的微生物生物合成通常,油质微生物中脂质积累由对生长培养基中存在的总的碳氮比率引发(图1)。当细胞耗尽可利用的氮供应(例如,当碳氮比率大于约40)时,细胞腺苷一磷酸(AMP)的耗尽导致线粒体中AMP-依赖的异柠檬酸脱氢酶活性的停止,将柠檬酸转运到胞质溶胶中,和随后由ATP-柠檬酸裂合酶切割以产生乙酰辅酶A。乙酰辅酶A是脂肪酸的从头生物合成的基本构件。尽管可以有效代谢以产生乙酰辅酶A的任意化合物都可以用作脂肪酸的前体,但是葡萄糖是该类型反应中的主要来源(图1)。葡萄糖通过糖酵解转化成丙酮酸,丙酮酸然后被转运到线粒体中,在线粒体中丙酮酸可以由丙酮酸脱氢酶(“PD”)转化成乙酰辅酶A。因为乙酰辅酶A不能通过线粒体膜直接转运到细胞质中,所以来自乙酰辅酶A的两个碳与草酰乙酸缩合产生柠檬酸(由柠檬酸合成酶催化)。柠檬酸直接转运到细胞质中,在细胞质中它被ATP-柠檬酸裂合酶切割以再生乙酰辅酶A和草酰乙酸。草酰乙酸通过转化成苹果酸再次进入三羧酸循环。
丙二酸单酰辅酶A的合成是脂肪酸生物合成的首先进行的步骤,它发生在细胞质中。由乙酰辅酶A羧化酶(“ACC”)对乙酰辅酶A的羧化产生丙二酸单酰辅酶A。脂肪酸合成由多酶脂肪酸合成酶复合体(“FAS”)催化并且通过8个二碳片段(来自乙酰辅酶A的乙酰基)的缩合形成16碳饱和脂肪酸棕榈酸。更具体地,FAS催化一系列7次反应,其包括下面的(Smith,S.FASEB J.,8(15)4))1.乙酰辅酶A和丙二酸单酰辅酶A转移到FAS的酰基载体蛋白质(ACP)。然后乙酰基转移到丙二酰基,形成β-酮丁酰基-ACP并释放CO2。
2.β-酮丁酰基-ACP经历还原(通过β-酮酰基还原酶)和脱水(通过β-羟基酰基脱水酶)形成反式-单不饱和的脂肪酰基。
3.双键由NADPH还原,产生比最初的饱和脂肪酰基长2个碳的饱和脂肪酰基。然后再生该丁酰基与新的丙二酰基缩合和重复延伸步骤的能力。
4.当脂肪酰基变成长16个碳时,硫酯酶活性将其水解,释放游离棕榈酸。
棕榈酸(16:0)是更长链饱和和不饱和脂肪酸(例如,硬脂酸(18:0),棕榈油酸(16:1)和油酸(18:1))通过内质网膜中存在的延伸酶和去饱和酶的作用的前体。棕榈酸和硬脂酸(作为辅酶A和/和ACP酯)通过Δ9去饱和酶的作用分别转化成它们的不饱和衍生物棕榈油酸(16:1)和油酸(18:1)。
通过两分子的乙酰辅酶A与甘油-3-磷酸的酯化产生1,2-二酰基甘油磷酸(通常称作磷脂酸)形成三酰基甘油(脂肪酸的主要储存单位)(图1)。然后由磷脂酸磷酸酶除去磷酸产生1,2-二酰基甘油。当加入第三种脂肪酸,例如,通过二酰基甘油-酰基转移酶的作用形成三酰基甘油。
ω脂肪酸的生物合成简言之,将LA转化成GLA、DGLA和ARA(ω-6途径)和将ALA转化成STA、ETA、EPA、DPA和DHA(ω-3途径)的代谢过程包括通过加入两个碳单位和通过加入双健对分子去饱和延伸碳链(图2)。这序列存在于内质网膜中的一系列专门的去饱和和延伸酶。
ω-6脂肪酸油酸通过Δ12去饱和酶的作用首先转化成ω-6脂肪酸。随后ω-6脂肪酸如下产生1)LA通过Δ6去饱和酶转化成GLA;2)GLA通过延伸酶的作用转化成DGLA;和3)DGLA通过Δ5去饱和酶的作用转化成ARA。
ω-3脂肪酸亚油酸(LA)通过Δ15去饱和酶的作用首先转化成ω-3脂肪酸。随后,ω-3脂肪酸以相似于ω-6脂肪酸的一系列步骤产生。特别地1)ALA通过Δ6去饱和酶的活性转化成STA;2)STA通过延伸酶的活性转化成ETA;和3)ETA通过Δ5去饱和酶的活性转化成EPA。备选地,可以通过Δ17去饱和酶的活性分别从DGLA和ARA产生ETA和EPA。EPA可以通过延伸酶和Δ4去饱和酶的活性进一步转化成DHA。
在备选实施方案中,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。Δ8去饱和酶然后将这些产物分别转化成DGLA和ETA。
参与ω脂肪酸产生的基因许多微生物,包括藻类、细菌、霉和酵母可以在细胞代谢的普通过程中合成PUFAs和ω脂肪酸。尤其充分研究的是真菌,包括Schizochytrium aggregatm,破囊壶菌属的种和Morteriellaalpin。此外,许多甲藻(甲藻纲)天然产生高浓度PUFA。同样的,通过遗传方法已经鉴定了参与油产生的多种基因并且这些基因的一些的DNA序列可以公开得到(非限制性实例在下表3中显示)
表3参与PUFA产生的一些可公开得到的基因
表3续参与PUFA产生的一些可公开得到的基因
表3续参与PUFA产生的一些可公开得到的基因
此外,专利文献提供了许多参与油产生的基因的额外的DNA序列(和/或关于一些上面基因的细节和它们的分离方法)。见,例如,U.S.5,968,809(Δ6去饱和酶s);U.S.5,972,664和U.S.6,075,183(Δ5去饱和酶s);WO 91/13972和U.S.5,057,419(Δ9去饱和酶s);U.S.A1(Δ17去饱和酶s);WO 02/090493(Δ4去饱和酶s);WO 93/11245和WO 03/099216(Δ15去饱和酶s);WO 00/12720和U.S.A1(延伸酶)。这些专利和申请的每一个都完整引入本文作为参考。
本文中尤其重要的是Δ12去饱和酶,更具体地,适于在油质酵母(例如,Yarrowia lipolytica)中异源表达的Δ12去饱和酶。一些Δ12去饱和酶(即,Glycine max、Brassica napus、拟南芥、蓖麻(Ricinus communis)、玉米(Zea mays);粗糙脉孢霉、灰葡萄孢)的序列在WO 94/11516和WO 03/099216中公开。
此外,最近分离和表征了天然Yarrowia lipolytica Δ12脂肪酸去饱和酶(见,共同待决的美国专利申请10/840325,将其完整引入作为参考;也参加本文的实施例2和3,和SEQ ID NOs51和52)。简言之,使用简并PCR引物通过PCR从Yarrowia lipolytica克隆了部分推定的Δ12去饱和酶DNA片段。使用所产生的片段对内源Yarrowialipolytica Δ12去饱和酶基因的定向破坏在所破坏的菌株中产生水平增加的18:1和没有可检测的18:2,从而证实除去了天然Δ12去饱和酶活性。随后,使用质粒拯救分离的所整合质粒侧翼的基因组DNA序列并装配了全长Yarrowia lipolytica Δ12去饱和酶基因(SEQ IDNO51)。该序列包括1257个碱基的可该框(SEQ ID NO51的核苷酸+283到+1539),而所推导的编码氨基酸序列长为419个残基(SEQ IDNO52)。该Δ12去饱和酶的过表达适于增加油酸向LA的底物转化百分数(计算为([18:2]/[18:1+18:2])*100),从而它从野生型细胞中的59%增加到所转化的宿主细胞中的74%。尽管这些宿主细胞内LA的增加的可用性,但是希望得到甚至更大的底物库,其适于能够在Y.lipolytica转化细胞中高水平产生多种ω-3和/或ω-6 PUFAs。从而,具有高水平Δ12去饱和酶活性的异源蛋白质的表达在工程化生物的途径中是有益的。
许多因素影响具有Δ12去饱和酶活性的特定多肽的选择,所述多肽将在宿主细胞中表达以产生PUFAs(任选联合其他去饱和酶和延伸酶)。取决于宿主细胞,底物的有效性,和目的终产物、一些多肽是重要的;然而,对选择具有去饱和酶活性的特定多肽的考虑包括所述多肽的底物特异性,而不管所述多肽或者其组分是限速酶,该去饱和酶是所希望的PUFA的合成必需的,和/或该多肽需要辅因子。所表达的多肽优选具有于它在宿主细胞中的位置的生物化学环境相容。例如,所述多肽可以必须与宿主细胞中的其他酶竞争底物。因此,在确定给定多肽用于修饰给定宿主细胞中PUFA产生的适宜性中,考虑所述多肽的KM和比活的分析。用于具体宿主细胞的多肽是在目的宿主细胞中存在的生物化学条件下有功能的多肽,但是另外可以是具有能够修饰所希望的脂肪酸(即,油酸)的Δ12去饱和酶活性的任意多肽。从而,所述序列可以来自任意来源,例如,从天然来源分离(来自细菌、藻类、真菌、植物、动物等等),通过半合成途径产生或者从头合成。
对于本发明,然而,最希望具有Δ12去饱和酶活性的多肽当在所希望的宿主细胞中表达时具有至少约70%的转化效率,其中至少约80%的转化效率尤其合适,至少约85%的转化效率是最优选的。
鉴定新的真菌Δ12去饱和酶使用Yarrowia lipolytica Δ12去饱和酶蛋白质序列(SEQ IDNO52)作为查询序列,通过序列比较在本文中鉴定了来自串珠镰孢的新的Δ12去饱和酶。特别地,用Yarrowia查询序列搜索串珠镰孢菌株M-8114的专有的DuPont已表达序列标志(EST)文库(E.I.du Pont deNemours and Co.,Inc.,Wilmington,DE)的推定的编码的蛋白质序列。这导致鉴定了两种同源序列Fm1(SEQ ID NO2)和Fm2(SEQ IDNO4),它们分别由核苷酸序列SEQ ID NOs1和3编码。
还将Yarrowia Δ12去饱和酶序列用作针对一些丝状真菌的公共数据库的查询序列;特别地,在构巢曲霉(SEQ ID NOs6 and 8)、Magnaporthe grisea(SEQ ID NOs10和12)、粗糙脉孢霉(SEQ IDNOs14和16)、禾本科镰孢(SEQ ID NOs18和20)、烟曲霉(SEQ IDNO21)和黄曲霉(SEQ ID NO22)中鉴定了同源蛋白质序列。使用Clustal W(slow,accurate,Gonnet option;Thompson等人Nucleic Acids Res.0(1994))的方法,基于这些序列(即,SEQ ID NOs2,4,6,8,10,12,14,16,18,20,21和22)的比较的随后的种系发生和同源性分析揭示具有与Yarrowia Δ12去饱和酶的同源性的蛋白质的两个不同的“亚家族”。特别地,“亚家族1”的所有蛋白质(SEQ ID NOs2,6,10,14和18)相互具有至少46.2%同一性,并且与“亚家族2”的蛋白质(SEQ ID NOs4,8,12,16,20,21和22)具有小于39.6%的同一性(图4和5;Clustal比对方法(上文))。亚家族2的蛋白质相互具有至少56.3%同一性(见实施例4)。
因为Yarrowia仅能合成18:2(但不是18:3),而多数上述丝状真菌可以合成18:2和ALA,并且因为Yarrowia具有一种Δ12去饱和酶而多数丝状真菌具有与Yarrowia Δ12去饱和酶的两种同源物,所以本申请人推测这些生物中去饱和酶的亚家族之一代表Δ12去饱和酶,另一个亚家族代表Δ15去饱和酶。通过使用表达分析测定了两个亚家族的每一个内代表性蛋白质的活性检验了该假说。特别地,Fm1和Mg1在Yarrowia lipolytica中表达并且发现它们编码Δ15去饱和酶(见共同待决的美国临时申请60/519191);类似地,日的公开WO 03/099216提示本文鉴定的序列,因为亚家族1粗糙脉孢霉和构巢曲霉序列具有Δ15去饱和酶活性。相比,Fm2如本文描述的在Y.lipolytica中表达并且经表征为Δ12去饱和酶。亚家族2粗糙脉孢霉序列的Δ12去饱和酶活性在WO 03/099216中类似地得到证实。
使用Clustal比对方法(Thompson等人,Nucleic Acids Res.0(1994))将串珠镰孢Δ12去饱和酶推导的氨基酸序列(SEQ ID NO4)与公共数据库序列比较。从而,串珠镰孢Δ12去饱和酶氨基酸序列基于百分数同一性最相似于本文中以SEQ ID NO20提供的禾本科镰孢Δ12去饱和酶(在477个氨基酸长度上95%同一性)。更优选的氨基酸片段与本文的序列至少约96%同一,而97%-98%同一的那些序列是尤其适宜的,最优选约99%同一的那些序列。
以相似方式,使用Clustal比对方法,将串珠镰孢Δ12去饱和酶核苷酸碱基序列与公共数据库的比较揭示最相似的已知核酸序列(禾本科镰孢基因组计划中的重叠群1.233;本文的SEQ ID NO19)与本文报导的串珠镰孢Δ12去饱和酶的核酸序列(SEQ ID NO3)至少89.2%同一。对应于当前ORF的优选Δ12去饱和酶编码核酸序列为编码活性蛋白质并且与编码本文报导的串珠镰孢Δ12去饱和酶的核酸序列具有至少约89%-90%同一性的那些序列,其中具有91%-95%同一性的那些序列尤其合适,具有大于95%同一性的那些序列最优选。
同源物的鉴定和分离本发明的Δ12去饱和酶核酸片段可以用于鉴定和分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。
鉴定技术例如,本文描述的串珠镰孢Δ12去饱和酶的氨基酸或者核苷酸序列的实质部分可以用于推定性鉴定相关的多肽或者基因,可以通过本领域技术人员对序列的手工评估,或者通过使用诸如BLAST的算法(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.(1993))和ClustalW(DNASTAR软件的Megalign程序)的计算机自动化序列比较和鉴定来进行所述鉴定。如上所述,使用Yarrowia lipolytica Δ12去饱和酶(SEQ ID NO52)允许鉴定一组真菌去饱和酶,其当分析时,聚簇为蛋白质的两个不同的亚家族(即,亚家族1和亚家族2)。亚家族2包含上述串珠镰孢Δ12去饱和酶以及这样的蛋白质,其编码DNA序列在下列内容中发现·构巢曲霉基因组计划(Center for Genome Research(CGR),Cambridge,MA发起)中的重叠群1.15(scaffold 1)(AAG36933)(SEQ ID NO8);·Magnaporthe grisea基因组计划(CGR and International RiceBlast Genome Consortium发起)中重叠群中的基因座MG01985.1(SEQ ID NO12);·GenBank检索号AABX(粗糙脉孢霉)(SEQ ID NO16);·禾本科镰孢
基因组计划(the CGR and the InternationalGibberella zeae Genomics Consortium(IGGR)发起)中的重叠群1.233(SEQ ID NO20);·烟曲霉基因组计划(Sanger Institute发起,the Universityof Manchester and The Institute of Genome Research(TIGR)合作)中的AFA.(反相)(SEQ ID NO21);和,·GenBank检索号AY280867(黄曲霉)(SEQ ID NO22)。
假设上面的蛋白质的每一种都编码Δ12去饱和酶。该假设在WO03/099216对粗糙脉孢霉进行了证实。
对上面蛋白质的分析揭示,根据Clustal比对方法(上文),这些蛋白质与串珠镰孢Δ12去饱和酶(SEQ ID NO4)具有至少56.3%序列同一性(图5)。此外,将本发明中亚家族2的Δ12去饱和酶与其他已知的Δ12去饱和酶比较;然而,此处亚家族2的Δ12去饱和酶与Yarrowia lipolytica Δ12去饱和酶(51.6%同一性;图6)比与任意其他已知的Δ12去饱和酶的同源性更高。本领域技术人员将能够使用相似的方法鉴定将在亚家族2中聚簇的其他直向同源蛋白质(在此处鉴定为Δ12去饱和酶)。
备选地,本发明去饱和酶序列的任一种(即,SEQ ID NOs3,4,7,8,11,12,15,16,19,20,21和22)可以用作同源物鉴定中的杂交试剂。核酸杂交试验的基本成分包括探针、怀疑含有目的基因或基因片段的样品和特定杂交方法。本发明的探针通常是单链核酸序列,其与待检测的核酸序列互补。探针与待检测的核酸序列是“可杂交的”。探针长度可以从5个碱基到数万碱基不等,并且将取决于所进行的特定试验。通常,约15个碱基到约30个碱基的探针长度是合适的。仅部分探针分子需要与待检测的核酸序列互补。此外,探针和靶序列之间的互补性不必是完全的。在不完全互补的分子之间发生杂交,结果杂交区中的一部分碱基不与适当的互补碱基配对。
杂交方法是成熟的。通常,探针和样品必须在将允许核酸杂交的条件下混合。这包括在无机或者有机盐存在下在适当的浓度和温度条件下将探针和样品接触。探针和样品核酸必须接触足够长的时间使得可以发生探针和样品核酸之间发生任何可能的杂交。混合物中探针或者靶标的浓度将决定发生杂交所必要的时间。探针或者靶标浓度越高,需要的杂交孵育时间越短。任选地,可以加入离液剂。离液剂通过抑制核酸酶活性稳定核酸。此外,离液剂允许室温下短寡核苷酸探针的灵敏和严格杂交(Van Ness和Chen,Nucl.Acids Res.1(1991))。适宜的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯代乙酸锂、高氯酸钠、四氯代乙酸铷、碘化钾和三氟乙酸铯,等等。通常,离液剂将以约3M的终浓度存在。如果希望,可以将甲酰胺加入到杂交混合物,浓度通常为30-50%(v/v)。
可以使用多种杂交溶液。通常,这些包含约20到60%体积,优选30%的极性有机溶剂。常用的杂交溶液使用约30-50%v/v甲酰胺,约0.15到1M氯化钠,约0.05到0.1M缓冲液(例如,柠檬酸钠,Tris-HCl,PIPES或HEPES(pH范围约6-9)),约0.05到0.2%去污剂(例如,十二烷基硫酸钠),或0.5-20mM EDTA,FICOLL(PharmaciaInc.)(约300-500kdal),聚乙烯吡咯酮(约250-500kdal),和血清白蛋白。典型杂交溶液中还包括的将是约0.1到5mg/mL未标记的载体核酸、片段化核DNA(例如,小牛胸腺或鲑精DNA,或酵母RNA),和任选约0.5到2%wt/vol甘氨酸。还可以包括其他添加剂,如体积排阻剂,其包括多种极性水溶性或者膨胀剂(例如,聚乙二醇),阴离子聚合物(例如,聚丙烯酸酯或者聚异丁烯酸酯)和阴离子糖类聚合物(例如,硫酸葡聚糖)。
核酸杂交适于多种测定形式。一种最适宜的是夹层测定形式。夹层测定尤其适于在非变性条件下杂交。夹层型测定的主要成分是固相支持体。固相支持体已经在其上吸附或者偶联了固定化核酸探针,其是未标记的或者与序列的一部分互补。
分离方法本发明的串珠镰孢Δ12去饱和酶核酸片段(或者本文鉴定的任意Δ12去饱和酶[SEQ ID NOs7,8,11,12,15,16,和19-22])可以用于分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。使用序列依赖性方案分离同源基因是本领域公知的。
序列依赖性方案的实例包括,但不限于1)核酸杂交方法;2)DNA和RNA扩增方法,如通过核酸扩增技术的多种用途例证[例如,聚合酶链式反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反(LCR),Tabor,S.等人,Proc.Acad.Sci.USA 5);或者链置换扩增(SDA),Walker,等人,Proc.Natl.Acad.Sci.U.S.A.,)];和3)文库构建和通过互补作用筛选的方法。
例如,使用本领域技术人员公知的方法,通过用本发明核酸片段的全部或者一部分作为DNA杂交探针筛选来自任意希望的酵母或者真菌的文库,可以直接分离编码与本文描述的去饱和酶相似的蛋白质或者多肽的基因(其中将优选产生LA[或者LA衍生物]的那些酵母或者真菌)。通过本领域已知的方法(Maniatis,上文)可以设计和合成基于本发明核酸序列的特异寡核苷酸探针。此外,完整序列可以直接用于由技术人员合成DNA探针(例如,随机引物DNA标记、缺口翻译或者末端标记技术),或者使用可利用的体外RNA转录系统合成RNA探针。此外,可以设计并使用特异引物扩增本发明序列的部分(或者全长序列)。所得扩增产物可以在扩增反应期间直接标记或者在扩增反应后标记,并用作探针在适宜严格性的条件下分离全长DNA片段。
通常,在PCR型扩增技术中,引物具有不同序列并且不相互互补。取决于所希望的测试条件,应该设计引物的序列以提供靶核酸的有效和可靠的复制。PCR引物设计方法是本领域常见和公知的(Thein和Wallace,“The use of oligonucleotide as specifichybridization probes in the Diagnosis of Genetic Disorders”,in Human Genetic DiseasesA Practical Approach,K.E.DavisEd.,(1986)pp 33-50,IRLHerndon,VA;and Rychlik,W.,InMethods in Molecular Biology,White,B.A.Ed.,(1993)Vol.15,pp 31-39,PCR ProtocolsCurrent Methods andApplications.HumaniaTotowa,NJ)。
通常本发明序列的两种短片段可以用于聚合酶链式反应方案中来从DNA或者RNA扩增编码同源基因的更长的核酸片段。还可以对所克隆的核酸片段文库进行聚合酶链式反应,其中一种引物的序列来自本发明核酸片段,另一种引物的序列利用了编码微生物基因的mRNA前体的3,末端的聚腺苷酸序列。
备选地,第二种引物序列可以基于来自克隆载体的序列。例如,技术人员可以通过使用PCR扩增转录物的单个点和3’或5’末端之间区域的拷贝,按照RACE方案(Frohman等人,PNAS USA 8))来产生cDNA。可以从本发明序列设计3’和5’方向取向的引物。使用通过商业途径可获得的3’RACE或5’RACE系统(Gibco/BRL,Gaithersburg,MD),可以分离特定3’或5’cDNA片段(Ohara等人,PNAS USA 9);Loh等人,Science 9))。
本发明核苷酸和推导的氨基酸序列的有效性方便了DNA表达文库的免疫学筛选。可以合成代表本发明氨基酸序列的部分的合成肽。这些肽可以用于免疫动物以产生对包含所述氨基酸序列的肽或者蛋白质具有特异性的多克隆或者单克隆抗体。这些抗体可以用于筛选DNA表达文库来分离全长目的DNA克隆(Lerner,R.A.Adv.Immunol.361(1984);Maniatis,上文)。
用于提高异源表达的基因优化多种技术可用于提高特定目的Δ12去饱和酶在备选宿主中的表达。两种此类技术包括密码子优化和基因诱变。
密码子优化对于一些实施方案,可能希望修饰例如,编码具有Δ12去饱和酶活性的多肽的密码子的部分,以便增强编码这些多肽的基因在备选宿主(即,油质酵母)中的表达。
通常,通过检查蛋白质(优选以录大量表达的那些蛋白质)的密码子选择并确定那些密码子以最高频率使用可以确定特定目的宿主物种中的宿主优选的密码子。然后,可以使用该宿主物种中优选的密码子完整或者部分合成具有去饱和酶活性的目的多肽的编码序列。还可以合成DNA的全部(或者部分)以除去将在所转录的mRNA中存在的任何不稳定序列或者二级结构区。可以合成DNA的全部(或者部分)以将碱基组成改变成所希望的宿主细胞中更优选的碱基组成。
在本发明的优选实施方案中,来自例如串珠镰孢,构巢曲霉,Magnaporthe grisea,粗糙脉孢霉,禾本科镰孢,烟曲霉和黄曲霉的Δ12去饱和酶可以经密码子优化后在异源油质酵母宿主,例如Yarrowia lipolytica中表达。
诱变合成序列并将序列聚集的方法是文献中非常确实的。例如,体外诱变和选择、定点诱变、易错PCR(Melnikov等人,Nucleic AcidsResearch,27(4)(February 15,1999)),“基因改组”(U.S.5,605,793;U.S.5,811,238;U.S.5,830,721;和U.S.5,837,458)或者其他方法可以用于得到天然发生的去饱和酶,如本文描述的Δ12去饱和酶的基因的突变。这将允许在体内产生具有去饱和酶活性的多肽,其具有在宿主中发挥功能所需的多种所希望的物理和动力学参数(例如,更长的半寿期或者产生所希望的PUFA的更高速率)。
如果希望,可以通过常规诱变、所得突变多肽的表达和确定它们的活性可以确定对于酶活性重要的去饱和酶多肽的区域。突变体可以包括缺失、插入和点突变,或者其组合。典型的功能分析以缺失诱变开始,该缺失诱变用于确定所述蛋白质的功能必需的N-和C-末端界限,然后产生内部缺失、插入或者点突变体以进一步确定功能必需的区域。还可以使用其他技术,如盒诱变或者总合成。例如,通过使用外切核酸酶以顺序除去5’或者3’编码区可以完成缺失诱变。此类技术可以使用试剂盒。缺失后,通过将含有起始或者终止密码子的寡核苷酸连接到分别5’或3’缺失后缺失的编码区,可以完成编码区。备选地,通过包括定点诱变、诱变PCR的多种方法或者通过连接到消化的DNA的现有的限制性位点上可以将编码起始或者终止密码子的寡核苷酸插入到编码区。通过多种方法可以进行相似的内部插入,所述方法包括使用DNA中的现有限制性位点,通过使用诱变引物经定点诱变或者诱变PCR。通过诸如接头分区诱变、定点诱变或者诱变PCR的技术可以进行点突变。化学诱变也可以用于鉴定对于活性重要的去饱和酶多肽区。表达突变构建体,并测定所得改变的蛋白质发挥去饱和酶功能的能力。此类结构-功能分析可以确定可以缺失哪些区,那些区耐受插入,和那些点突变允许突变蛋白质以与天然去饱和酶基本相同的方式发挥功能。来自本文描述的去饱和酶基因的所有此类突变蛋白质和编码它们的核苷酸序列都在本发明范围内。
从而,本发明包含如在所附序列表中报导的Δ12去饱和酶基因的完整序列、那些完整序列的互补序列、那些序列的实质性部分、源于它们的密码子优化的去饱和酶,和与它们基本上同源的那些序列。
ω-3和/或ω-6脂肪酸的微生物生产ω-3和/或ω-6脂肪酸的微生物生产与从天然来源如鱼或者植物纯化相比具有一些优点。例如1.)与高级生物相比,已知许多微生物具有极大简化的油组成,使得所希望的组分的纯化更容易;2.)微生物生产不受外部变量,如天气或者食物供应导致的波动;3.)微生物产物的油基本上无环境污染物的污染;4.)微生物可以提供特定形式的PUFA,其可以具有特定用途;和
5.)通过控制培养调节,特别是通过提供用于微生物表达的酶的特定底物,或者通过加入化合物或者用基因工程方法抑制不希望的生物化学途径,可以操控微生物油生产。
除了这些优点,从重组微生物生产ω-3和/或ω-6脂肪酸提供了改变天然产生的微生物脂肪酸图的能力,通过改变宿主中新的生物合成经,或者通过抑制不希望的途径,从而增加所希望的PUFA的水平(或者其缀合形式)和降低不希望的PUFA的水平(见,共同待决的美国专利申请10/840579,这里完整引入作为参考)可以实现所述目睹。
产生多种ω-3和/或ω-6脂肪酸的方法预计引入处于适当启动子控制下的编码本文描述的Δ12去饱和酶的嵌合基因将导致所转化的宿主生物中LA的产生增加。同样地,本发明包括指导PUFA产生的方法,其包括将脂肪酸底物(即,油酸)暴露于此处描述的PUFA酶(例如,串珠镰孢Δ12去饱和酶),从而底物转化成所希望的脂肪酸产物(即,LA)。更特别地,本发明的一个目的是提供在油质酵母中产生LA的方法,其中为所述油质酵母提供了(a)编码具有Δ12去饱和酶活性的真菌蛋白质的分离的核酸片段,当基于Clustal比对方法将所述蛋白质与具有SEQ ID NO4中给出的序列的多肽比较时具有至少56.3%同一性;和(b)由油酸组成的去饱和酶底物来源;其中酵母在一定条件下生长,使得嵌合去饱和酶基因表达并且油酸转化成LA,并且其中任选回收LA。从而,该方法最少包括使用下面的Δ12去饱和酶如本文描述的SEQ ID NOs4、8、12、16、20、21和22。
备选地,每种PUFA基因和其相应的在本文描述的酶产物可以间接用于产生ω-3和/或ω-6 PUFA。发生PUFA的间接产生,其中脂肪酸底物通过中间步骤或者中间途径间接转化成目的脂肪酸产物。从而,预期本文描述的Δ12去饱和酶与编码其他酶的一种或多种基因一起表达,从而发生一系列反应以产生所希望的产物。在优选实施方案中,例如,宿主生物可以用包含编码PUFA生物合成途径的酶的基因以导致更高水平地产生ω-3和/或ω-6脂肪酸(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)。特别地,例如,可以希望在宿主细胞中表达任一种本文描述的Δ12去饱和酶,所述宿主细胞还表达1)编码用于过量产生GLA的Δ6去饱和酶的基因;2)表达盒,其包含编码用于过量产生DGLA的Δ6去饱和酶和高亲和性延伸酶的基因;3)编码用于过量产生ARA的Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因;或4)编码用于过量产生EPA的Δ6去饱和酶、高亲和性延伸酶、Δ5去饱和酶和Δ17去饱和酶的基因。在备选实施方案中,例如,可以希望在细胞中过量表达如本文描述的Δ12去饱和酶,所述细胞还表达1)编码用于过量产生ALA的Δ15去饱和酶的基因2)编码用于过量产生STA的Δ15去饱和酶和Δ6去饱和酶的基因;3)编码用于过量产生ETA的Δ15去饱和酶、Δ6去饱和酶和高亲和性延伸酶的基因;4)编码用于过量产生EPA的Δ15去饱和酶、Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因。如本领域技术人公知的,下面酶活性的多种其他组合可以用于在宿主中与本文的去饱和酶一起表达Δ15去饱和酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶(图2)。在特定表达盒中包括的特定基因将取决于宿主细胞(和它的PUFA图和/或去饱和酶图)、底物的可用性,和所希望的终产物。
在备选实施方案中,有用的是基于本文描述的完整序列、那些完整序列的互补序列、那些序列的实质性部分、来源于所述序列的密码子优化的去饱和酶和与所述序列基本上同源的那些序列,可以破坏宿主生物的天然Δ12去饱和酶。例如,宿主生物中Δ12去饱和酶的定向那破坏产生不能合成LA的突变菌株。
表达系统、盒和载体可以在异源微生物细胞,尤其在油质酵母(例如,Yarrowialipolytica)的细胞中产生本文描述的本发明序列的基因和基因产物。重组微生物宿主中的表达可以用于产生多种PUFA途径中间产物,或者用于调节宿主中现有的PUFA途径用以合成迄今使用该宿主不可能合成的新产物。
含有指导外源蛋白质的高水平表达的调节序列的微生物表达系统和表达载体是本领域技术人员公知的。这些表达系统和表达载体的任一种都可以用于构建嵌合基因用来产生本发明序列的基因产物的任一种。这些嵌合基因可以然后通过转化导入适宜的微生物以提供所编码酶的高水平表达。
用于转化适宜的宿主细胞的载体或者DNA盒是本领域公知的。构建体中存在的序列的特定选择取决于所希望的表达产物(上文)、宿主细胞的性质和所建议的分离转化细胞与未转化细胞的方法。然而,通常,载体或者表达盒含有指导相关基因转录和翻译的序列、选择性标记和允许自主复制或者染色体整合的序列。适宜的载体包含控制转录起始的基因5’区和控制转录终止的DNA片段3’区。当两个控制区都来自所转化的宿主细胞的基因时是最优选的,尽管将理解此类控制区不必来自选择生产宿主的特定物种天然的基因。
用于驱动本发明ORF在所希望的宿主细胞中表达的起始控制区或者启动子有许多并且是本领域技术人员熟悉的。几乎能够指导这些基因在所选宿主细胞中表达的任何启动子都适于本发明。可以以瞬时或者稳定的方式完整宿主细胞中的表达。通过诱导与目的基因可操作地连接的可调节的启动子的活性可以完成瞬时表达。通过使用与目的基因可操作地连接的组成型启动子可以实现稳定表达。作为实例,当宿主细胞是酵母时,提供了在酵母细胞中有功能的转录和翻译区,尤其来自宿主物种的转录和翻译区。例如可以从如下得到转录起始调节区1)糖酵解途径中的基因,如醇脱氢酶、甘油醛-3-磷酸-脱氢酶(见美国专利申请号10/869630)、磷酸甘油酸变位酶(见美国专利申请号10/869630)、果糖二磷酸醛缩酶(见美国专利申请号60/519971)、磷酸葡萄糖异构酶、磷酸甘油酸酯激酶、甘油-3-磷酸O-酰基转移酶(见美国专利申请号60/610060),等等;或者2)可调节的基因,如酸性磷酸酶、乳糖酶、金属硫蛋白、葡萄糖淀粉酶、翻译延伸因子EF1-α(TEF)蛋白质(U.S.6,265,185)、核糖体蛋白质S7(U.S.6,265,185)等等。可以使用多种调节序列的任一种,这取决于希望组成型还是诱导型转录、启动子在表达目的ORF中的效率、构建的容易性,等等。
已经发现翻译起始密码子ATG周围的核苷酸序列影响酵母细胞中的表达。如果本发明Δ12去饱和酶的任一种在酵母中表达很弱,那么可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列从而得到最佳的基因表达。为了在酵母中表达,这可以通过无效表达的基因的定点诱变来进行,通过将所述基因融合在内源酵母基因,优选高度表达的基因的框内来进行所述定点诱变。备选地,可以确定宿主中共有翻译起始序列并将该序列改造成异源基因用于它们在目的宿主中的最佳表达(关于可应用于Yarrowia lipolytica的特定教导见,例如,美国专利申请号10/840478)。
终止区可以来自基因的3’区,其中起始区从所述基因得到或者来自不同的基因。多种终止序列是已知的并且在多种宿主中令人满意地发挥功能(当用于与它们所来源的相同或不同的属和种时)。通常选择终止区更多是由于方便而不是因为任何具体性质。优选地,终止区来自酵母基因,尤其酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、Yarrowia或者克鲁维酵母属(Kluyveromyces)。还已知编码γ-干扰素和α-2干扰素的哺乳动物基因的3’区在酵母中有功能。终止控制区还可以来自优选宿主天然的多种基因。任选地,终止位点可以是不必要的;然而,最优选包括终止位点。
如本领域技术人员已知的,仅将基因插入到克隆载体不能确保它将以所需的水平成功地表达。响应更高表达率的需要,通过操作许多不同的遗传元件已经产生了许多专门的表达载体,所述遗传元件控制转录、翻译、蛋白质稳定性、氧限制、和从宿主细胞的分泌。更特别地,已经操作用以控制基因表达的一些分子特征包括1)相关转录启动子和终止子序列的性质;2)所克隆的基因拷贝数和该基因是包含在质粒中还是整合到宿主的染色体中;3)所合成的外源蛋白质的最终细胞定位;4)宿主生物中翻译效率;5)宿主细胞内所克隆的基因蛋白质的内在稳定性;和6)所克隆基因内的密码子选择,从而它的频率接近宿主细胞的优选密码子选择的频率。这些类型修饰的每一种都包括在本发明中,作为进一步优化本文所述的Δ12去饱和酶的表达的方式。
微生物宿主的转化一旦已经得到了编码适于在油质酵母中表达的多肽的DNA,就将它置于能够在宿主细胞中自主复制的质粒载体中,或者它直接整合到宿主细胞的基因组中。表达盒的整合可以在宿主基因组内随机发生或者可以通过使用含有与宿主基因的同源性区的构建体靶定,所述同源性足够与宿主基因座的靶定重组。当构建体靶向内源基因座时,通过内源基因座可以提供所有或者一些转录和翻译调节区。
当从分开的复制载体表达两种和多种基因时,希望每种载体具有不同的分泌方式并且应该缺少与其他载体的同源性从而保持稳定表达和防止构建体间元件的再分布。可以通过实验确定调节区的慎重选择、选择方法和增殖方法,从而所有导入的基因以提供目的产物合成必要的水平表达。
包含目的基因的构建体可以通过标准技术导入宿主细胞。这些技术包括转化(例如,乙酸锂转化[Methods in Enzymology,(1991)])、原生质体融合、生物射弹轰击(biolisticimpact)、电穿孔、微注射或者将目的基因导入宿主细胞的任意其他方法。适于油质酵母(即,Yarrowia lipolytica)的更特别的教导包括美国专利号4,880,741和5,071,764和Chen,D.C.等人(ApplMicrobiol Biotechnol.48(2)232-235-(1997))。
为了方便,已经通过任意方法操作以吸收DNA序列(例如,表达盒)的宿主细胞将在本文称作“转化的”或者“重组的”。所转化的宿主将具有表达构建体的至少一个拷贝并且可以具有两个或多个拷贝,这取决于所述基因整合到基因组、扩增,还是存在于具有多个拷贝数的染色体外元件上。通过选择所导入的构建体上含有的标记可以鉴定转化的宿主细胞。备选地,可以有目的构建体共同转化单独的标记构建体,因为许多转化技术向宿主细胞导入许多DNA分子。通常,对转化的宿主选择它们在选择性培养基上生长的能力。选择性培养基可以掺入抗生素或者缺少未转化的宿主的生长必需的因子,如营养物或者生长因子。所导入的标记基因可以赋予抗生素抗性,或者编码必需生长因子或者酶,从而当在所转化的宿主中表达时允许在选择性培养基上生长。当可以直接或者间接检测表达的标记蛋白质时,也可以发生经转化的宿主细胞的选择。标记蛋白质可以单独或者作为与另一种蛋白质的融合蛋白表达。标记蛋白质可以通过如下检测1)它的酶促活性(例如,β半乳糖苷酶可以将底物X-gal[5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷]转化成有色产物;萤光素酶可以萤光素转化成发光产物);或者2)它的光产生或者修饰特征(例如,Aequorea victoria的绿色荧光蛋白当用蓝光照射时发荧光)。备选地,可以用抗生素检测例如,目的蛋白质上的标记蛋白质或者分子标签。可以例如,通过视觉或者通过诸如FACS或者使用抗体淘选可以选择表达标记蛋白质或者标签的细胞。对于酵母转化株的选择,可以使用在酵母中有功能的任意标记。理想地,对卡那霉素、潮霉素和氨基糖苷G418的抗性是重要的以及在缺少尿嘧啶或者亮氨酸的培养基上生长的能力。
转化后,适于本发明Δ12去饱和酶(和任选地在宿主细胞内共表达的其他PUFA酶)的底物可以由宿主天然地或者转基因地产生,或者它们可以外源地提供。
微生物中ω-3和/或ω-6脂肪酸生物合成的代谢工程化本发明Δ12去饱和酶的序列的知识将可以用于操作油质酵母,尤其Yarrowia lipolytica中ω-3和/或ω-6脂肪酸生物合成。这可能需要PUFA生物合成途径内的直接代谢工程化或者对PUFA生物合成途径贡献碳的途径的额外操作。用于操作生物化学途径的方法是本领域技术人员公知的。
用于上调所希望的生物合成途径的技术可以将去饱和酶(任选延伸酶)的额外拷贝导入宿主中以增加ω-3和/或ω-6脂肪酸生物合成途径的输出,通常通过使用多拷贝质粒。去饱和酶和延伸酶基因的表达也可以通过使用更强的启动子(受调节的或者组成型的)在转录水平上增加,以导致增加的表达,通过从所述mRNA或者编码的蛋白质除去/缺失区去稳定序列,或者通过向所述mRNA加入稳定序列(U.S.4,910,141)也可以增加所述表达。增加异源去饱和酶或者延伸酶基因的表达的再一种方法是通过将天然基因中的密码子用用于在所选宿主微生物中最佳基因表达的密码子代替来增加所编码mRNA的翻译效率。
下调不希望的生物合成途径的技术相反地,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或者碳的生物化学途径,或者干扰特定PUFA终产物的产生的天然PUFA生物合成途径酶可以通过基因破坏消除或者通过其他方法(例如,反义mRNA)下调。对于基因破坏,将外源DNA片段(通常选择性标记基因)插入到待破坏的结构基因中以便中断它的编码序列并从而功能地失活所述基因。将破坏盒转化到宿主细胞导致通过与非功能破坏的基因的同源重组代替功能的天然基因(见,例如Hamilton等人J.Bacteriol.2(1989);Balbas等人Gene (1993);Gueldener等人Nucleic Acids Res.4(1996);和Smith等人Methods Mol.Cell.Biol.6))。
反义技术是当已知靶基因的序列时下调基因的另一种方法。为了完成该目的,将来自所希望的基因的核酸片段克隆并可操作地连接启动子从而将转录RNA的反义链。然后将该构建体导入宿主细胞并产生RNA的反义链。反义RNA通过防止编码目的蛋白质的mRNA的积累抑制基因表达。本领域技术人员将知道特定考虑与反义技术的用途结合以便减小具体基因的表达。例如,反义基因表达的适宜水平可以需要使用不同的嵌合基因,利用技术人员已知的不同调节元件。
尽管靶定基因破坏和反义技术提供了当已知序列时下调基因的有效方法,但是已经开发了不是基于序列的特异性较低的方法。例如,可以将细胞暴露于紫外照射然后筛选所希望的表型。用化学剂诱变对于产生突变体也是有效的并且是常用的物质,包括影响非复制的DNA的化学品(例如,HNO2和NH2OH),以及影响正复制的DNA的试剂(例如,吖啶类染料,已知其导致移码突变)。使用辐射或者化学试剂产生突变体的特定方法在本领域中详细记载。参加,例如Thomas D.Brock inBiotechnologyA Textbook of IndustrialMicrobiology,2nded.(1989)Sinauer AssociatesSunderland,MA;or Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,)。
基因破坏的另一种非特异方法是使用转座元件或者转座子。转座子是随机插入DNA但是可以基于序列确定发生插入的位置在以后恢复的遗传元件。体内和体外转座方法都是已知的。两种方法包括使用转座元件联合转座酶。当转座元件或者转座子在转座酶存在下与核酸片段接触时,转座元件将随机插入到该核酸片段中。该技术用于随机诱变和基因分离,因为可以基于转座元件的序列鉴定所破坏的基因。用于体外转座的试剂盒可以通过商业途径获得[见,例如1)PrimerIsland Transposition试剂盒,其可以从Perkin Elmer AppliedBiosystems,Branchburg,NJ得到,基于酵母Ty1元件;2)GenomePriming System,其可以从New England Biolabs,Beverly,MA得到,基于细菌转座子Tn7;和3)EZ::TN Transposon InsertionSystems,其可以从Epicentre Technologies,Madison,WI获得,基于Tn5细菌转座元件]。
在本发明上下文中,有用的是通过上述方法之一调节脂肪酸生物合成途径的表达。例如,本发明提供了编码所述生物合成途径中的关键酶的基因(即,Δ12去饱和酶),导致产生ω-3和/或ω-6脂肪酸。尤其有用的是在油质酵母中表达产生不足量的18:2脂肪酸的这些基因,和使用用于宿主生物的代谢工程化的多种方法调节这种和其他PUFA生物合成基因的表达以最大化优选PUFA产物的产生。同样地,为了最大化这些基因的PUFA产生,有必要破坏竞争指向PUFA生物合成的碳流的途径。
在备选实施方案中,可能希望破坏本文的Δ12去饱和酶,以防止ω-3和/或ω-6脂肪酸的合成。在另一备选实施方案中,可能通过将任一种本发明的Δ12去饱和酶基因置于可诱导的或者受调节的启动子控制下调节ω-3和/或ω-6脂肪酸的产生。
用于重组表达Δ12去饱和酶的优选微生物宿主用于表达本发明基因和核酸片段的宿主细胞可以包括在多种原料,包括简单和复杂糖类、有机酸和醇,和/或烃上在宽范围的温度和pH值下生长的微生物宿主。尽管已经分离了用于在油质酵母,尤其Yarrowia lipolytica中表达的本发明中描述的基因,但是预计因为转录、翻译和蛋白质生物合成装置是高度保守的,所以任意细菌、酵母、藻类和/或丝状真菌将是用于表达本发明核酸片段的适宜的宿主。
优选的宿主是油质生物,如油质酵母。这些油质生物天然地能够进行油合成和积累,其中油可以占细胞干重的约25%以上,或者优选细胞干重的约30%以上,最优选细胞干重的约40%以上。通常鉴定为油质酵母的属包括,但不限于Yarrowia、假丝酵母属、红酵母属、红冬孢酵母属、隐球菌属、毛孢子菌属和油脂酵母属。更特别地,阐明性油合成酵母包括Rhodosporidium toruloides,Lipomycesstarkeyii,L.lipoferus,Candida revkaufi,C.pulcherrima,C.tropicalis,C.utilis,Trichosporon pullans,T.cutaneum,Rhodotorula glutinus,R.graminis和Yarrowia lipolytica以前分类为Candida lipolytica)。最优选地是油质酵母Yarrowialipolytica;在另一实施方案中,最优选称作ATCC #76982、ATCC#20362、ATCC #8862、ATCC #18944和/或LGAM S(7)1的Yarrowialipolytica菌株(Papanikolaou S.,和Aggelis G.,Bioresour.Technol.82(1)43-9(2002))。
其他优选的微生物宿主包括油质细菌、藻类和其他真菌(例如,Thraustochytrium sp.,Schizochytrium sp.和Mortierellasp.)。
用于PUFA生产的发酵方法所转化的微生物宿主细胞在优化脂肪酸生物合成基因活性和产生最大和最经济的脂肪酸产率(例如,LA,其可以又增加多种ω-3和/或ω-6脂肪酸的产生)的条件下生长。通常,可以优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳-氮比率、氧水平、生长温度、pH、生物量生产期的长度、油积累期的长度和细胞收获的时间。目的微生物,如油质酵母生长在复杂培养基(例如,酵母提取物-蛋白胨-葡萄糖培养基(YPD)或者缺少生长必需组分的确定的基本培养基并从而强迫选择所希望的表达盒(例如,Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI))。
本发明中的发酵培养基必须含有适宜的碳源。适宜的碳源可以包括,但不限于单糖(例如,葡萄糖、果糖),二糖(例如,乳糖或蔗糖),寡糖,多糖(例如,淀粉、纤维素或者其混合物),糖醇(例如,甘油)或者来自可更新的原料的混合物(例如,干酪乳清渗透物、玉米浆、甜菜糖蜜、大麦麦芽)。此外,碳源可以包括烃类、脂肪酸、脂肪酸酯、甘油一酯、甘油二酯、甘油三酯、磷脂和脂肪酸的多种商业来源,包括植物油(例如,大豆油)和动物脂肪。此外,碳底物可以包括一碳底物(例如,二氧化碳或者甲醇),已经为所述底物阐明了向关键生物化学中间物的代谢转化。因此,预计用于本发明的碳源可以包括多种含碳底物并且将仅受到宿主生物的选择的限制。尽管预计所有上述碳底物和其混合物将适于本发明,但是优选的碳底物为糖和/或脂肪酸。最优选的是葡萄糖和/或含有10-22个碳的脂肪酸。可以从无机(例如,(NH4)2SO4)或者有机来源(例如,尿素或者谷氨酸)提供氮。除了适宜的碳和氮源,发酵培养基必须还含有适宜的矿物质、盐、辅因子、缓冲剂、维生素、和本领域已知的其他组分,它们适于微生物的生长和促进PUFA产生必要的酶途径。特别注意处理脂类和PUFA合成的一些金属离子(例如,Mn+2,Co+2,Zn+2,Mg+2)(Nakahara,T.等人Ind.Appl.Single Cell Oils,D.J.Kyle and R.Colin,eds.pp 61-97(1992))。
本发明中优选的生长培养基是通常商业制备的培养基,如YeastNitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他限定的或者合成生长培养基并且用于生长特定微生物的适宜培养基将是微生物学或者发酵科学领域技术人员已知的。用于发酵的适宜的pH范围通常为约pH4.0到pH8.0,其中pH 5.5到pH 7.0优选为最初生长条件的范围。发酵可以在需氧或者厌氧条件下进行,其中优选微需氧条件。
通常油质微生物中PUFA的高水平积累需要两阶段方法,因为代谢状态必须在生长或者脂肪的合成/贮存之间“平衡”。从而,最优选地,两阶段发酵方法是在油质酵母中产生PUFA必需的。在该方法中,发酵的第一阶段致力于产生和积累细胞量并且特征是快速细胞生长和细胞分裂。在发酵第二阶段中,优选建立培养物中氮消除条件以促进高水平脂质积累。该氮消除的影响将是减小细胞中AMP的有效浓度,从而减小线粒体的NAD依赖性异柠檬酸脱氢酶的活性。当这发生时,柠檬酸将积累,从而形成细胞质中乙酰辅酶A的大量库并引发脂肪酸合成。从而,该阶段的特征是细胞分裂的停止,接着是合成脂肪酸和积累油。
尽管细胞通常在约30℃生长,但是一些研究已经显示在较低温度下不饱和脂肪酸的合成增加(Yongmanitchai和Ward,Appl.Environ.Microbiol.1))。基}

我要回帖

更多关于 反向互补序列 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信