全 文 :新疆雪莲全长 cDNA文库构建及表达
序列标签(ESTs)特性分析
王 博1 ,艾秀莲1 ,王志方1 ,李 芳2 ,罗 明3
(1.新疆农科院微生物所 ,乌鲁木齐 830091;2.新疆分析测试研究院 ,乌鲁木齐 830011;3.新疆农业大学 ,乌鲁木齐 830052)
摘 要:以野生新疆雪莲(Saussurea involucrata Kar.et Kit)为研究材料 ,利用 Creator SMARTTM cDNA Library
Construction技术构建了雪莲全长 cDNA文库 , 从野生雪莲中提取总 RNA 和 mRNA , 用分离到的微量 mRNA
合成 cDNA第 1 链。通过长距离PCR扩增得到足够量的双链 cDNA 。将 SfiⅠ酶切后并纯化的 cDNA 片段连接
到经SfiⅠ酶切的噬菌体λTripIEX2 上 , 并对噬菌体进行包装 ,建成 cDNA 的全长库。经大肠杆菌 XL1-Blue 平
板检测 ,原始文库滴度达 4.03×107(pfu/mL)。随机挑选 500 个克隆进行序列测定 , PCR鉴定结果显示多数插
入片段均在 500 bp 以上。将所测序列经GenBank检索和生物信息学比较 , 共有 56 个序列为非冗余数据。其
中有 14个 cDNA片段序列在 GenBank上无明显的同源性 , 42 个片段与已报道的基因有较高的同源性。 这些
EST 数据为进一步筛选和克隆雪莲特异性表达基因提供了材料平台 , 为雪莲基因组数据增补了大量信息。
关键词:新疆雪莲;cDNA文库;λTripLEx2;表达序列标签
中图分类号:S580.1 文献标识码:A 文章编号:1001-4330(2008)01-0056-05
cDNA library Construction and EST Analysis of Saussurea involucrata Kar.et Kit
WANG Bo1 ,AI Xiu-lian1 ,WANG Zhi-fang1 ,LI Fang2 ,LUO Ming2
(1.Xinjiang Academy of Agricultural Science , Urumqi 830091 , China;2.Xinjiang Academy of Instrumental
Analysis ,Urumqi 830011 , China;3.Xinjiang Academy of Instrumental Annlysis ,Urumqi 830052 , China)
Abstract:A cDNA library from the Saussurea involucrata Kar.was constructed by using CreatorTM
SMART
TM
cDNA library Construction Protoco1.Total RNA and mRNA were extracted from Sasussured
involucrata Kar.et Kir.After synthesizing the first-strand cDNA using limited amount of mRNA isolated from
total RNA , the double -strand cDNA was amplified with long -distance PCR method.The ligation of the Sfi Ⅰ
digested cDNA to the SfiⅠdigested vectorλTripLEx2 was performed and the phage was packed to construct the full
length cDNA library.The titer of unamplified library titer of was estimated as 4.03×107(pfu/mL),which was
about 500 times coverage of gene expressional profile , the PCR results showed that the size of most inserts was larger
than by 500 bp.By searching the NCBI non -redundant nucleotide databases , 56 ESTs had no significant
similarity to any protein or DNA sequence in the databases.The results showed that 14 cDNA clones are
expected to be novel genes , because no sequence homology with any known sequences was found in GenBank
batabases.And 42 ESTs with known function were identified by Blastx searched against the NCBI non-redundant
nucleotide databases.The results are good enough for further cloning of the specific expression genes and adding
much geneties information of Saussurea involucrata Kar.
Key words:Saussurea involucrata Kar.et Kir;cDNA library;λTripLEx2;EST
新疆雪莲(Sasussured involucrata Kar.et Kir.)为多年生一次性开花结实的高山草本植物 ,具有特殊
的药用和开发利用价值 ,是我国民族药中的瑰宝[ 1~ 5] 。主要分布在 2 400 ~ 4 000 m的高原寒带地区 ,其
生境特异 ,最高月平均温度3 ~ 5℃,最低月平均温度 19 ~ 21℃。与一般抗寒植物不同 ,雪莲在极端低温
收稿日期:2007-03-22
基金项目:国家自然科学基金项目(30160039);新疆维吾尔自治区高技术研究与发展计划项目(200511103)
作者简介:王博(1978-),男 ,甘肃人 ,在职硕士 ,研究方向为分子生物学 ,(E-mai l)wbsj972@163.com
通讯作者:艾秀莲(1951-),女 ,山东人 ,研究员 ,在职硕士 ,硕士生导师 ,研究方向为分子生物学 ,(E-mail)aixiulian @yahoo.com
新疆农业科学 2008 ,45(1):56-60
Xinjiang Agricultural Sciences
下通过积极的生命活动来适应严寒 ,在雪中能旺盛生长并且开花 。具有极强的耐寒 、抗辐射 、抗风沙 、抗
缺氧的能力 ,是天山雪线以上的惟一大型高等植物[ 6 ,7] 。雪莲长年生长在极端环境下 ,决定了其具有许
多特殊的功能基因 ,是分离特殊基因的极好材料。目前大多是关于雪莲药学及化学成分分析方面的研
究 ,关于其特殊功能基因方面的研究鲜有报道 。对于雪莲这些特殊基因的研究 ,能对雪莲生理生化的特
性及极强的抗逆性状有更深层的揭示。若将这些基因分离出来 ,转入棉花 、水稻 、玉米 、各种蔬菜和草坪
等植物 ,可产生巨大的经济效益 。也为将来的有效药用成分的相关基因 ,抗逆基因分离转化做技术储
备。研究旨在利用所获得的野生新疆雪莲 ,建立全长 cDNA的文库[ 8~ 12] ,为进一步研究雪莲抗逆机理及
获得相关基因奠定基础。
1 材料与方法
1.1 材 料
野生雪莲叶片采自天山一号冰川。
1.2 试 剂
SMART
TM
cDNA文库构建试剂盒及宿主菌为 E .coli XL1-Blue ,载体为λTripLEx2购自 Clontech公
司;总 RNA提取试剂盒购自上海华舜公司;包装蛋白购自 Promega公司的 Packgene 。其它试剂均为国产
或进口分析纯。
1.3 方 法
1.3.1 雪莲总 RNA提取与鉴定
严格按照操作手册说明书进行 。提取 RNA 经 1.2%琼脂糖凝胶电泳鉴定 ,测定 OD260和 OD280 ,计算
其纯度及比值。
1.3.2 cDNA合成和文库构建
根据 RNA浓度确定 RNA 模板量 。按 Clontech 的 SmartTM cDNA Library Construction Kit 使用手册进
行 , cDNA合成使用长距离 PCR方法。依次加入 SMART IV Oligonucleotide 、3′PCR Primer及 dNTP ,在反转
录酶作用下合成第一链 。再以第一链 cDNA 为模板 ,依次加入 dNTP Mix 、5′PCR Prime 、3′PCR Primer、
Advantage 2 Polymerase Mix 在 PCR仪上进行扩增 ,共 30个循环。PCR产物经蛋白酶 K消化 、SfiI 酶切以
及CHROMA SPIN-400 column大小分级。按照 cDNA∶Vector=1∶2/1∶1/3∶2三种方式进行连接。每一个
连接建立一个独立的λ噬菌体包装反应。
1.3.3 文库质量鉴定
事先制备好宿主菌的液体培养物 ,37℃,140 r/min培养 ,直到培养液 OD600至 2.0 。离心 ,弃上清 ,用
MgSO4重悬沉淀 。取3种连接方式不同稀释度的包装产物化的LB/MgSO4上层琼脂 ,混合 ,立即倒入37℃
预热的 LB/MgSO4平板上 ,水平涂布 ,冷却 10 min ,37℃培养 6 ~ 18 h ,计数噬斑 ,计算滴度(pfu/mL)=噬
菌斑数×稀释因子×1 000/稀释的噬菌体铺板体积(μL)。取2mL融化的上层琼脂 ,依次加入50μL IPTG
和X-Gal贮存液 、5μl不同稀释度包装产物与宿主菌的混合物 ,计数蓝 、白斑 ,计算重组效率=白斑数/
(白斑数+蓝斑数)。
1.3.4 文库的 PCR鉴定
随机挑选了 12个噬菌斑进行噬菌粒的转化及碱裂解提取质粒作为模板 ,分别依次加入 5′PCR
Primer—CTCGGAAGCGCGCATTGTGTT , 3′PCR Primer—GCCCTATAGTGAGTCGTAT , Advantage 2 Polymerase
Mix进行PCR扩增 ,共 35个循环。用 1.1%的琼脂糖凝胶电泳检测。
1.3.5 序列获得及分析
将大肠杆菌 BM 25.8接种于 10 mL LB液体培养基 , 31℃, 150 r/min 摇床中培养过夜 ,直到OD600培
养至 1.1 ~ 1.4 ,加入 100μL 1M MgCl2至终浓度为 10 mmol/L;从平板上挑取分离较好的噬菌斑 ,接种于
350μL 1×λ稀释缓冲溶液中 ,混合后 37℃静置培养3 ~ 4 h;在 1.5 mL 离心管中加入 200 μL细菌过夜培
养物及 150μL噬菌体液 ,31℃静置孵育 30 min后加入 400μL LB培养液;31℃,225 r/min摇床中培养 1
h ,取上清 5μL涂布于含 100μg/mL 氨苄青霉素的 LB平板上 ,于31℃培养得单菌落 ,用碱裂解法提取质
粒DNA。将其中120个阳性克隆穿刺培养 ,进行全序列测定。所得序列去掉 5′和 3′端非编码区序列 ,用
BLAST软件进行同源比对分析。
·57·1期 王博等:新疆雪莲全长 cDNA文库构建及表达序列标签(ESTs)特性分析
2 结果与分析
2.1 总 RNA提取结果分析
所提总 RNA 经变性胶电泳 , 二甲苯胺蓝染
色 ,显示二条28 S和 18 S明显的带 ,说明总 RNA
提取较好 , 降解少 , 分子完整。 RNA OD260 =
0.120 ,其浓度为 0.96 μg/μL ,OD280 =0.063 , A260
nm/A280 nm=1.9 ,表明所提 RNA纯度高 ,符合建
库要求。图1
图 1 雪莲总 RNA的提取
Fig.1 Total RNAs extracted from
Sasussured involucrata Kar2.2 LD-PCR产物
经LD-PCR合成的双链 cDNA , 5μL PCR产物进行琼脂糖电泳分析 ,结果 0.1 ~ 4 Kb呈弥散状条
带 ,中间有几条与组织特异性高丰度 mRNA相对应的亮带 ,说明合成的双链 cDNA是成功的 ,符合建库
要求 。
2.3 文库质量鉴定(表 1)
结果表明 ,3号连接方式所产生的噬菌斑数最多 , 1号和2号连接方式所产生的噬菌斑次之。表明 3
号连接方式效果最好 。按照 3号连接方式 10-5稀释度时形成的噬菌斑数计算未扩增文库滴度:
pfu/mL=噬斑数×稀释因子×103稀释的噬菌体铺板体积 =121×10
5×103μL/mL
300 μL =4.03×107(pfu/mL)
用3号连接方式将样品稀释到 10-5涂 IPTG/X-gal平板 ,测出重组率为 93%达到说明书所述要求 。
表 1 未扩增文库滴度测试结果
Table 1 The test result of the titer of unamplified library
稀释倍数
Dilute multiple
1号连接(噬斑数)
Joint of cDNA library No.1
2号连接(噬斑数)
Joint of cDNA library No.2
3号连接(噬斑数)
Joint of cDNA library No.3
10-2 80 10 不可数
10-4 3 2 约 1 000
10-5 无 无 121
10-6 无 无 2
2.4 文库的 PCR鉴定
根据载体克隆位点两端的引物进行 PCR鉴定 ,结果显示:所选 13个噬菌体均含有重组的 cDNA ,并
且均在500 bp以上。图 2
2.5 序列分析
实验过程中共获得 87个序列 ,其中插入片段长度小于 150 bp的序列有 4个 ,占总测序克隆总数为
4.6%,另有 3个序列为空载体序列 ,最终获得有效序列为 80个 。共有56个序列与登录在 NCBI非冗余
蛋白质数据库中的蛋白质序列存在显著的相似性 。其中有 14个与推测的 、假想的或功能未知的蛋白质
序列有相似性 , 42个与功能已知的蛋白质序列显著同源 。表 2
图 2 部分插入片段的 PCR检测
Fig.2 PCR analysis of partial cDNA insert fragments
·58· 新疆农业科学 45卷
表 2 cDNA克隆有效序列比对结果
Table 2 Result of comparison of effective sequences of cDNA clones
同源功能蛋白
Homologous functional protein
出现频率
Frequency
评分
Score(bi ts)
同源性
Homology(aa/ aa)%
聚合泛素
Polyubiquitin
2 303 156/ 157(99)
病原相关蛋白
pathogenesis-related protein 7 235 107/ 142(75)
光系统 I 装配蛋白
Photosystem I assembly protein Yc4 Yc4
1 228 109/ 115(94)
光系统 II磷蛋白
Photosystem II phosphoprotein
1 142 71/ 73(97)
金属硫蛋白 1
Metallothionein 1
3 97.4 41/ 53(77)
肿瘤相关蛋白
Tumor-related protein 3 214 104/ 156(66)
植物防御素蛋白
Plant defensin protein
3 165 76/ 99(76)
延伸因子
Elongation factor
1 368 179/ 187(95)
类分泌蛋白
Secretory protein-like 1 184 88/181(48)
剪接因子 SC35
Splicing factor SC35
1 202 97/112(86)
核转运因子 2
Nuclear transport factor 2-related2 1 231 110/ 123(89)
60S核糖体蛋白
60S ribosomal protein L24 60S
1 214 105/ 112(93)
真核起始翻译因子
Eukaryotic translation initiation factor 5A
1 301 148/ 154(96)
苯醌氧化还原酶
NAD(P)H-quinone oxidoreductase chain 3 , chloroplastNAD 1 199 98/105(93)
类丝氨酸蛋白激酶
Serine protein kinase-like 1 184 90/131(68)
RNA复制酶
RNA replicase
1 82 58/154(37)
硫氧还蛋白 H
Thioredoxin H
1 143 65/115(56)
线粒体合成酶表达蛋白
Mitochondrial ATP synthase 6 KD subunit
1 87.8 38/ 52(73)
蔗糖运转蛋白
Sucrose transport protein
1 213 106/ 166(63)
ABA 响应相关表达蛋白
ABA-responsive protein related 1 134 74/137(54)
叶绿体苏氨酸合成酶
Threonine synthase , chloroplast precursor 1 104 51/ 69(73)
分支酸合酶
Chorismate synthase , chloroplast precursor 1 342 169/ 203(83)
休眠关联蛋白
dormancy-associated protein-related 1 135 67/122(54)
遍在对苯二酚细胞色素 C还原酶相关蛋白
ubiquinol--cytochrome-c-reductase-related protein 1 114 54/ 72(75)
木葡聚糖内切 β -1 , 4-D-葡聚糖酶
Xyloglucan endo-1 , 4-beta-D-glucanase 1 409 193/ 304(63)
1-氨基环丙烷-1-羧酸(ACC)氧化酶
1-aminocyclopropane-1-carboxylate oxidase 2 97.8 49/ 65(75)
酸性磷酸酯酶前体
acid phosphatase precursor
1 117 50/ 65(76)
微管相关蛋白
Microtubule associated protein
1 186 93/108(86)
·59·1期 王博等:新疆雪莲全长 cDNA文库构建及表达序列标签(ESTs)特性分析
3 结论与讨论
3.1 实验采用 SMART(switching mechanism at 5′end of RNA transcript)技术构建了雪莲的全长 cDNA文库。
SMART是 Clontech 公司的一项专利:第一链 cDNA 合成用一个经修饰的 olig(dT)引物 CDS Ⅲ primer ,
SMARTⅢ寡核苷酸作为 mRNA5′端延伸出去的模板 ,当逆转录达mRNA5′端时 ,逆转录具有模板不依赖性
的在第一链 cDNA3′端加上几个 C ,与 SMARTⅢ寡核苷酸 3′端的几个 G 配对 ,从而使寡核苷酸连接到
mRNA5′端 。逆转录酶跳移并以SMARTⅢ寡核苷酸为模板 ,反转录至SMARTⅢ寡核苷酸的末端 ,而这种
跳移常常发生在真核生物的mRNA帽子结构-m7GpppX ,这样反转录出的 cDNA包含mRNA完整的 5′及
SMARTⅢ寡核苷酸的互补序列 ,再用 PCR合成 cDNA第二链 ,PCR的引物是 CDS Ⅲ primer及SMARTⅢ寡
核苷酸上的一段-5′PCR Primer。那些过早终止逆转录的非全长 cDNA 因不具有 SMART Ⅲ寡核苷酸而
不能作为模板被扩增 ,只有含全长 mRNA和 SMARTⅢ寡核苷酸的 cDNA才能在扩增反应中作为模板被
扩增合成第二链 cDNA[ 6] 。然后经酶切与载体连接 ,从而构成了全长的 cDNA文库 。此文库所分离的
cDNA克隆包含了相应mRNA分子完整的5′非编码区序列 ,为研究目的基因在翻译水平上调控机理奠定
了重要基础。
3.2 通常用于 cDNA文库构建的载体有质粒和噬菌体 。但由于质粒 cDNA 文库包含的 cDNA克隆数目
较少 ,适于较高丰度的mRNA;而噬菌体 cDNA 文库包含的 cDNA克隆数目很多 ,适用于那些低丰度的
mRNA考虑到雪莲某些特殊基因丰度很低 ,实验选择噬菌体作为文库构建的载体 ,以提高其被捕获的可
能性[ 7] 。
3.3 BLAST 搜索是一种推测查询序列生物学功能的快速 、有效的方法。但这只是为确定所编码蛋白质
的功能提供暂定的线索 ,真正的功能必须经过一系列的生化和遗传学方法方能确认 。实验中多数的序
列暂时不能根据与数据库同源蛋白序列相似性鉴定功能。有两方面的原因:一是蛋白质数据库有限 ,某
些新基因在数据库中不存在同源蛋白质;另一原因可能是数据信息挖掘不够。BLASTX依据的仅仅是
氨基酸序列的相似性 ,而不同的氨基酸序列可以形成相似性的高级结构和功能域 ,氨基酸序列相差甚大
的蛋白质可能具有相同功能。蛋白质数据库是不断增大的 ,随着数据库的不断丰富 ,现在无法鉴定的功
能序列可能成为可鉴定的功能序列[ 8] 。同源蛋白中大多数是抗病与防御基因 ,许多来源于生物与非生
物胁迫的 cDNA文库 ,这些胁迫包括:病原菌 、干旱 、低温 、高温 、紫外线 、重金属等。这一结果显示生物
体对外界的胁迫反应可能存在相同的机制。这些都有待于今后的进一步的研究 。
参考文献:
[ 1] 赵莉 ,王晓玲.新疆雪莲的化学成分 、药理作用及其临床应用[ J] .西南民族学院学报(自然科学版).2003 ,29(4).424-428.
[ 2] 赵德修 ,赵丽丽.雪莲花的研究进展[ J] .中草药 , 1996, 27(6):372-374.
[ 3] 吕秀娟 ,危晓薇 ,艾秀莲 ,等.新疆陆地棉转化雪莲 XLPEBP基因的研究[ J] .新疆农业科学 , 2007 ,44(1):47-49.
[ 4] 张学军 ,艾秀莲 ,吕秀娟 ,等.雪莲 PEBP基因原核表达载体的构建及表达[ J] .新疆农业科学 , 2007 , 44(3):329-332.
[ 5] 胡雪梅 ,秦丽 ,贺宾 ,等.新疆雪莲组织培养体系的优化[ J] .新疆农业科学 ,2007 , 44(3):333-335.
[ 6] 陈发菊 ,杨映根 ,赵德修 ,等.我国雪莲植物的种类 ,生境分布及化学成分的研究进展[ J] .植物学通报 , 1999, 16(5):561-566.
[ 7] 黄继红 ,谭敦炎.雪莲的研究进展[ J] .新疆农业大学学报 , 2002 , 25(2):8-13.
[ 8] Chenchik , A., Y.Zhu , L.Diatchenko , et al.Generation and use of high-quality cDNA from small amounts of total RNA by SMART PCR[ M] .USA:
Biol Techn:quespress, 1998:305-319.
[ 9] Chenchik A , Diatchenko L , Chang C , et a1.Great lengths cDNA synthesis kit for high yields of ful-length cDNA[ J] .Clontechniques , 1994 , Ⅸ (1):
9-12.
[ 10] 高健 ,许晓风 ,乌慧玲 ,等.特异种质烟草全长 cDNA 文库的构建及质量分析[ J] .安徽农业大学学报 , 2004 , 31(1):22-25.
[ 11] Lluisma A O , Ragan M A.J Appl Phycol , 1997, 9:287.
[ 12] Lluisma AO , and M.A.Ragan.Expressed sequence tags(EsTs)f rom the marinered alga gracilaria gralilis[ J] .J.Appl.Phycd.1997 , 9:287-293.
·60· 新疆农业科学 45卷