免费文献传递   相关文献

Sequence Divergence and Expression Specificity of the Starch Synthase Gene Family in Oryza officinalis Leaf

药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达


淀粉不仅是植物自身和后代生长繁殖的重要营养与能量储备, 而且是人类膳食中碳水化合物的主要来源。植物中淀粉合成主要发生在两个阶段, 一是在形成临时淀粉的光合作用阶段, 另一个则是在成为贮藏淀粉的营养积累阶段。相对于最后的淀粉贮藏阶段, 临时淀粉的形成阶段在植物整个碳水化合物代谢过程中扮演着更为重要的角色, 然而却一直少有关注。为深入研究初始淀粉合成过程中相关酶在植物中的进化模式, 选取了药用野生稻(Oryza officinalis)为研究对象, 通过对其全叶转录组的重测序, 定性、定量地调查了淀粉合成酶基因家族在稻属野生物种光合器官中的基因类型和表达变化。共有8个淀粉合成酶基因的完整编码序列在药用野生稻的叶中首次被识别。系统发育分析表明, 这8个基因分别隶属SSISSIISSIIISSIVSSVGBSSII基因家族。序列比较和相对表达定量分析显示, 药用野生稻与栽培稻的淀粉合成酶基因家族的进化模式具有高度的一致性, 两个物种的同源基因在mRNA水平的序列相似度达到95%-98%。基于非同义置换和同义置换比率的统计检验表明, 8个基因在两个物种间均经历了严格的纯化选择。另外, 3个在栽培稻胚乳中特异表达的基因在药用野生稻的叶转录组中未筛查出来, 而4个在栽培稻叶中优势表达的基因在药用野生稻叶中同样呈现相对较高水平的表达。

Starch is produced by most green plants as an energy store and is also a major carbohydrate source in human diet. There are two stages of starch synthesis in most plants. In the first stage, transient starch is produced during photosynthesis, and in the second, the nutrition accumulation stage, starch is deposited for storage purposes. Although the first stage of starch synthesis plays a critical role in carbohydrate metabolism, starch biosynthesis in photosynthetic organs has received less attention. To detect the evolutionary patterns associated with starch synthase, the enzyme involved in the biosynthesis of starch, in plant photosynthetic organs, we used leaf transcriptome resequencing to investigate the genotype and expression divergence of the gene family in Oryza officinalis. Eight complete starch synthase genes were identified, and phylogenetic analyses confirmed that the genes were SSI, SSII, SIII, SSIV, SSV, and GSBBII. Comparison of sequences and expression quantities showed that the evolutionary patterns of the starch synthase family in O. officinalis were highly consistent with those of cultivated rice. The homologous sequence identities between the two species were 95% to 98% at the mRNA level. Further statistical tests based on the ratio of nonsynonymous to synonymous substitutions indicated that all eight genes were under significant purifying selection. In addition, three genes specifically expressed in the endosperm of cultivated rice were not found in the leaf transcriptome of O. officinalis. However, four genes with predominant expression in the leaves of cultivated rice showed relatively higher expression in the O. officinalis leaf transcriptome.


全 文 :植物学报 Chinese Bulletin of Botany 2015, 50 (6): 683–690, www.chinbullbotany.com
doi: 10.11983/CBB14147
——————————————————
收稿日期: 2014-08-07; 接受日期: 2015-01-05
基金项目: 山东省自然科学基金(No. ZR2012CM024)和中国科学院系统与进化国家重点实验室开放课题(No.LSEB2011-01)
* 通讯作者。E-mail: baoyingus@126.com
药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达
包颖*, 杜家潇, 景翔, 徐思
曲阜师范大学生命科学学院, 曲阜 273165
摘要 淀粉不仅是植物自身和后代生长繁殖的重要营养与能量储备, 而且是人类膳食中碳水化合物的主要来源。植物中淀
粉合成主要发生在两个阶段, 一是在形成临时淀粉的光合作用阶段, 另一个则是在成为贮藏淀粉的营养积累阶段。相对于
最后的淀粉贮藏阶段, 临时淀粉的形成阶段在植物整个碳水化合物代谢过程中扮演着更为重要的角色, 然而却一直少有关
注。为深入研究初始淀粉合成过程中相关酶在植物中的进化模式, 选取了药用野生稻(Oryza officinalis)为研究对象, 通过对
其全叶转录组的重测序, 定性、定量地调查了淀粉合成酶基因家族在稻属野生物种光合器官中的基因类型和表达变化。共
有8个淀粉合成酶基因的完整编码序列在药用野生稻的叶中首次被识别。系统发育分析表明, 这8个基因分别隶属SSI、SSII、
SSIII、SSIV、SSV和GBSSII基因家族。序列比较和相对表达定量分析显示, 药用野生稻与栽培稻的淀粉合成酶基因家族
的进化模式具有高度的一致性, 两个物种的同源基因在mRNA水平的序列相似度达到95%–98%。基于非同义置换和同义置
换比率的统计检验表明, 8个基因在两个物种间均经历了严格的纯化选择。另外, 3个在栽培稻胚乳中特异表达的基因在药用
野生稻的叶转录组中未筛查出来, 而4个在栽培稻叶中优势表达的基因在药用野生稻叶中同样呈现相对较高水平的表达。
关键词 叶转录组, 可溶性淀粉合成酶, 颗粒结合淀粉合成酶, 序列定位, 基因表达
包颖, 杜家潇, 景翔, 徐思 (2015). 药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达. 植物学报 50, 683–690.
淀粉不但是植物自身和后代生长繁殖的重要营
养和能量储备, 而且是人类膳食中碳水化合物的主要
来源。淀粉首先在植物叶中形成, 作为光合作用的一
种代谢产物被暂存在叶绿体中, 此后在植物个体发育
的过程中, 这些淀粉被重新分解为葡萄糖并转运到植
物各贮藏器官, 然后通过白色体再次被合成为贮藏淀
粉。因此, 在植物体内, 淀粉合成主要发生在两个关
键阶段, 一是作为临时淀粉的合成阶段, 主要发生在
植物的叶中; 另一个是作为贮藏淀粉的营养积累阶
段, 主要发生在一些植物的果实、种子和根茎等器官
中(Ohdan et al., 2005; Zeeman et al., 2007, 2010;
Orzechowski, 2008)。淀粉是以α-D-葡萄糖为基本单
位构成的高分子化合物, 根据形成过程和立体排列方
式的不同, 可以分为直链淀粉和支链淀粉。直链淀粉
在结构上基本呈线性状态, 葡聚糖链内部靠α-1,4糖
苷键维系; 支链淀粉则高度分支, 分支内和分支间分
别以α-1,4糖苷键和α-1,6糖苷键相连(Buléon et al.,
1998)。目前公认的与淀粉生物合成直接相关的酶主
要有4种, 即提供淀粉合成底物的ADP-葡萄糖焦磷酸
化酶(AGPase)、催化淀粉合成的以α-1,4糖苷键延伸
的淀粉合成酶(SS)、促进淀粉分支的淀粉分支酶(SBE)
以及修剪不合适分支的淀粉脱支酶(DBE) (Myers et
al., 2000)。在栽培稻中, 有详细记载的淀粉合成酶包
括5种类型: GBSS、SSI、SSII、SSIII和SSIV (Hirose
and Terao, 2004; Deschamps et al., 2008)。其中
GBSS被证明与直链淀粉延长有关 , 而所有SS酶
(SSI-IV)则被认为参与支链淀粉的合成(Myers et al.,
2000; Fujita, 2014)。除SSI外, 各种淀粉合成酶都有
同工酶, 其中GBSS、SSIII和SSIV各具有2种同工酶,
而SSII具有3种同工酶 (Hirose and Terao, 2004;
Jiang et al., 2004)。编码这些淀粉合成酶的基因在植
物组织中具有不同的时空表达模式, 承担不同的功能
(Hirose and Terao, 2004; Dian et al., 2005; Fujita,
2014)。在栽培稻中按照表达的特异性可以将淀粉合
成酶基因归为两类, 一类在胚乳中高表达, 负责贮藏
淀粉的合成; 另一类在叶中优势表达, 控制临时淀粉
的合成(Dian et al., 2005; Ohdan et al., 2005)。此外,
对不同植物的研究表明, 尽管SS同工酶之间存在功
·研究报告·
684 植物学报 50(6) 2015

能冗余的现象(Zhang et al., 2008), 但并不能做到完
全的功能补偿(Fujita et al., 2011; Brust et al., 2014)。
有关淀粉合成酶的研究在栽培作物中已经开展地非
常深入(Cao et al., 1999; Ohdan et al., 2005; Stam-
ova et al., 2009; Gámez-Arjona et al., 2011), 但针
对栽培作物野生亲缘种类的研究却非常少。同时由
于以往的研究过分聚焦淀粉合成的营养积累阶段 ,
使得在整个碳水化合物代谢过程中扮演重要角色的
初始淀粉合成阶段缺乏应有的重视 , 极大地限制
了对淀粉合成酶基因家族整体进化状态的全面理
解。
野生稻是栽培稻遗传改良的重要基因源。作为自
然发展的产物, 野生稻更能代表植物进化的基本状
态。为了进一步探究淀粉合成酶基因家族在野生稻中
的进化状态, 本研究选取了稻属中与栽培稻远缘的药
用野生稻(Oryza officinalis)作为研究对象, 利用叶转
录组重测序的方法定性定量地调查了淀粉合成酶基
因家族在淀粉合成第一关键阶段的构成和表达变化,
并通过与栽培稻中同源基因的直接对比, 明确了该基
因家族在稻属野生物种中的序列特点和表达特异性。
其结果为进一步理解植物淀粉合成酶基因家族的进
化提供了参考。
1 材料与方法
1.1 植物材料
本研究选取国际水稻所种子资源库(IRRI)中药用野生
稻(Oryza officinalis Wall. ex Watt, 编号为104973)
作为实验材料。设立3组生物学重复。将去壳种子50°C
处理5天以打破休眠, 消毒后移入带滤纸的湿润培养
皿, 在30°C光照培养箱中萌发。将萌发的种子播种在
花盆中并移入温室培养至成年植株, 统一于午后收取
当天充分展开的全叶, 用于RNA提取。
1.2 实验方法
从3株相同编号的药用野生稻植物上各称取30 mg新
鲜叶组织混合在一起 , 利用小量RNA提取试剂盒
(MiniBEST Universal RNA Extraction Kit, Takara,
Cat No.9767), 按照产品使用说明提取总RNA。过柱
(RNeasy plant columns, Qiagen, Cat No.74903)纯
化和酶切消化(RNAase-free DNAase I, Takara, Cat
No.2270A)残存的DNA。RNA浓度和完整性利用
NanoDrop和Agilent 2100 Bioanalyzer进行检测。
文库构建按照Illumina TruSeqTM RNA文库准备
试剂盒产品说明书的标准流程进行。首先通过Oligod
(T)对总RNA中mRNA进行分离并经94°C高温处理8
分钟, 将其片段化成大约200 bp的片段。其次利用随
机引物将这些片段化的mRNA逆转录成cDNA的第1
链, 并以其为模板生成双链cDNA; 此后经过纯化、末
端补平和3′末端加A等过程, 再连接Illumina的pair-
end接头并通过PCR进行富集。扩增产物通过琼脂糖
凝胶电泳分离并切胶回收位于300–350 bp范围的条
带 , 得到pair-end文库。用2100 Bioanalyzer High
Sensitivity DNA Chip判断PCR切胶产物片段大小是
否符合后续测序的要求, 并利用q-PCR标准品的摩尔
浓度对构建的文库进行摩尔浓度的绝对定量。最后利
用Illumina HiSeq2000进行双向测序(博奥生物有限
公司), 通过100个循环的测序反应得到2x100 bp的
原始读长数据。
1.3 数据分析
分别以GenBank (http://www.ncbi.nlm.nih.gov)中注
释的栽培稻淀粉合成酶基因家族GQ150946.1 (SSI)、
AF383878.1 (SII1)、AF395537.1 (SSII2)、GQ15098-
8.1 (SSII3)、GQ151004.1 (SSIII1)、GQ151017.1 (S-
SIII2)、GQ151029.1 (SSIV1)、GQ151050.1 (SSIV-
2)、EU621837.1 (SSV)、AF031162.2 (GBSSI)和
GQ150864.1 (GBSSII)的mRNA作为参考序列, 将过
滤过的高质量读长利用软件Bowtie2-2.2.3 (Lang-
mead and Salzberg, 2012)进行对位排列(mapping)。
考虑到野生稻和栽培稻基因之间可能存在一定程度的
分歧, 将参数mismatch从1向上依此设置, 直到饱和为
止。对位排列完成后输出的SAM格式文件通过SAM-
tools-0.1.19 (Li et al., 2009)软件去掉不匹配的读长, 并
对各基因的匹配读长进行计数。由于长的基因片段有机
会匹配更多的读长, 因此我们采用每百万读长内匹配的
读长数除以基因长度的方法, 即RPKM (reads per ki-
lobase per million mapped reads)方法(Trapnell et al.,
2010; Garber et al., 2011)来进行校正。
基因相对定量的计算采用如下公式:
RPKM(X)=109 C/NL
其中C代表能够匹配到各基因上的读长数; N代
包颖等: 药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达 685

表转录组总的匹配读长数; L代表基因长度。
同时, 收集每个基因下所有的读长进行拼接得到
药用野生稻中各基因编码序列的mRNA全长, 并和栽
培稻的参考序列进行比对。编码序列碱基置换情况利
用KaKs_Calculator软件(zhang et al., 2008)中的NG
(Nei and Gojobori, 1986)、YN (Yang and Nielsen,
2000)和综合考虑序列进化特点(如转换和颠换的比
率以及核苷酸频率的最大相似性方法中的GY) (Gold-
man and Yang, 1994)3种模型进行统计计算, 并通
过Fisher对结果进行检验。
此外, 为进一步了解药用野生稻叶转录组中淀粉
合成酶基因家族各成员和被子植物其它类群同源基
因的系统发育关系, 我们分别选取了双子叶植物拟南
芥 (Arabidopsis thaliana)和单子叶植物玉米 (Zea
mays)作为代表, 通过查询拟南芥TAIR (The Arabi-
dopsis Information Resource, http://www.arabi-
dopsis.org/)和玉米MaizeGDB (Maize Genetics and
Genomics Databse, http://www.maizegdb.org/)的全
基因组数据库, 结合栽培稻同源基因的BLASTP搜寻
(阈值的所有淀粉合成酶基因和相应的氨基酸序列。利用
SeaView (Gouy et al., 2010)软件将药用野生稻的
mRNA序列翻译成氨基酸序列并与上述两物种的同
源基因进行对位排列。将排好的数据矩阵利用软件
PhyML3.0 (Guindon et al., 2010)在JTT (Jones-
Taylor-Thornton)模型下构建最大似然性(maximum
likelihood, ML)系统发育关系树。设置根的位置在ML
树的中点, 拓扑结构的可靠性通过100次重复的自展
检验来评估。
2 结果与讨论
2.1 药用野生稻叶中淀粉合成酶基因家族的成员
构成和序列特征
药用野生稻叶转录组测序共得到22 820 314个原始
读长, 信息统计分析表明, 其中的20 603 655个可以
定位到不同的转录本, 其中18 728个分别定位到栽
培稻淀粉合成酶基因家族的不同基因上。能够定位到
GBSSII基因的读长最多, 达到9 779个, 占全部匹配
读长(20 603 655)的0.047%, 其次有3 035、3 365和
1 216个读长(0.016%–0.006%)分别定位到SSII2、
SSIII1和SSI基因上。而对于其它基因, 例如SSII3、
SSIV1和GBSSI, 只有非常少的读长, 即82、 20和31
(0.000 2%–0.000 4%)能够定位其上(表1)。
通过后续的拼接, 除SSII3、SSIV1和GBSSI具有
极少数匹配读长的基因外, 共得到药用野生稻淀粉合
成酶基因家族中8个基因(SSI、SSII1、SSII2、SSIII1、
SSIII2、SSIV2、SSV和GBSSII)的完整编码区序列。
这8个基因序列的长度具有明显差异, SSIII2基因最
长, 为4 653 bp, GBSSII最短, 为1 827 bp, 二者相
差近3倍。通过与GenBank中栽培稻(O. sativa)同源
基因的比对, 发现两个物种享有较高的序列相似度,
在mRNA水平, 不同基因对之间的同源性达到95%–
98%, 而在推测的氨基酸水平, 序列同源性也达到
93%–97% (表2)。但是, 这8个基因彼此之间的序列
一致性却并不高, 在推测的氨基酸水平, 8个基因之
间的序列相似度仅为18%–62% (表3)。以上8个基因
在GenBank (http://www.ncbi.nlm.nih. gov)中存储号
为(KM264349–KM264356)。
进一步比较药用野生稻和栽培稻对应基因之间
的核苷酸置换情况, 发现基于3种统计模型的计算均
得出一致的结果, 即全部8个基因的Ka/Ks值均显著
小于1 (P<0.01) (表4), 说明这8个基因在2个物种内
均经历了严格的纯化选择。
2.2 系统发育分析
通过查询拟南芥全基因组数据库TAIR (The Arabi-
dopsis Information Resource, http://www.arabidop-
sis.org/), 共找到6个淀粉合成酶基因。结合拟南芥表
达资料和注释信息, 我们发现其中5个基因分属SS1–
SS4 (AT5G24300.1_ATSS1、AT3G01180.1_AtSS2、
AT1G11720.2_AtSS3、AT4G18240.1_ATSS4)以及
GBSS (AT1G32900.1_GBSS), 另外还有1个基因
(AT5G65685.1), 尽管注释标明具有淀粉合成酶活性
并和SS4 (AT4G18240.1)基因匹配, 但该基因和SS4
基因在氨基酸水平却仅有30%的序列相似性, 因此我
们推测该基因有可能是拟南芥SS类基因的新类型。
在玉米基因组数据库MaizeGDB (Maize Genetics
and Genomics Databse, http://www.maizegdb.org/)中,
我们找到10个基因, 这10个基因同样分别属于SSI–
SSV (GRMZM2G129451_SSI、GRMZM2G348551_
SSII1、GRMZM2G126988_SSIIc、GRMZM2G141-
686 植物学报 50(6) 2015

表1 药用野生稻叶转录组中的淀粉合成酶基因
Table 1 Starch synthase genes in leaf transcriptome of Oryza officinalis
Gene SSI SSII1 SSII2 SSII3 SSIII1 SSIII2 SSIV1 SSIV2 SSV GBSSI GBSSII
Mapped reads 1 216 419 3 035 82 3 365 280 20 249 252 31 9 779
Gene length (bp) 1 883 2 256 2 073 – 3 663 4 653 – 2 754 2 115 – 1 827


表2 药用野生稻与栽培稻淀粉合成酶基因的同源比较
Table 2 Homologous comparisons of the starch synthase genes between Oryza officinalis and O. sativa
Gene SSI SSII1 SSII2 SSIII1 SSIII2 SSIV2 SSV GBSSII
mRNA identities 96.4% 95.2% 95.5% 97.1% 96.4% 95.4% 95.2% 98.1%
Amino acid identities 96.9% 94.5% 93.1% 96.3% 94.1% 94.7% 93.6% 97.0%


表3 药用野生稻各淀粉合成酶基因之间氨基酸序列的一致性
Table 3 Amino acid sequence identities among the starch synthase genes in Oryza officinalis
SSI SSII1 SSII2 SSIII1 SSIII2 SSIV2 SSV
SSII1 41.3% – – – – – –
SSII2 41.8% 58.1% – – – – –
SSIII1 28.7% 23.6% 25.6% – – – –
SSIII2 28.1% 23.4% 26.0% 61.9% – – –
SSIV2 28.0% 24.2% 27.6% 28.9% 29.8% – –
SSV 20.4% 18.8% 20.6% 24.1% 24.3% 27.7% –
GBSSII 31.6% 34.4% 33.5% 26.9% 27.1% 28.6% 17.8%


399_DULL1、GRMZM2G105791_SSIIb2、GRMZM-
2G121612 _SSIIIb1、GRMZM2G044744_SSIV和
GRMZM2G130043_SSV)以及GBSS淀粉合成酶基
因 (GRMZM2G024993_GBSSI 和 GRMZM2G0082-
63_GBSSIIa)。
综合拟南芥、玉米、栽培稻以及本实验的药用野
生稻的淀粉合成酶基因翻译的35条氨基酸序列, 我
们构建了最大似然性(ML)系统发育关系树(图1A)。该
ML树显示, 这几类植物的淀粉合成酶基因家族主要
组成4个高支持率 (分别为76%、100%、100%和
100%)的大分支, 分支I和III又各自包括2个具有高支
持率(98%或100%)的小分支。结合注释信息, 我们发
现淀粉合成酶基因完全按照基因类型归入各个分支,
其中分支I包括SSI和SSII类淀粉合成酶基因, 分支II
仅包含GBSS类淀粉合成酶基因, 分支III包括SSIV和
SSV类淀粉合成酶基因, 分支IV则只包括SSIII类淀
粉合成酶基因。拟南芥的AT5G65685.1位点落入分支
III的SSV类淀粉合成酶基因所属分支内。
此外, 在不同的分支内部, 稻属和玉米谱系多包
含由不同异构酶基因组成的平行分支。如分支I中包含
SSII的分支又进一步平行分为包含SSII1和SSII2-
SSII3的小分支, 拟南芥的SSII基因则位于玉米和稻
属SSII分支的外围基部。类似的现象也见于SSIII类基
因所属分支内(图1A)。另外, 我们还注意到, 玉米和
稻属的淀粉合成酶基因家族的复制情况也并非完全
一致。稻属内的淀粉合成酶基因家族谱系扩张情况似
乎较玉米更为强烈, 至少目前的系统发育树上栽培稻
SSIV1位点的出现显示出谱系专有的特点。
为进一步了解各淀粉合成酶基因的表达情况, 我
们通过分析各个基因读长匹配的情况, 采用RPKM方
法估算和校正了各基因的相对表达量。由于没有得到
药用野生稻SSII3、SSIV1和GBSSI三个基因的全长,
因此这里采用栽培稻对应基因的长度来代替。各淀粉
合成酶基因的相对表达情况见图1B。其中GBSSII相
对表达量最高; 其次为SSII2、SSIII1、SSI和SSII1;
SSIV2和SSV则具有相对极低的表达量, SSII3、SSIV1
和GBSSI基本没有表达。这种表达模式与我们得到的
完整基因的情况相吻合。

包颖等: 药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达 687

表4 各淀粉合成酶基因在药用野生稻和栽培稻物种间的基因
置换
Table 4 Gene substitutions between Oryza officinalis and
O. sativa
Sequence Method Ka Ks Ka/Ks P-value (Fisher)
SSI GY-HKY 0.009 0.079 0.112 6.75E-14**
SSII1 GY-HKY 0.026 0.114 0.225 1.46E-14**
SSII2 GY-HKY 0.035 0.062 0.560 6.95E-03**
SSIII1 GY-HKY 0.015 0.068 0.219 5.50E-14**
SSIII2 GY-HKY 0.027 0.076 0.358 2.37E-11**
SSIV2 GY-HKY 0.029 0.100 0.289 9.13E-12**
SSV GY-HKY 0.025 0.087 0.289 1.71E-08**
GBSSII GY-HKY 0.014 0.038 0.361 3.07E-03**
SSI NG 0.009 0.085 0.108 1.54E-13**
SSII1 NG 0.024 0.128 0.189 2.83E-16**
SSII2 NG 0.034 0.065 0.526 5.94E-03**
SSIII1 NG 0.015 0.069 0.215 3.33E-13**
SSIII2 NG 0.026 0.080 0.329 5.39E-12**
SSIV2 NG 0.029 0.101 0.285 6.06E-11**
SSV NG 0.024 0.095 0.255 2.00E-09**
GBSSII NG 0.013 0.041 0.315 8.70E-04**
SSI YN 0.009 0.076 0.116 1.54E-12**
SSII1 YN 0.026 0.110 0.233 1.18E-12**
SSII2 YN 0.034 0.062 0.558 1.47E-02**
SSIII1 YN 0.015 0.062 0.245 1.11E-11**
SSIII2 YN 0.027 0.070 0.389 4.50E-09**
SSIV2 YN 0.029 0.096 0.302 2.61E-10**
SSV YN 0.025 0.087 0.289 5.49E-08**
GBSSII YN 0.013 0.038 0.357 2.95E-03**
** P<0.01
2.3 讨论
淀粉是植物光合作用的重要产物, 在大多数高等植物
中被作为重要的营养储备, 提供植物当代和后代生长
发育过程中的能量补充。作为植物淀粉合成的第1个
重要阶段, 叶内淀粉合成的效率和产量对后续贮藏淀
粉的积累具有至关重要的影响。本研究中, 我们从药
用野生稻叶转录组数据中共获得8个淀粉合成酶基
因, 分别编码SSI–SSV和GBSS 6类不同的淀粉合成
酶。与栽培稻的同源基因对比后发现, 它们之间尽管
具有较高的序列同源性, 但这8个基因在物种间仍然
保持不同程度的序列差异。各同源基因之间氨基酸序
列水平的分歧在3%–7%之间波动。由于栽培稻一直
作为谷物粮食进行驯化, 而淀粉又是谷物粮食的主要
贮藏物质, 因此相对于野生物种, 栽培物种在淀粉合
成酶基因序列上的任何变化都有可能是人工选择的
结果。进一步分析各基因对之间的核苷酸置换情况,
特别是非同义置换和同义置换的比率, 发现8个基因
均处于严格的纯化选择之下(Ka/Ks<1, P<0.01) (表
4), 并且其同义置换(GY-HKY: 0.038–0.114)和非同
义置换(GY-HKY: 0.009–0.035)的数值与其它已知的
功能基因的置换率相比, 处于相对较低的水平。例如,
通过比较稻属9个物种的基因组共线性片段, Ammir-
aju等(2008)计算了6个核心基因(Adh1、Adh2、RZ53、
Peroxidase、NifS_Exon2和PIK)的置换率, 其中栽培
稻和药用野生稻的6对同源基因之间的同义和非同义
置换率分别在0.069–0.145和0.002–0.073之间波动。
而Lu等(2009)基于另外的基因组同源片段分析也得
出两个物种的同源基因对之间的Ks值变化范围为
0.067–0.143。因此, 根据以上的结果可以推测, 处于
植物光合作用主要碳水化合物合成的第一个关键阶
段, 淀粉合成酶基因家族承担着重要的物质贮藏和能
量储备任务, 因此该基因家族在野生稻和栽培稻中均
处在强烈的纯化选择之下。同时偏低的Ka/Ks值也说
明栽培稻所经历的人工驯化并没有在这个基因家族
的编码区留下明显印迹。
此外, 纵观拟南芥、药用野生稻、玉米和栽培稻
4个物种在最大似然性系统发育树上的分布情况(图
1A), 我们发现4个物种近乎均匀地散布在各个主要
分支, 这种拓扑结构充分说明目前淀粉合成酶基因家
族的组成, 即包括SSI–SSV以及GBSS共6类淀粉合
成酶基因的格局应该至少存在于单子叶和双子叶植
物分开之前。事实上, 伴随光合作用的淀粉合成代谢
在植物进化的早期就已经出现, 但真正成为绿色植物
谱系特异的代谢途径则发生在绿色植物与红藻分开
之后 , 而淀粉合成酶基因家族的SSI–SSIV以及
GBSS 5类基因也同样在绿藻基因组中就已经出现
(Deschamps et al., 2008)。SSV则属于比较特殊的一
类基因, 它在绿色藻类中全部缺失, 目前所有关于此
类基因的注释信息均来自生物信息学预测而非直接
的实验结论。从本研究得出的最大似然树看, 所有
SSV类基因构成的分支尽管以100%的自展支持率与
SSIV类基因的分支聚合在一起, 但显示了非常奇怪
的长枝(图1A)。基于氨基酸序列的比较也表明, SSV
基因与其它基因的相似度(18%–28%)均低于另外5类
基因彼此之间的相似度(23%–62%) (表3)。因此, 该
基因是否属于淀粉合成酶基因家族还有待进一步的
688 植物学报 50(6) 2015


图1 淀粉合成酶基因家族系统发育关系和基因相对表达
(A) 基于拟南芥、栽培稻、药用野生稻和玉米的淀粉合成酶基
因家族氨基酸同源序列构建的最大似然树(分支附近的数值代
表自展支持率); (B) 药用野生稻中淀粉合成酶各基因的相对表
达情况。

Figure 1 Phylogenetic relationships and relative expression
level of the starch synthase gene family
(A) The maximum likelihood tree of the starch synthase gene
family based on amino acid homologous sequences of
Arabidopsis thaliana, Oryza officinalis, O. sativa, and Zea
mays (Numbers near the branches indicate bootstrap val-
ues); (B) Relative expression level of the starch synthase
genes in O. officinalis.
生物学功能验证。
另外, 系统发育关系树上禾本科谱系内频繁出现
的平行小分支也值得关注。这些小分支展示了后续进
化过程的谱系特异扩张。这种源自基因复制的谱系扩
张有可能与不同植物对淀粉合成的倚重性有关。作为
谷物胚乳的重要组成成分, 淀粉合成酶在禾本科植物
中可能承担更为重要和精细的分工。目前的玉米和稻
属植物类群中, 可以明显看出不同的基因类型下又出
现了不同的亚型, 例如SSIII1和SSIII2以及GBSSI和
GBSSII等, 这与拟南芥每个基因类型下只有单个基
因(Deschamps et al., 2008; Schwarte et al., 2013;
Brust et al., 2014)的情况完全不同。
栽培稻早期的研究表明(Hirose and Terao, 2004;
Dian et al., 2005; Ohdan et al., 2005), 在淀粉合成的
不同阶段, 淀粉合成酶基因家族各个成员的表达会出
现具有时空差异的亚功能分化格局 , 其中SSII2、
SSIII1和GBSSII主要在叶中表达, SSII3、SSIII2和
GBSSI则主要在果皮和胚乳中特异表达。本研究中,
我们发现药用野生稻的叶转录组中仅有0.000 2%–
0.000 4%的读长能够匹配到SSII3、SSIV1和GBSSI
三个基因上, 表明这3个基因在药用野生稻的叶中基
本不表达。这个结果与栽培稻的SSII3和GBSSI基因
不在叶中表达的情况相吻合。同样在栽培稻叶中不表
达的SSIII2基因, 在药用野生稻中也表现出极低的表
达量(表1; 图1B)。另外, 栽培稻和野生稻中类似的基
因表达一致性也体现在那些优势表达的基因上, 如在
药用野生稻中, 3个较高表达的基因GBSSII、SSII2和
SSIII1正是栽培稻叶中特异表达的基因。
本研究中, 我们基于叶转录组的数据, 深入调查
了药用野生稻光合器官中淀粉合成酶基因的构成和
表达情况并获取了8个完整的编码基因, 但是, 由于功
能基因均存在器官表达特异性, 我们目前仍不清楚这
8个基因是否就是野生稻中淀粉合成酶基因家族的全
部构成。我们未获得的SSII3、SSIV1和GBSSI基因, 是
否是因为器官特异性表达而产生的遗漏, 或是因为这
些基因在野生稻中本来就不存在?后续基于基因组和
多器官表达的研究将有助于回答以上问题, 并可帮助
我们深入了解整个淀粉合成酶基因家族在稻属内的进
化历史以及人工驯化对这个基因家族的影响。
致谢 感谢菲律宾国际水稻研究所(IRRI)提供种子样品。
包颖等: 药用野生稻叶中淀粉合成酶基因家族的序列分化和特异表达 689

参考文献
Ammiraju JSS, Lu F, Sanyal A, Yu Y, Song X, Jiang N,
Pontaroli AC, Rambo T, Currie J, Collura K, Talag J,
Fan CZ, Goicoechea JL, Zuccolo A, Chen JF, Bennet-
zen JL, Chen MS, Jackson S, Wing RA (2008). Dynamic
evolution of Oryza genomes is revealed by comparative
genomic analysis of a genus-wide vertical data set. Plant
Cell 20, 3191–3209.
Brust H, Lehmann T, DHulst C, Fettke J (2014). Analysis of
the functional interaction of Arabidopsis starch synthase
and branching enzyme isoforms reveals that the coopera-
tive action of SSI and BEs results in glucans with poly-
modal chain length distribution similar to amylopectin.
PLoS One 9, e102364.
Buléon A, Colonna P, Planchot V, Ball S (1998). Starch
granules: structure and biosynthesis. Int J Biol Macromol
23, 85–112.
Cao HP, Imparl-Radosevich J, Guan HP, Keeling PL,
James MG, Myers AM (1999). Identification of the soluble
starch synthase activities of maize endosperm. Plant Phy-
siol 120, 205–216.
Deschamps P, Moreau H, Worden AZ, Dauvillée D, Ball
SG (2008). Early gene duplication within chloroplastida
and its correspondence with relocation of starch metabo-
lism to chloroplasts. Genetics 178, 2373–2387.
Dian WM, Jiang HW, Wu P (2005). Evolution and expression
analysis of starch synthase III and IV in rice. J Exp Bot 56,
623–632.
Fujita N (2014). Starch biosynthesis in rice endosperm.
AGri-Biosci Monogr 4, 1–18.
Fujita N, Satoh R, Hayashi A, Kodama M, Itoh R, Aihara S,
Nakamura Y (2011). Starch biosynthesis in rice endosp-
erm requires the presence of either starch synthase I or
IIIa. J Exp Bot 62, 4819–4831.
Gámez-Arjona FM, Li J, Raynaud S, Baroja-Fernández E,
Munñoz FJ, Ovecka M, Ragel P, Bahaji A, Po-
zueta-Romero J, Mérida Á (2011). Enhancing the ex-
pression of starch synthase class IV results in increased
levels of both transitory and long-term storage starch.
Plant Biotechnol J 9, 1049–1060.
Garber M, Grabherr MG, Guttman M, Trapnell C (2011).
Computational methods for transcriptome annotation and
quantification using RNA-seq. Nat Methods 8, 469–477.
Goldman N, Yang ZH (1994). A codon-based model of nu-
cleotide substitution for protein-coding DNA sequences.
Mol Biol Evol 11, 725–736.
Gouy M, Guindon S, Gascuel O (2010). SeaView version 4:
a multiplatform graphical user interface for sequence
alignment and phylogenetic tree building. Mol Biol Evol 27,
221–224.
Guindon S, Dufayard JF, Lefort V, Anisimova M, Hordijk
W, Gascuel O (2010). New algorithms and methods to es-
timate maximum-likelihood phylogenies: assessing the
performance of PhyML 3.0. Syst Biol 59, 307–321.
Hirose T, Terao T (2004). A comprehensive expression
analysis of the starch synthase gene family in rice (Oryza
sativa L.). Planta 220, 9–16.
Jiang HW, Dian WM, Liu FY, Wu P (2004). Molecular cloning
and expression analysis of three genes encoding starch
synthase II in rice. Planta 218, 1062–1070.
Langmead B, Salzberg SL (2012). Fast gapped-read align-
ment with Bowtie 2. Nat Methods 9, 357–359.
Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer
N, Marth G, Abecasis G, Durbin R, 1000 Genome Pro-
ject Data Processing Subgroup (2009). The sequence
alignment/map format and SAMtools. Bioinformatics 25,
2078–2079.
Lu F, Ammiraju JSS, Sanyal A, Zhang SL, Song RT, Chen
JF, Li GS, Sui Y, Song X, Cheng ZK, de Oliveira AC,
Bennetzen JL, Jackson SA, Wing RA, Chen MS (2009).
Comparative sequence analysis of MONOCULM1-orthol-
ogous regions in 14 Oryza genomes. Proc Natl Acad Sci
USA 106, 2071–2076.
Myers AM, Morell MK, James MG, Ball SG (2000). Recent
progress toward understanding biosynthesis of the amy-
lopectin crystal. Plant Physiol 122, 989–998.
Nei M, Gojobori T (1986). Simple methods for estimating the
numbers of synonymous and nonsynonymous nucleotide
substitutions. Mol Biol Evol 3, 418–426.
Ohdan T, Francisco PB Jr, Sawada T, Hirose T, Terao T,
Satoh H, Nakamura Y (2005). Expression profiling of
genes involved in starch synthesis in sink and source or-
gans of rice. J Exp Bot 56, 3229–3244.
Orzechowski S (2008). Starch metabolism in leaves. Acta
Biochim Pol 55, 435–445.
Schwarte S, Brust H, Steup M, Tiedemann R (2013). In-
traspecific sequence variation and differential expression
in starch synthase genes of Arabidopsis thaliana. BMC
Res Notes 6, 84.
Stamova BS, Laudencia-Chingcuanco D, Beckles DM
(2009). Transcriptomic analysis of starch biosynthesis in
the developing grain of hexaploid wheat. Int J Plant Ge-
nomics 2009, 407426.
Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G,
690 植物学报 50(6) 2015

van Baren MJ, Salzberg SL, Wold BJ, Pachter L (2010).
Transcript assembly and quantification by RNA-Seq re-
veals unannotated transcripts and isoform switching during
cell differentiation. Nat Biotechnol 28, 511–515.
Yang ZH, Nielsen R (2000). Estimating synonymous and
nonsynonymous substitution rates under realistic evolu-
tionary models. Mol Biol Evol 17, 32–43.
Zeeman SC, Kossmann J, Smith AM (2010). Starch: its
metabolism, evolution, and biotechnological modification in
plants. Annu Rev Plant Biol 61, 209–234.
Zeeman SC, Smith SM, Smith AM (2007). The diurnal me-
tabolism of leaf starch. Biochem J 401, 13–28.
Zhang XL, Szydlowski N, Delvallé D, DHulst C, James MG,
Myers AM (2008). Overlapping functions of the starch
synthases SSII and SSIII in amylopectin biosynthesis in
Arabidopsis. BMC Plant Biol 8, 96.

Sequence Divergence and Expression Specificity of the Starch
Synthase Gene Family in Oryza officinalis Leaf
Ying Bao*, Jiaxiao Du, Xiang Jing, Si Xu
School of Life Sciences, Qufu Normal University, Qufu 273165, China
Abstract Starch is produced by most green plants as an energy store and is also a major carbohydrate source in human
diet. There are two stages of starch synthesis in most plants. In the first stage, transient starch is produced during pho-
tosynthesis, and in the second, the nutrition accumulation stage, starch is deposited for storage purposes. Although the
first stage of starch synthesis plays a critical role in carbohydrate metabolism, starch biosynthesis in photosynthetic or-
gans has received less attention. To detect the evolutionary patterns associated with starch synthase, the enzyme in-
volved in the biosynthesis of starch, in plant photosynthetic organs, we used leaf transcriptome resequencing to investi-
gate the genotype and expression divergence of the gene family in Oryza officinalis. Eight complete starch synthase
genes were identified, and phylogenetic analyses confirmed that the genes were SSI, SSII, SIII, SSIV, SSV, and GSBBII.
Comparison of sequences and expression quantities showed that the evolutionary patterns of the starch synthase family
in O. officinalis were highly consistent with those of cultivated rice. The homologous sequence identities between the two
species were 95% to 98% at the mRNA level. Further statistical tests based on the ratio of nonsynonymous to synony-
mous substitutions indicated that all eight genes were under significant purifying selection. In addition, three genes spe-
cifically expressed in the endosperm of cultivated rice were not found in the leaf transcriptome of O. officinalis. However,
four genes with predominant expression in the leaves of cultivated rice showed relatively higher expression in the O.
officinalis leaf transcriptome.
Key words leaf transcriptome, soluble starch synthase, granule-bound starch synthase, read mapping, gene expression
Bao Y, Du JX, Jing X, Xu S (2015). Sequence divergence and expression specificity of the starch synthase gene family
in Oryza officinalis leaf. Chin Bull Bot 50, 683–690.
———————————————
* Author for correspondence. E-mail: baoyingus@126.com
(责任编辑: 朱亚娜)