免费文献传递   相关文献

Characteristic Analysis of SSR and SNP in Populus cathayana on the Qinghai-Tibetan Plateau by High-Throughput Sequencing

利用高通量测序分析青藏高原地区青杨的SSR和SNP特征



全 文 :林业科学研究!"#$%!"&"$#$, ),
!"#$%&$%$(#)*
!!文章编号!$##$($)*&""#$%##$(##,(#
利用高通量测序分析青藏高原地区青杨的
CCM和 CQI特征
雷淑芸$! "! 张发起$! ,!! G;17 B63S1I$! 王久利$! "! 刘海瑞$! "! 陈世龙$
"$+中国科学院高原生物适应与进化重点实验室!中国科学院西北高原生物研究所!青海 西宁!&$###&% "+中国科学院大学!
北京!$###)*% ,+西南大学生命科学学院!重庆!)##$%#
收稿日期$ "#$)(#-("
基金项目$ 国家自然科学基金",$"#"##,青海省国际科技合作项目""#$)(Qj(&$"#
作者简介$ 雷淑芸!硕士研究生) 主要从事植物遗传多样性学研究) /(0123$&$,"#)$&8XX+9:0
!
通讯作者$博士!助理研究员) /(0123$>XS;17M87V2W@+91K+97
摘要!利用O360271Q2D复合型 DDN共 %"% 条!发生频率 #+$)*!平均跨度 ) %,$+& @W) DDN重复类型中!单核苷酸重复类型最多
",,e*-d#%三核苷酸重复类型次之",$+##d#%二核苷酸重复类型位居第三""+-*d#%四核苷酸,五核苷酸,六核
苷酸重复类型 DDN含量很少" m&d#) 二核苷酸重复类型中!.B重复类型所占比例最高!B.次之!PJ,JP则紧随
其后%三核苷酸重复类型中!..B重复类型所占比例最高!B..次之!JJP,.B.,B.B,P.B,JPJ,JBB等重复类型
数量相近) D]` 分析发现!H$.中含 D]` $-" ,), 个!H".中含 D]` ""* $$% 个) D]` 类型中!转换类型明显高于颠
换类型!H$.中转换类型占 -$+#-d!颠换类型占 ,&+*)d!H".中转换类型占 -$+"d!颠换类型占 ,&+,d) 转换
类型中!P(J发生频率最高!分别为 ,#+%d,,#+--d!.(B发生频率与 P(J相差不大!分别为 ,#+,$d,,#+-"d)
H$.和H".中 D]`K类型及其发生频率变化趋势基本一致!H".中与H$.中相对应的同一 D]`K类型的数量之比约
为 "g$) 分析表明!在青杨的遗传多样性中!D]` 标记较 DDN标记更为可靠)
关键词!青杨%青藏高原%高通量测序%微卫星%单核苷酸多态性
中图分类号!D$&+)- 文献标识码!.
N".1.-(-&+*./7(-()%CCM.*8CQI-*?-.616/4)"0)@)2) )*"#
V-*H".-L!-5#.*I/.#.O57 S-H"L!"1)OH",OC#TO#*&-*H
/E4I*?0^?6
$! "
! 89,:;!(0b2
$! ,
! h*(6 ;?1C(#
$
! N,:;52?012
$! "
! /4<9(20#?2
$! "
! D9E:I*201"6A
$
"$+G<531@:I1F:I5:>.E1WF2:7 17E /T:36F2:7 :>`31F<16 L2:F1! ]:IF;V`31F<16 L2:3:M5! P;27D92<79_2727M!&$###&! r27M;12! P;271% "+C72TP;27D92<79,+D9;::3:>H2>+5(1.&$JV:K10W3H"G?1?%)(&*( (^6( >I:0a6K;6 VM5"O360271Q2DJZ
"####+.F:F13:>#- K:I029I:K1F<32FW:67E 029I:K1F<32F>:3:VE<17E ;;2M;I:3:VV:3:VW;2K0! F;
D]`KV林!业!科!学!研!究 第 "& 卷
V;23FV:K10W3IF;<0:KF! ,#+%d 17E ,#+--d II",#+,$d 17E ,#+-"d#+O7 @:F; K10W3
F;17135K2K27E291FV1K10:I6#7 4)18($H"G?1?%)(&*( (^6(% r27M;12(J2@青藏高原"r27M;12(J2@$#)o/,"-o ,*o]之间!平均海拔超过 ) ### 0!总
面积约 "%# 万 40"*$+ !是世界上面积最大,海拔最
高,地质年代最年轻的高原!被誉为&世界屋脊,地
球的&第三极) 该地区处于长江,黄河,澜沧江等
主要水系的上游!水源涵养的地位十分突出!植树造
林和草场恢复建设都是目前我们所面临的最急迫的
任务) 高原上有着植树造林和草场建设所需要的广
阔土地) 然而!青藏高原位于 )#o]以南!由于海拔
高地面气温比同纬度平原地区低得多! 月份平均
气温低于同纬度 $% "#f!海拔 ) %## 0以上的高
原腹地年平均气温 # f以下!高原面上最冷月平均
气温低达 [$# [$%f!很多地区最暖月平均气温
低于 $#f*"+ ) 高海拔和高寒特殊环境极大地限制
了优良树种在青藏高原地区的引种) 然而即便在如
此恶劣的自然环境下!青藏高原依然是我国植物资
源重要的&基因库!保存了极高丰富度的生物多样
性!是全球生物多样性热点地区之一*,+ ) 由于高原
地形复杂,环境多样,冰川活动,地理位置及地史条
件等原因!青藏高原具有丰富而特殊的杨树资源)
经过系统的分类学研究!青藏高原地区杨属植物约
有 $ 个种,$% 个变种!其中多数种为高原及其邻近
地区所特有!同时由于种间杂交!还有不少的天然杂
种*)+ ) 青杨"H"G?1?%)(&*( (^6(#隶属于杨柳科"D132(
919<#杨属"H"G?1?%H+#!是青杨派杨树的主要树种!
也是我国的特有乡土树种! 是青藏高原众多杨树中
分布最广,海拔跨度最大的树种) 目前已有的研究
表明!分布在青藏高原东缘的青杨!由于高山,峡谷
等复杂的地质地貌的影响!各群体之间存在极大的
遗传分化*%+ ) 因此!开展青杨的遗传多样性研究!有
利于了解该地区植物对复杂多变生境的适应机制!
为基因资源挖掘和建立完善的种子资源评价,保护
系统提供理论依据)
近年来!随着分子标记的快速发展!尤其是第二
代微卫星标记和第三代单核苷酸多态性标记在探究
生物群体内和群体间遗传变异及种间关系和遗传育
种等研究中所凸显的优越性!使其运用的越来越广
泛) 微卫星"D20W3列和两侧相对保守的侧翼序列构成!具有数量多,分
布广且均匀,高度多态性,分析快速方便等优
点*- [&+ !已广泛用于动植物遗传多样性分析,分子遗
传育种等) 早期微卫星的分离技术主要是小片段基
因组 ]^.随机克隆技术!通过酶切构建小片段 ]^.
文库后进行测序筛选) 由于该方法耗时费力且筛选
效率较低!很难获得足够用于群体遗传结构或建立
图谱等研究所需的微卫星标记**+ ) 随后又提出利用
滤膜,磁珠等方法构建微卫星富集文库) 近年来!随
着高通量测序技术的发展及成本的降低!通过高通
量测序获得海量 /DJ"/AWI列!基于/DJ序列大量开发 DDN引物标记的方法正
越来越多的引起人们的关注!与传统方法相比!其具
有可能与基因功能相关,种间通用性强,开发周期短
等优点*$#+ ) 单核苷酸多态性"D27M3<]693<:F2E< :`3(
50:IW;2K0K! D]` #是指一物种不同个体在基因组水
平上由单个核苷酸变异引起的 ]^.序列多态性!通
常只有频率大于 $d时才被称为 D]` !频率等于或小
于 $d的变异被称为突变*$$+ ) D]` 一般只涉及碱基
的转换"JI17K2F2:7#和颠换"JI17KT核生物中最丰富的遗传变异形式!具有数量多,分布
广,双等位基因,突变率低,筛查快,易实现自动化检
测等优点*$"+ ) 目前应用于林木 D]` 开发的方法主
要有两种$一是通过对已有表达序列标签"/DJ#的
分析!发现 D]` 位点%二是对林木基因组序列的直
接测序!检测 D]` 位点) 由于直接测序较为直接,
方便!常用于分析已知 D]` 的 ]^.序列!检出率高
达 $##d!被认为是目前最可靠的一种!多数林木的
D]` 研究均采用该方法*$,+ )
青杨是我国重要的乡土树种!遗传多样性的研
究对于开发利用和保护杨树种质资源尤为重要) 因
此!本研究在 E<7:T:转录组测序,拼接组装获得大
量/DJ序列的基础上!充分挖掘青杨 DDN和 D]` 的
信息!通过对青杨 DDN特征和 D]` 特征的分析!以
&,
第 $ 期 雷淑芸等$利用高通量测序分析青藏高原地区青杨的 DDN和 D]` 特征
期为杨树 DDN标记和 D]` 标记的开发提供生物信
息学基础!为进一步研究该树种的遗传多样性奠定
基础)
$!材料与方法
9>9:样品采集及C)/#J.高通量测序$拼接组装
青杨样品 H$."9;<7"#$,$&##采自海拔 , -## 0
的青海省玉树市结古镇 ",,o##i"%+#&p]!*o#&i
)$e-p/#!样品 H"."9;<7"#$,$&,#采自海拔 " ,,&
0的青海省贵德县拉西瓦水电站",-o%i"*+-&p]!
$#$o$"i))+#$p/#) 叶片采集后迅速投入液氮中!带
回实验室后于[&#f保存) 凭证标本存于中国科学
院西北高原生物研究所青藏高原生物标本馆
"Q]U #`) 从野外采集的青杨样品 H$.,H".中各
提取 $##
!
M总 N].! ]^1K<消化 ]^.后!用带有
Y32M:"EJ#的磁珠富集真核生物 0N].%加入打断试
剂在J;以打断后的 0N].为模板合成一链 9^].!然后配
制二链合成反应体系合成二链 9^].!并使用试剂盒
纯化回收,粘性末端修复,9^].的 ,!末端加上碱基
&.并连接接头!然后进行片段大小选择!最后进行
P`N扩增%构建好的文库用 .M23<7F"$## L2:17135S和.LODF后!通过O360271Q2DDDNC72M<7<的处理主要是将获得的原始读序
"N1VI<1EK#经过滤后得到干净读序"P3<17 I<1EK#)
通过JI27F5软件拼接后*$)+ !再用JM293软件将其去冗
余和进一步拼接!然后再对这些序列进行同源转录
本聚类!得到最终的 C72M<7<) 之后将获得的 C72(
M<7<序列与蛋白数据库 ]N, DV2KK(`I:F,G/BB和
PYB进行 @31KFA比对"/m#+### #$#!取比对结果最
好的蛋白确定C72M<7<的序列方向) 若不同库之间
的比对结果有矛盾!则按 ]N,DV2KK(`I:F,G/BB和
PYB的优先级确定 C72M<7<的序列方向%若与以上
四个数据库皆比对不上的 C72M<7D917确定序列的方向) 对于能确定序列方向的C72(
M<7的C72M<7M<7<的分析是在通过第二次质控的情况下完成的!
即对I1VI<1EK进行质控"rP#!并经过滤得到 93<17
I<1EK!再用 DY.`132M7到参考序列!统计I<1EK在参考序列上的分布情况及
覆盖度!"给出质控标准#) 之后利用 DY.`K7W 软件
对 D]` 进行检测*$%+ )
9>;:CCM与CQI检测$筛选及统计分析
基于转录组的 DDN检测是以组装出来的 C72(
M<7<作为参考序列!使用 Z29I:D1F<32F<"ZOD.% ;F(
FW$bbWMI9+2W4(M1F先!对所有搜索到的包含 DDN重复单元的 C72M<7<
进行筛选!本次试验只保留前后序列均不小于 $%#
@W的C72M<7<序列) DDN搜索标准包括精确型"W><9F#及复合型"9:0W:67E#DDN重复单元*$-+ !各重复
微卫星类型重复次数设定为$两碱基"E277693<:F2E<
III:F2E93<:F2E究中还对至少重复 $" 次的单核苷酸重复类型
"0:7:7693<:F2E基于转录组的 D]` 检测!则是将个体的测序数
据与毛果杨"H"G?1?%)*")(#G(# *$+基因组数据比
对!用 DY.`K7W检测出一致性序列) 再通过一致性
序列与参考序列的比较!从而找到 D]`K) 通过短序
列比对到参考序列!以及结合每个碱基的测序质量
值!程序可以算出每个位置潜在基因型的可能性!之
后再通过贝叶斯模型!计算出潜在基因型的后验概
率值!值最高的便被推断为此位点的基因型)
"!结果与分析
;>9:与CCM相关的测序产量$质量及组装结果
近年来!随着高通量测序技术的发展及成本的
降低!通过高通量测序可获得海量 /DJ序列) 但测
序得到的 I<1EK并不都是有效的!里面含有带接头
的,重复的和测序质量很低的 I<1EK!它们对组装及
后续分析都会产生影响) 因此在数据处理过程中!
华大基因将 H$.与 H".转录组中测得的 I1VI<1EK
去除含接头的,]比例大于 %d的,低质量的 I<1EK
后!分别获得 %" *$# #" 条和 %" ),% ," 条 93<17
I<1EK!) -$ *-, $&# 个和 ) $* $&, )&# 个碱基!质
量值
%
"# 的碱基达 *d和 *-+)d!没有不确定的
碱基比!而B,P占总碱基的比例都在 )#d以上) 在
对H$.,H".I1VI<1EK进行相应处理后!我们用短
I<1EK组装软件 JI272F5!对 93<17 I<1EK进行了组装分
析!共获得H$.P:7F2M& "#, 条,C72M<7<)$ *$ 条!
其中P:7F2M总长 "# "$- #,- 7F,均长 "," 7F!C72M<7<
*,
林!业!科!学!研!究 第 "& 卷
总长 $% )"& "$- 7F,均长 ,-& 7F%H".P:7F2M$#* ,)
条,C72M<7<% &** 条!其中 P:7F2M总长 ,% %)- )*-
7F,均长 ,"% 7F!C72M<7<总长 ,, )-- *") 7F,均长 %&
7F) 从组装序列的长度分布来看!我们发现9:7F2M和
C72M<7<的数量与其片段长度大致成负相关!其中
H$.P:7F2M在 $## ,## 7F间的数量达总 P:7F2M的
&"+-)d!而 H$.C72M<7<在 $## $ ### 7F间的数
量则占到总 C72M<7<的 *%+**d) 通过对 H$.,H".
P:7F2M和C72M<7<平均长度与其]%# 的比较!可知组
装出的 C72M<7<数量,质量!与其 P:7F2M的组装数
量,质量成明显的正相关性)
;>;:与CQI相关的测序产量$质量及组装结果
由华大基因 O360271D:3H$.,H".测序!在对 I1VI<1EK进行质控,过滤后!用
DY.`132M7共比对上H$.I<1EK%" *$# #" 条!碱基) -$ *-, $&#
个!H".I<1EK%" ),% ," 条!碱基 ) $* $&, )&# 个!
它们比对到参考基因,参考基因组上的比例都是
$##d) 样品 H$.,H".比对到参考基因组上的结
果!与比对到参考基因上的结果相似"表 $#) 通过
对基因测序覆盖度的比较分析!可知 H$.在 -#d
*#d间的I<1EK数相对较高!但各覆盖度内的 I<1EK
数相差并不大) H".在 -#d $##d间的 I<1EK数
相对较高!而 &#d $##d间的 I<1EK数最多!与其
它覆盖度内的I<1EK数差异较明显)
表 9:青杨样品W9+$W;+M#.8(比对到参考基因和参考基因组上的结果分析
比对到参考基因上的I<1EK条数"d#
样品H$. 样品H".
比对到参考基因组上I<1EK条数"d#
样品H$. 样品H".
总I<1EK数 %" *$# #""$### %" ),% ,""$### %" *$# #""$### %" ),% ,""$###
总碱基数 ) -$ *-, $&#"$### ) $* $&, )&#"$### ) -$ *-, $&#"$### ) $* $&, )&#"$###
比对到参考序列上的总I<1EK数 )$ #) #*%"+-,# ,% %-, &$)",+-# ,* #"% """,+-# ,& $-# "#""+&#
完美比对上的I<1EK数 $& ") )%#",,+%*# $, &%- #$$","+-# $ "&& $&)","+-# $- #)) "%",#+-##
错配
&
%@W的I<1EK数 "" ,)* -)%")"+")# "$ # &#,")$+#&# "$ , #&&")$+#&# "" $$- ))%")"+$&#
比对到参考序列唯一位置的I<1EK数 , %)" -%-"#+*%# ," ##, %-"-+&-# ,% *# --$"-+&-# ,$ )& *,#"-#+#,#
比对到参考序列多个位置的I<1EK数 , %,$ ),*"-+-# , %-# ")"%+&*# , $$ -$$"%+&*# - -&$ *#"$"+)#
未能比对到参考序列上的I<1EK数 $$ &,- -#"""+,# $- &$ %%&""-+")# $, &&% ),#""-+")# $) ") -%"""+""#
;><:青藏高原青杨CCM及CQI特征分析
通过 D:3去除重复序列后!对青杨 H$.,H".进行 DDN分析!
共获得 ) %"$ 条 93<17 I<1EK!总长度为 ," #"- "*
@W!去除H$.与H".中的重复 DDN后!共获得 #-
条 DDN序列!复合型 DDN%"% 条!包含 DDN的序列有
% &) 条!包含有超过 $ 条 DDN的序列有 *&* 条!其
发生频率为 #+$)*!平均跨度为 ) %,$+& @W)
对高通量测序获得的 I1VI<1EK进行质控,过滤
后!用 DY.`132M7考序列上!共比对上 H$.I<1EK%" *$# #" 条!碱基
) -$ *-, $&#个!D]` $-" ,), 个!其中染色体上有
$-# $&, 个 D]` !染色体支架上有 " $-# 个 D]` !平均
跨度为 "* ,,"+, @W!K20W3量相当!分别为 &" &- 个和 * %% 个!它们的平均跨
度与它们的数量关系相一致) 共比对上 H".I<1EK
%" ),% ,"条!碱基 ) $* $&, )&#个!D]` ""* $$%个!
其中染色体上有 "") **% 个!染色体支架上有 ) $"#
个!平均跨度为 "# %*+)) @W!K20W3D]`K数量相差较大!分别为 $*" )%- 个和 ,- -%*
个!它们的平均跨度与它们的数量关系也相一致!分
别为 ") %"#+&) @W和 $"& ,$+*, @W)
;>=:青杨CCM与CQI丰度及分布密度分析
通过对青杨 DDN数据库的检测分析!发现单
核苷酸重复类型最多!占总 DDN的 ,,+*-d!以长
度 $" "$ @W为主%三核苷酸重复类型次之!占总
DDN的 ,$+##d!以长度 $% "$ @W 为主%二核苷
酸重复类型占总 DDN的 "+-*d!位居第三!以长
度 $" "# @W为主%而四核苷酸,五核苷酸,六核苷
酸重复类型的 DDN含量很少!三者总量不及总 DDN
数的 &d"图 $#) 其中二核苷酸重复类型的微卫
星有 $" 种!三核苷酸重复类型的微卫星有 -# 种!
四核苷酸重复类型的微卫星有 -# 种!五核苷酸重
复类型的微卫星有 $#& 种!六核苷酸重复类型的微
卫星有 $&$ 种)
通过对主要核苷酸重复类型的比较分析发现!在
单核苷酸重复类型中!.重复类型所占比例最高!J重
复类型次之!分别为总 DDN的 $+,,d,$%e#-d%二核
苷酸重复类型中!.B重复类型所占比例最高!B.
次之!PJ,JP则紧随其后%三核苷酸重复类型中!
#)
第 $ 期 雷淑芸等$利用高通量测序分析青藏高原地区青杨的 DDN和 D]` 特征
图 $!青杨不同核苷酸重复类型的 DDN数量
..B重复类型所占比例最高!B..次之!JJP,.B.,
B.B,P.B,JPJ,JBB等重复类型数量相近%四核苷
酸,五核苷酸,六核苷酸重复类型的数量相对较少!
不再进行进一步分析"表 "#)
通过对青杨序列不同长度重复类型微卫星长度
分布及其变异的分析!有利于我们对多态性高的
DDN标记的获得!通常来说微卫星核心序列的重复
次数越多!其变异性越高*$&+ ) 通过对青杨微卫星序
列的分析显示!其平均长度为 $-+- @W) 除单核苷
酸重复类型和六核苷酸重复类型外!其长度变化与
其对应重复类型的碱基长度成反比"图 "#)
表 ;:主要核苷酸重复类型在青杨序列中的百分比
主要的重复类型 重复碱基类型 DDN总数 占总 DDN的百分比bd
单核苷酸重复 . $ ""% $+,,
J $ #-) $%+#-
B -* #+*&
P )" #+%*
二核苷酸重复 .B ))& -+,)
B. )#- %+%
PJ ,,% )+)
JP ,$* )+%$
.J $)* "+$$
J. $"* $+&,
.P %, #+%
其它 $$& $+-
三核苷酸重复 ..B $# $+%$
B.. $## $+)"
JJP *$ $+"*
.B. && $+"%
B.B & $+",
P.B &- $+""
JPJ $+#*
JBB $ $+##
BPJ -* #+*&
BB. -* #+*&
JBP -% #+*"
.BP -, #+&*
BBJ -$ #+&-
B.J %, #+%
BP. %, #+%
其它 $ #%$ $)+&
注$每一扇形区对应不同长度微卫星所占百分比!括号内为其对应的微卫星长度)
图 "!青杨序列不同长度重复类型微卫星长度分布及其变异
$)
林!业!科!学!研!究 第 "& 卷
对青杨 D]` 类型的分析发现!H$.中转换类型占
-$+#-d"%# %%$ 个#!颠换类型占 ,&+*)d"," ",%
个#!H".中转换类型占 -$+"d"$$ *")个#!颠换类
型占 ,&+,d") %,"个#) 其中转换类型明显高于颠
换类型!H$.和 H".中转换类型分别达到 -$+#-d,
-$+"d) 在H$.,H".转换类型中!P[J发生频率最
高!分别为,#+%d,,#+--d!这可能与 D]`K在PB序
列上出现的最为频繁!而P"胞嘧啶#常以甲基化形式
存在!脱氨后即成为 J"胸腺嘧啶#有关*$$+ ) 青杨两
个样品H$.和H".中 D]`K类型及其发生频率的变
化趋势基本一致!H".与H$.中相对应的同一 D]`K
类型的数量之比约为 "$$"表 ,#)
表 <:高通量测序鉴定的青杨CQI(类型分析
样品
D]` 类型 数量 平均跨度b@W
转换
D]` 类型 数量 平均跨度b@W
颠换
H$. .m[nB "% #*$ $&* &+# .m[nJ $# ,*& )% *-*+$
Pm[nJ "% )-# $& #,+#% Bm[nJ & ##% %*) &,+-
[ [ [ Pm[nB % &,, &$- ,&,+"
[ [ [ .m[nP *** %*% ,$*+&
总数 %# %%$"-$+#-d# 总数 ," ",%",&+*)d#
H". .m[nB %& *"$ &# #*,+)# .m[nJ ", &# $* #,+%
Pm[nJ %* ##, * *&"+#* Bm[nJ $& -% "%" *))+)
[ [ [ Pm[nB $, %), ,)& )%*+"
[ [ [ .m[nP $& )-" "%% -$-
总数 $$ *")"-$+"d# 总数 ) %,"",&+,d#
,!讨论
D:3生频率为 #+$)*!平均跨度为 ) %,$+& @W!明显高于
毛白杨"H"G?1?%&"@$6&"%(#基因组中 DDN的平均跨
度"$ &&, @W# *$-+ ) 这可能由 DDN搜索标准,数据库
大小及物种等因素所致) 植物的 DDN多以二,三核
苷酸重复类型为主!而占优势的重复类型则在各植
物中不尽相同*$* ["$+ ) 除单核苷酸重复 类 型
",,e*-d#外!青杨 DDN中同样以三核苷酸重复类
型",$+##d#和二核苷酸重复类型""+-*d#为主)
在青杨二核苷酸重复类型中!.B重复类型所占比例
最大"-+,)d#!这与油茶,花旗松等的 DDN序列报
道一致*"" [",+ ) 三核苷酸重复类型的优势分布密度
因种而存在较大差异!在本研究中!三核苷酸重复类
型..B所占比例最多!B..次之!JJP,.B.,B.B
等相近!与大豆相似*")+ )
青杨H$.,H".D]` 进行分析!发现 H$.中含
D]` $-" ,), 个!平均跨度 "* ,,"+,@W) H".中含
D]` ""* $$% 个!平均跨度 "# %*+)) @W!与模式植
物毛果杨基因组中 D]` 的发生频率存在较大差异
""+-b$ ### @W#!比人类 "9"@"%(G2$6%! $b$ *##
@W#,大豆";1^)26$@(Y!$b"## @W#,水稻"J#^C( %(&20
_(!$b"-& @W#,拟南芥",#(72F"G%2%&*(12(6(!$b, ,##
@W#等的分布密度都低!这可能与物种,测序数量,
D]` 分布的不均一性等有关*"% ["-+ ) 青杨 D]` 类型
中转换类型明显高于颠换类型!H$.和 H".中转换
类型分别达到 -$+#-d,-$+"d) 这是由于 ]^.序
列中包含大量PWB位点!而PWB位点的胞核嘧啶极
易通过脱氨和甲基化转化为胸腺嘧啶!其中该位点
基因的转换频率为非 PWB位点的 $) $% 倍!颠换
频率为其它位点的 , ) 倍!二者之比约为 "$$*"+ )
作为第三代分子标记!D]` 通常是二等位基因!主要
以非连续性的方式显示!其能提供的信息量少于
DDN标记!但其有许多不同于其它分子标记的优点!
如其高密度和稳定遗传的特性弥补了信息量的不
足!高效快捷*"&+ ) D]`K的缺失率要明显的低于
DDNK!约低于 DDN的四倍!表明 D]` 标记比 DDN标
记更可靠!但其高昂的成本使其应用范围受限)
Q10@327等在对玉米进行近亲交配时!发现 DDNK在
聚类种质中的表现比 D]`K好!因此他们认为当 D]`
位点的数量足够大时可以代替 DDNK来研究遗传多
样性和亲缘关系*"* [,#+ )
综上所述!我们在 D:3基础上!充分挖掘青杨 DDN,D]` 信息!对青杨微卫
星重复序列特征和单核苷酸多态性特征进行的分析
表明!在遗传多样性研究中 D]` 标记比 DDN标记更
为可靠!为今后杨属植物 DDN,D]` 标记的开发及在
遗传多样性研究等方面的应用奠定基础!并为在其
他物种中进行相关分子标记的有效开发提供了宝贵
")
第 $ 期 雷淑芸等$利用高通量测序分析青藏高原地区青杨的 DDN和 D]` 特征
的经验和理论指导)
参考文献!
*$+ 张镱锂! 李炳元! 郑!度+论青藏高原范围与面积*k++地理研
究! "##"!$$ $ [&+
*"+ 莫申国! 张百平! 程维明! 等+青藏高原的主要环境效应*k++
地理科学进展! "##)! "$ && [*-+
*,+ Z5;:FKW:FK>:I9:7K&%, [&+
*)+ ?17Mj?! j;1:D !^ D4T:IFK:T.G+O7$U6 ja!N1T<7 `Q?3:I1:>P;271")#*Z++L<2=27M$ D92<79<` IK:6I2L:F172913B1IE<7 I`*%+ H6 j! U17Ma! <`7Ma! $&(1+B<7H"G?1?%)(&*( 0^
(6( N<;E W:W631F2:7K27 K:6F;V*-+ UI2M;FkZ! L<7FS<7 +`Z29I:K1F<32F:IF;<>6(
F6I2K;(
*+ j17:I029I:K1F<32F<2K:(
31F2:7$ 1I*&+ D9;I<5.U! Q<2KF/k+Z29I:K1F<32F<17135K2K:>W:W631F2:7 KFI69(
F6I<27 F;27 014:"4%?#?%"Y^#26)*?%#*k++P171E217 k:6I713
:>?2K;**+ N1KK0177 G! D9;3vFK20W3<[K3:92>:I6K<27 W:35027M*k++/3<9FI:W;:I*$#+ D6@I1017217 D! Z2K;I1NG! D27M; H+B<7:0<(V2E<17135K2K:>
029I:K1F<32FKW<92>29M<7:029I*$$+ LI::4D]`K*k++B<7[$&-+
*$"+ H$-"$#$ $- [$&+
*$,+ 褚延广! 苏晓华+单核苷酸多态性在林木中的研究进展*k++
遗传! "##&"$##$ $"" [$"&+
*$)+ BI1@;F:0<1KK<0@35>I:0N].(D]1FL2:F<9;! "#$$! "*"#$ -)) [-%"+
*$%+ H2N! H2a! ?17M_! $&(1+D]` E:I01KK2T<35W1I13<3
V;:3<(M<7:0$$") [$$,"+
*$-+ H2D! a27 J+Z1W 17E 17135K2K:>029I:K1F<32F
H"G?1?%$ F;<>2IKFK<
D92! "##! %#"%#$ -*# [*+
*$+ J6K417 B.! 2^>1S2:D!k17KK:7 D!$&(1+J;@3194 9:F(
F:7V::E! H"G?1?%)*")(#G( "J:I+R BI15# *k++D92<79"##-! ,$,"%*,#$ $%*- [$-#)+
*$&+ UI2M;Fk!L<7FS<7 !` Z29I:K1F<32F:IF;<>6F6I<
*Z+bbP1IT13;1B! 2`F9;]*$*+ J6K417 B.!B67F02(
9I:K1F<32FH"G?1?%)*")(#G(
*k++P171E217 k:6I713:>?:I[*,+
*"#+ G60W1F31D !` Z64;:W1E;515D+Z2727M17E K6IT<5:>K20W3X6<79E29:F53*k++B<7:0*"$+ \1IK;7<5NG! J;2<3J! DF<27 ]! $&(1+O7 K2329:17135K2K:7 >I<(
X6<79517E E2KFI2@6F2:7 :>029I:K1F<32FK:0<9KW<92*""+ .01I1K27M;<\! P1I3K:7 k/+J;029I:K1F<32F<
]^.01I4:IM<72I*k++P171E217 k:6I(
713:>?:I*",+ 温!强! 徐林初! 江香梅!等+基于 )%) 测序的油茶 ]^.序列
微卫星观察与分析*k++林业科学! "#$,"#&#$ ), [%#+
*")+ B1:H! J17Mk! H2Q! $&(1+.7135K2K:>029I:K1F<32F9I:WK1KKZ:3<9631ILI<*"%+ 吴!玲! 付凤玲! 李晚忱!等+利用生物信息学方法进行基于表
达序列标签的玉米单核苷酸多态性标记的开发*k++核农学报!
"#$#"#%#$ *-& [*" h$#$*+
*"-+ 赵春霞! 石先哲! 吕!申!等+人类基因组的单核苷酸多态性及
其研究进展*k++色谱! "##,"#"#$ $$# [$$)+
*"+ B1IMG! BI<<7 !` ]294291F2:7 :>917E2E1F<9:E(
27MIK27M1KK<0@3"$$#$ $#& [*"+
*"&+ ]217=67 H!H217MP! D;617MU!$&(1+P:0W1I2K:7 :>K27M3<(7693<(
:F2EW:W631F2:7
KFI69F6I<*k++LZPB<7*"*+ D2029^ !H7135K2K17E 01WW27M:>1012S)$",#$ ", [")-+
*,#+ k:7
K20W3F<9;7:3:M2:IF;012S<" j<1015KH+#
*k++J;<:I[,$+
,)