免费文献传递   相关文献

AN INTRODUCTION TO THE METHOD AND PROGRAM FOR REL ATIVE-RATE TEST

相对速率检验方法与实用程序



全 文 :武汉植物学研究 1999, 17 (4) : 353~ 356
J ourna l of W uhan B otan ica l Resea rch
相对速率检验方法与实用程序Ξ
唐先华 黄德世 张晓艳 钟 扬
(中国科学院武汉植物研究所 武汉 430074)
杨 继
(北京大学生命科学学院 北京 100871)
提 要 相对速率检验是检验分子钟假设正确与否的一种有效工具。本文简要介绍了该方
法的基本原理, 提出了一个新的序列差异计算矩阵, 并应用V isual Basic 语言编制了一个相
对速率检验程序。
关键词 相对速率检验, 分子进化, 计算机程序
相对速率检验 ( rela t ive2ra te test) 是一种统计检验方法, 用于检测分子系统树中不同分枝上核苷酸
置换速率的差异显著性。该方法是检验分子钟 (mo lecu lar clock)假设正确与否的有效工具〔1~ 5〕。
目前, 相对速率检验方法仍在发展之中, 尚缺乏通用计算程序。本文提出了一个新的序列差异计算
矩阵, 并应用V isual Basic 语言初步编制了一个实用程序。该程序既可用于检验核苷酸序列对间总置换
速率差异, 亦可与其他软件包配合运用来检验转换ö颠换置换 ( transit ionöt ransversion substitu t ion) , 以
及蛋白质编码序列同义ö非同义置换 ( synonymousönonsynonymous substitu t ion)速率的差异显著性。
1 相对速率检验的基本原理
在图 1 所示的分子系统树中, 设A、B 为比较类群, O 为参照类群, X 为A 与B 的共同祖先, T 1 为A
与B 的分歧时间 (divergence tim e) , T 0 为O 与X 的分歧时间。在分子钟假设下, 核苷酸置换速率 r 应当
是恒定的。因而, 分歧时间可以用以下公式计算:
T 1= KAB ö2r,
T 0= (KOB + KOA ) ö4r。
这里, KAB为A 与B 间的分歧度 (KAB = KBA , 下同) , KOB和 KOA 分别为O 与B 间和O 与A 间的分歧
度。
图 1 比较类群 (A , B)、参照类群 (O )和分歧时间 (T0, T1)
F ig11 T axa to be compared (A , B) , reference taxon (O ) ,
and divergence tim es (T 0, T 1)
根据图 1 所示系统树的拓扑结构可得:
KOA = KOX+ KXA ,Ξ 收稿日: 1998211220, 修回日: 1998212203。第一作者: 女, 1970 年 4 月出生, 硕士, 现为中国地质大学 (武汉)博士研究生。中国科学院人事教育局留学回国工作择优基金资助项目。
KOB = KOX+ KXB ,
KAB = KAX+ KXB。
故有:
KAX= (KOA - KOX+ KAB - KBX) ö2= (KOA + KAB - KOB ) ö2,
KBX= (KBO - KXO + KAB - KAX) ö2= (KBO + KAB - KOA ) ö2。
在分子钟假设下, KAO与 KBO应当相等, 即设统计量 ∃= KAO - KBO时, 有∃= 0 具分子钟
a (a≠0) 无分子钟,
采用 t 检验来检验 ∃= 0 的显著性。统计假设H o: ∃= 0; 对H A : ∃≠0。方差用以下公式计算〔6〕,
V ar (∃ ) = V ar (KAO ) + V ar (KBO ) - 2Cov (KAO , KBO )。
这里, Cov (KAO , KBO ) 为 KAO和 KBO的协方差。假设 KAX和 KBX是相互独立的, 可得:
Cov (KAO , KBO ) = V ar (KOX)。
若用 Jukes2Canto r 的核苷酸置换模型〔7〕, 可以估计出〔4〕:
KXO = - 3ö4 ln (1- 4ö3pOX)。
这里 pOX为O 和X 间的观测概率 (频率)。计算概率 POX为:
POX= 3ö4〔1- exp (- 4ö3 KXO )〕,
V ar (KXO ) = POX (1- POX) ö〔L (1- POXö0. 75) 2〕。
这里, L 为序列长度。其它方差值可类推。
2 核苷酸序列差异计算矩阵
在上述公式中, 观测概率 p≈N öL , 其中N 为序列间的核苷酸差异绝对值, L 为序列长度 (通常应大
于 1 000 bp )。然而, 大多数计算程序中只比较A、G、C、T 这 4 种常规编码间的差异, 而将其他编码作为
不可比较数据。因而, 计算获得的N 值可能偏小, 容易丢失信息。
根据 IU PA C2IUB 编码的定义〔8〕, 我们提出了 1 个新的序列差异计算矩阵 (对称矩阵, 见表 1)。例
如, 在 2 个序列的某一相同位点的编码分别为 R (A 或 G) 与 S (C 或 G) , 则 2 个序列在该位点的差异绝
对值记为 2ö3, 余类推。对 2 个序列的所有可比较位点上的差异绝对值求和 (除间隔和缺失数据外) , 即为
序列间的差异N 。
表 1 两个序列在某一位点上的差异计算矩阵
T able 1  A m atrix fo r computing N value (at site i) betw een tw o sequences
(T he let ters are co rresponding to the IU PA C2IUB Code)
A G C T Y R W S K M B D H V X (?)
A 0
G 1 0
C 1 1 0
T 1 1 1 0
Y 1 1 1ö2 1ö2 1ö2
R 1ö2 1ö2 1 1 1 1ö2
W 1ö2 1 1 1ö2 3ö4 3ö4 1ö2
S 1 1ö2 1ö2 1 3ö4 3ö4 1 1ö2
K 1 1ö2 1 1ö2 3ö4 3ö4 3ö4 3ö4 1ö2
M 1ö2 1 1ö2 1 3ö4 3ö4 3ö4 3ö4 1 1ö2
B 1 2ö3 2ö3 2ö3 2ö3 5ö6 5ö6 2ö3 2ö3 5ö6 2ö3
D 2ö3 2ö3 1 2ö3 5ö6 2ö3 2ö3 5ö6 2ö3 5ö6 7ö9 2ö3
H 2ö3 1 2ö3 2ö3 2ö3 5ö6 2ö3 5ö6 5ö6 2ö3 7ö9 7ö9 2ö3
V 2ö3 2ö3 2ö3 1 5ö6 2ö3 5ö6 2ö3 5ö6 2ö3 7ö9 7ö9 7ö9 2ö3
X (?) 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4 3ö4
453 武 汉 植 物 学 研 究               第 17 卷  
3 程序设计与初步实现
根据上述原理和方法, 我们利用V isual Basic 5. 0 (中文版) 编程工具, 编制了 1 个相对速率检验程
序。该程序适用于中文W indow s 3. x 、W indow s 95 或W indow s 98 操作系统。程序菜单包括以下 4 个
部分。
311 数据输入与输出
(1) 数据文件选定: 用户自行选定原始数据的文件名, 程序可检验数据文件中序列的数目以及各序
列的长度是否与指定数一致;
(2)类群选定: 用户自行选择比较类群 (A ,B )及参照类群 (O ) ;
(3)打印输出: 将计算结果以表格形式输出;
(4)保存: 将计算过程存入指定文件;
(5)退出: 程序结束。
3. 2 K 值计算
(1)用户自行选择常规方法或新方法 (表 1) , 计算N AB、N AO、N BO ;
(2)计算 KAB、KAO、KBO、KXO以及 ∃。
3. 3  t-检验
(1)计算概率 PAO、PBO及 P XO;
(2)计算方差V ar (KAO )、V ar (KBO )、V ar (KXO )及V ar (∃) ;
(3)计算标准误差 SE;
(4)计算 ∃öSE。
3. 4 帮助
包括程序使用方法、计算步骤说明和示例等。
4 若干应用
(1) 应用 PH YL IP 软件包中的简约法和邻接法程序〔9〕, 根据自行测定的 7 种睡莲类植物和从 Gen2
Bank 获得的 14 种睡莲类植物的 IT S 序列, 构建了分子系统树; 应用上述方法与程序检验了序列间核苷
酸总置换速率的差异显著性; 采用M EGA 软件包〔10〕分别计算出转换ö颠换置换的差异值, 然后检验两
种情况下序列间核苷酸置换速率的差异显著性〔11〕。
(2) 应用简约法和邻接法对 7 种睡莲类植物的 rbcL 序列和 6 个种的 18S rRNA 序列分别构建了分
子系统树; 应用M EGA 软件包和相对速率检验程序分别检验了序列间总置换速率、转换ö颠换置换以及
蛋白质编码序列同义ö非同义置换速率的差异显著性〔11〕。
(3) 施苏华等测定了中国红树科 9 种植物的 IT S 序列和m atK 基因序列, 并应用 PAU P 软件包构
建了分子系统树; 我们应用相对速率检验程序检验了 IT S 序列和m atK 序列间的总置换速率以及m atK
序列的同义ö非同义置换速率的差异显著性1)。 α
存放上述程序和资料的WWW 网址为: h t tp: ööwww. m su. eduöuserözhangx i3öp rogram. h tm l, 欢迎
免费下载。我们还将根据分子进化与系统学研究的实际需要, 将该程序扩展到 3 个以上类群的情形〔3〕,
并进一步建立良好的用户界面, 如可供用户选择的多种输出表格等。
553 第 4 期            唐先华等: 相对速率检验方法与实用程序
α 1) Sh i S, Zhong Y, H uang Y et a l. M o lecu lar phylogeny and evo lu tion of the Rh izopho raceae in Ch ina. T he P ro2
ceeding of In ternational Sympo sium on Geo2 Environm ental Changes and B iodiversity in N o rtheast A sian Re2
gion. Seou l, Ko rea. 1998.
参 考 文 献
1 Sarich V M ,W ilson A C. Generation tim e and genom ic evo lu tion in p rim ates. S cience, 1973, 179: 1 144~ 1 147
2 W u C I, L iW H. Evidence fo r h igher rates of nucleo tide substitu tion in roden ts than in m an. P roc N a tl A cad S ci
U SA , 1985, 82: 1 741~ 1 745
3 L i P, Bousquet J. Relative2rate test fo r nucleo tide substitu tion betw een two lineages. M ol B iol E vol, 1992, 9:
1 185~ 1 189
4 L iW H. M o lecu lar Evo lu tion. Sunderland: Sinauer A ssociates, 1997.
5 钟扬, 唐先华, 黄德世等. 分支分析: 分子系统树的构建与检验. 见: 杨群等主编. 分子古生物学: 概念、方法和应用.
北京: 科学出版社 (印刷中) , 1999.
6 N eiM , Stephens J C, Saitou N. M o thods fo r computing the standard erro rs of b ranch ing po in ts in an evo lu tionary
tree and their app lication to mo lecu lar data from hum ans and apes. M ol B iol E vol, 1985, 2: 66~ 85
7 Jukes T H , Can to r C R. Evo lu tion of p ro tein mo lecu les. In:M unro H N ed. M amm alian P ro tein M etabo lism. N ew
Yo rk: A cadem ic P ress, 1969. 21~ 123
8  IU PA C2IUB Comm ission on B iochem ical N om enclatu re. A one2let ter no tation fo r am ino acid sequences ten tative
ru les. J B iol Chem , 1968, 243: 3 557~ 3 559
9 Felsen tein J. PH YL IP (Phylogeny Inference Package) version 3. 572c. Seatt le: D epartm en t of Genetics, U n iversity
of W ash ington, 1996.
10 Kum ar S, T am ura K, N eiM. M EGA : mo lecu lar evo lu tionary genetics analysis version 1. 02. U niversity Park: T he
Pennsylvan ia State U niversity, 1993
11 唐先华. 睡莲类植物的 rDNA IT S 序列分析及分子系统发育与进化研究:〔中国科学院武汉植物研究所硕士学位
论文〕. 武汉: 中国科学院武汉植物研究所, 1998.
AN INTROD UCTION TO THE M ETHOD AND
PROGRAM FOR RELATIVE-RATE TEST
T ang X ianhua H uang D esh i Zhang X iaoyan Zhong Yang
(W uhan Institu te of B otany , T he Ch inese A cad emy of S ciences W uhan 430074)
Yang J i
(Colleg e of L if e S ciences, P ek ing U n iversity Beijing 100871)
Abstract  In the p resen t paper, the basic p rincip le of rela t ive2ra te test w as in troduced briefly. A new
m ethod fo r computing N values (differences of nucleo tides) betw een tw o sequences based on the IU 2
PA C2IUB Code w as p ropo sed, and a V isual2Basic p rogram w as developed fo r the rela t ive2ra te test.
Key words R elative2ra te test,M o lecu lar evo lu tion, Computer p rogram
653 武 汉 植 物 学 研 究               第 17 卷