显微镜专业生产商,上光仪器有限公司(原上海光学仪器厂)

全国统一服务热线 :

技术支持

系统进化树的构建及编辑

      技术支持

系统发育树的构建及其后期编辑
又到了研究生写毕业论文的时候了,这几天两个师妹相继让我教他们构建系统发育树。索性就做一个图文的帖子,方便大家。纯技术贴,不涉及建树序列的选择、系统发育树如何看等理论性问题。要问的话,送一句话,自己多找几篇文章看看人家怎么分析系统发育树的。
1) FASTA 格式序列文本
FASTA是Zui为常用的序列格式,几乎所有序列分析软件都能识别这种格式的序列。构树之前先将所选的序列都粘贴在一个txt文本文件中,然后每条序列以 >开头,后面可以接序列描述性语言,比如属名,种名等。然后换行粘贴序列,序列的Zui后用空格结束,这就是一个FASTA格式的序列了。需要注意的一点是每条序列的名字的前10个字符不要完全相同。为了方便起见,Zui好将此文件放在桌面上。编辑后的序列见下图:
97fe7d1b24a54188dbb979bde270fc5c.png
2) Clustal X进行多序列比对
下载此软件,解压之后直接用。解压图如下:
a06150ca4c0e3d3db0121f6eeb01ee49.png
点击第一行Zui后一个图标,然后点击file,load sequence,选择正确路径。加载进来的序列如下图:
2fac8d1e586bd7d727455b0e53083dfb.png
点击比对,进行完全比对。这时会弹出一个对话框,如下:
5fa05aafa0182b4a8d100e67b7282611.png
这时将路径改为桌面,点击对齐进行全序列比对,序列较多的话可能需要点时间。比对后的结果如下图 (注意区别):
84ffa66834feabd108655353be2064cb.png
然后注意桌面上多了两个文件,一个是dnd格式的,一个是aln格式的。Aln格式的文件将用来进行后续工作。关掉clustalX窗口即可。
3) aln 格式转化为MEG格式
打开MEGA4.0,点击file,convert to MEGA format,出现如下对话框:
28bc1e52f88b31485ec7491c29cfe511.png
选择路径,将aln格式文档加载进来,点击OK,出现下图:
0806cc5a8ec48bb84ee2e59c246fd35b.png
点击保存,会发现在桌面上又多了一个文档,看其属性会发现是MEG格式的,OK。
4) MEG文档的激活
关掉这些窗口,回到MEGA刚打开时的样子,将刚生成的那个MEG文档用拖拽的方式拖进MEGA4.0,这时会出现如下对话框:
a406c7c635effba1b87c9446d26945c5.png
废话一句:核酸序列比对选核酸序列,氨基酸序列比对选氨基酸序列。点击OK,出现如下:
1352ef41aa73838107fb86ef47d3c39a.png
关掉这个界面,此时该MEG文档已被激活,处于待用状态,如下 (可以和MEGA初始界面做下对比):
de481ea6f224b64c3a45da3600201ce2.png
5) 开始建树(NJ tree)
原理不讲了,此处以构建NJ树为例。点击工具栏上的phylogeny,construct phylogeny,neighbor joining (NJ).出现如下界面(注意几个绿颜色的小方块):
bdaa008a0f650990a590cc59a5e63f8e.png
点击第一个小绿方块,选择,小绿方块会变成四个点的省略号,再点击出现如下页面:
997f92f957f8000a5cf3269499747078.png
选择Bootstrap,后面的replication改为1000,点击对勾。然后点击第三个小绿方块,这个时候对于蛋白质序列以及DNA序列,两者模型的选择是不同的。对于蛋白质的序列,多选择Poisson Correction (泊松修正)这一模型。而对于核酸序列,多选择Kimura 2-parameter (Kimura-2参数) 模型。所有设置完毕之后,点击compute,雏形的树就出来了:
d0545d533a28f848eff9d3720ccff4d1.png
可以对此树做出一些修改,比如线条粗细,树的形状等等,此处自己多试试。
6)树的修饰
建好树之后,往往需要对树做一些美化。这个工作完全可以在word中完成,达到发表文章的要求。点击image,copy to clipboard。新建一个word文档,选择粘贴。见下图:
f4ab1a0770792bee793213d5a72b9e4d.png
在图上点击右键,就可以对文字的字体大小,倾斜等做出修饰。见下图:
4aadb120c015e5a3ec193138873af81f.png
这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:
ec6cddcaf4fe4bdaf3e33bbe5071fca4.png
将打印出来的PDF保存在桌面上,打开,如下图:
ab6468bbebe7268d374b8de64c5c30e7.png
此时,点击 工具,高级编辑工具,裁剪工具,如下图所示:
2e3724207ac1617578e89a0d4834fa0a.png
选择需要的区域以删除周围的空白区,双击发育树,会出现下图:
62388a544f11392badf0fd4a0726e6fb.png
点击确定,出现下图 (把空边切掉了):
1b7d11c236bac7d5ba68911d7f1832ea.png
点击文件,另存为,在保存类型一栏中选择 TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:
1524a236adc732c632047eda85b89de8.png
OK,结束了,自己玩一把吧。

 

 

好像有点小遗漏,对齐后的序列要把两端截成一样齐的,你的那个对齐的aln文件,前面有的长有的短,你好像没有写要把首尾截成一样长……
建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序等……:D:D

 

 

没有一定要把首尾截成一样长这样一说的,呵呵。MEGA里面是可以做一些修改,但是我一直都不知道怎么在里面添加 alpha、beta等希腊字母:D

 

NJ树是采用距离罚分的吧,如果没有一样长的话,不是无形之中就加大了两个树之间的距离了吗?我觉得还是应该截一下吧。。

 

我刚才测试了一下,好像是可以加入一些希腊字母的,不过好像是字体的差异,字体改行不好,呵呵,不过,我一般是用MEGA来改一些Line的Width和颜色,再在画图板里面改,个人爱好呵呵!


道理是这样的,NJ树多用于相似性较大的序列构建进化树。相似性较差的用NJ法不是很好,会增加长枝吸引。
这个并非本贴所要讨论的,要讨论估计又可以码一个帖子了。
线条粗细我也是在MEGA中调的,线条颜色没改动过,字体我都是在word中完成的。一篇文章中还画了椭圆,也是在word中实现的。


这个并非本贴所要讨论的,要讨论估计又可以码一个帖子了。
线条粗细我也是在MEGA中调的,线条颜 ...

我们建系统树都是截断首尾的,呵呵

 

正在画树,很实用!!

 

楼主会做对应分析不(correspondence analysis)

 


建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序 ...

这才像做个进化树的人,做进化树,选择的序列也需模式菌种,才有说服力


恩,是这样的。
此贴纯技术贴,不讨论其他。。

 

谢谢分享,我一直想总结,就是没动手。

 

感谢楼主这么多的分享啊,正要用呢

 

讲解的很清楚,谢谢,不用发愁了,呵呵,真是感谢

我也会,就是不能很好的应用 这我上课还给大家讲过呢

 

那个序列比对也可以在emga中进行的,这样就可以不用那个clustal X。


我还没有用过mega做过序列比对呢,试试看。

 

很好,很强大,有天我也能发这么个帖子帮人就美好了

太感谢你了,所有想要学习的东东都有了。。。

 

弱弱出个声儿,mega4.0中不是嵌合了Clustal了么,为什么我们还要下载一个ClustalX呢?

 

 

我没有用过mega中的clustal 哦,呵呵。

 

怎么网页上面的图全挂了呀?一直都想学怎么建树,在网上也找了很多资料看,Zui终还是以失败告终,今天看到lz的帖子很是不错,顶了,可美中不足的是图挂了,所以可否请lz把上面的发给我。。。不胜感激

 

虽然自己会这样做,但还是谢谢你的清晰讲解!

 

太麻烦了。

有更简单的方法出现?介绍下啊

 

直接采用mega 5来做就好了。
导入序列,比对,通过选择NJ算法就直接出结果了。

 

这个要顶。可以自力更生了

这个图文并茂的教程早点出现就好了,摸瞎了很久。有几个问题想请教,师兄用的是mega4.0对吧?mega4.0已然嵌有aglin by clustalW,为什么您还要用ClustalX呢?二者有clustal的结果什么区别吗?
另外,如果序列长短不一,可能存在长枝吸引,是不是应该处理下序列(把它们首尾截齐)?师兄可否对这方面进行下补充呢?

嘶。。。继续小白,您这个教程里clustaiX的作用是什么呢?

呵呵,做序列比对的。我没有用过MEGA中的内嵌clustal,因为大多时候我需要导出序列比对的图来说明保守域。
首尾截断我在前面已经提过了,不是必须的。

 

有一点不明白的,希望楼主能解答:第5步构建NJ树中第三个图里面有original tree和bootstrap consensus tree,到底选哪个比较好呢?谢谢