時間:2019-09-20 11:49:57 作者:無名 瀏覽量:63
今天小編就為大家帶來基礎工具Clustalx的使用方法。CLUSTALX-是CLUSTAL多重序列比對程序的Windows版本。
Clustal是一種利用漸近法(progressive alignment)進行多條序列比對的軟件。即先將多個序列兩兩比較構建距離矩陣,反應序列之間兩兩關系;然后根據距離矩陣計算產生系統進化指導樹;然后從多條序列中最相似(距離近期)的兩條序列開始比對,按照各個序列在引導樹上的位置,由近及遠的逐步引入其它序列重新構建比對,直到所有序列都被加入形成最終的比對結果為止(Figure 1)。

clustal 算法:
Clustal軟件有兩個版本,其中clustalw采用命令行的形式在DOS/Linux下運行的, Clustalx是可視化界面的程序,可在window電腦運行,我們今天學習Clustalx的使用。
1 安裝clustalx:
下載clustalx軟件,按照默認安裝到自己的電腦上。
2 準備要比對的序列:
將上節課搜索到的同源核酸fasta文件,全部粘貼到一個文本文件中,所有的蛋白質序列存入另一個文本文件。

基礎工具Clustalx的使用方法圖二
3 載入序列:
點擊開始-程序-clustalX2-clustalX2。
點主菜單File,選擇Load Sequence-選擇剛保存的序列文件,點打開。
注意:ClustalX程序無法識別漢字、帶空位的文件夾名,如my document。
載入序列后在左側窗口里是fasta格式序列的標識號,取自序列第一行“>”后的字符。
4 比對參數的設置:
比對前先要設置兩條序列比對的參數和多條序列比對的參數。
a.兩條序列比對的參數
點擊Alilgnment菜單,選擇Alignment Parameters,再選擇Pairwise Alignment Parameters,如Figure 3,首先可以選擇比對的效果,是slow/accurate 還是fast/approximate。第一種模式采用的是動態規劃算法進行比對的,第二種模式采用的是啟發式的算法。除非序列非常長,一般采用第一種模式。可以選擇空位罰分系統,DNA或蛋白質替換矩陣,也可以自己上傳某個替換矩陣進行比對。
b.多條序列比對參數
點擊Alilgnment菜單,選擇Alignment Parameters,再選擇Multiple Alignment Parameters,如Figure4.
Delay divergent sequence是指當兩條序列的差異大于某個值(百分比)時,這兩條序列的比對將推遲進行,程序先比對相似序列,對于相似度不夠高的序列,晚些時候進行比對,加入到最終的多條序列比對結果時也要遲些。DNA transition Weight等于0的時候,程序將轉換當作錯配(mismatch)看待,等于1的時候,將轉換和匹配同等看待。當參與比對的序列差異較大時,DNA transition Weight應該選擇的小些(接近0),如果參與比對的序列差異較小時,DNA transition Weight可選擇的大些(接近1)。

基礎工具Clustalx的使用方法圖三
5 設置輸出格式:
點擊Alignment菜單,選擇Output Format Options,頁面如Figure 5。
默認的是輸出clustal format,如果需要其它格式,可在復選框里打勾。如PHYLIP格式是利用PHYLIP軟件進行建樹時,需要輸入的格式
6 進行比對:
點擊Alignment菜單,選擇Do Complete Alignment.此時出現一個對話框,提示比對結果保存的位置,上一步選擇了多少種輸出格式,這里就需要給出多少個文件的路徑。選擇好了點OK即可。