Geneious
Geneiousステップ・バイ・ステップガイド

Geneiousステップ・バイ・ステップガイドの「シークエンスアラインメントの作成」より抜粋しています。
  

シークエンスアラインメントの作成

このチュートリアルでは、後天性免疫不全症候群(AIDS)の原因であるヒト免疫不全ウイルス(HIV)と類人猿の免疫不全ウイルス(SIV)の配列アライメントを作成していきます。

1.データの準備

本チュートリアルで利用する配列は以下の通りです。

  • アフリカの霊長類由来 SIV の env 配列
  • 飼育下の非アフリカ種(アカゲザル、スタンプオマキザル、ブタオマキザル)に感染した SIV 由来の env 配列
  •  HIV-1、HIV-2 由来の env 配列

env 遺伝子は全てのレトロウイルスに存在し、ウイルスの表面に位置し、宿主の細胞表面の受容体と相互作用するウイルスエンベロープ糖タンパク質をコードしている遺伝子です。

データを以下よりダウンロードしてください。

HIV sequences.geneious

Geneious_シークエンスアラインメント_データの準備

HIV_sequences の中身は、以下のフォーマットで表示されます。

ウイルスの種類・SIVの場合は霊長類の種名・HIV-1とHIV-2の場合はグループ名とサブタイプ・アクセッション番号

例1:HIV-1; B; K03455( HIV-1 のグループ M・サブタイプ B の env 配列)

例2:SIV-SMM; Sooty mangabey; AF334679(スーチーマンガビー由来の SIV の env 配列)

2. 配列アライメントの作成

それでは、全62配列をアラインしていきます。上部メニューの Align/Assemble から Multiple Align へと進みます。

Geneious_シークエンスアラインメント_配列アライメントの作成

Geneious には以下の3種類のアラインメントプログラムが用意されています。

  • Geneious aligner
  • MUSCLE
  • Clustal Omega)

さらに、MAFFT aligner のプラグインも用意されています。これらのアライナーの詳細については、Biomatters社が提供するKnowledge BaseWhich multiple alignment algorithm should I use?をご覧ください。

比較する env 遺伝子の配列は N 末および C 末の相同性が高いので、今回は MUSCLE アライナーを使用します。アライメントオプションから MUSCLE Alignment を選択します。個々のパラメータを設定することもできますが、今回はデフォルトのパラメータを使用します。

Geneious_シークエンスアラインメント_MMUSCLE Alignment

すでにパラメータを変更していて、デフォルトのそれが分からない場合は、ウィンドウの左下にある 設定ボタン をクリックし、Reset to defaults をクリックしてください(当該部分がグレーアウトしている場合は、デフォルトのパラメータがすでに設定されています)。

OKボタンをクリックするとアライメントが開始されます。

Geneious_シークエンスアラインメント_パラーメータ

Geneious_シークエンスアラインメント_パラメータ2アライメント完了後、クリックして表示し、拡大して塩基を確認します。

Geneious_シークエンスアラインメント_塩基の確認

Distanceタブでは 、各配列間の相同性を確認できます。

Export Matrix をクリックすると、表を CSV ファイルで出力できます。

Geneious_シークエンスアラインメント_CSV形式エクスポート

Text Viewタブでは、シンプルなアライメント結果を見ることができます。Expand the viewer をクリックすると、アライメント結果をテキストデータとして出力できます。

Geneious_シークエンスアラインメント_テキスト形式でエクスポート

以上で、「シークエンスアラインメントの作成」を終わります。