roary

2016年6月15日 更新

BWAとは

高速スタンドアローンパンゲノム解析パイプライン.ProkkaからのGFF3形式のアノテーションされたアセンブリを使う.

インストール

省略.

使い方

Prokkaの出力ファイル.gffを一つのディレクトリgffにまとめておきます.
% roary -f outdir -e -n ./gff/*.gff
gffファイルが一つしかない場合はエラーが出ます.
その他のオプションは
-p N スレッド数
-i N blastpの最小アイデンティティのパーセンテージ
-r Rによるプロットを出力
-s パラログをわけない
-v 詳細に標準出力
-h ヘルプ

以下で結果を図示します
% FastTree -nt -gtr outdir/core_gene_alignment.aln > outdir/core_gene_alignment.nwk
% python roary_plots.py outdir/core_gene_alignment.nwk outdir/gene_presence_absence.csv
これで,pangenome_frequency.png, pangenome_matrix.png, pangenome_pie.pngが出力されます.

参考文献

https://github.com/microgenomics/tutorials/blob/master/pangenome.md
https://sanger-pathogens.github.io/Roary/