BWA

2016年5月28日 更新

BWAとは

Burrows-Wheeler Alignerの略.大きなリファレンス配列に対してあまり変化していない配列をマッピングするパッケージ.
ちなみに,ゲノムサイズによっては古いMacだとメモリが足りないかもしれません.

インストール

% git clone https://github.com/lh3/bwa.git
% cd bwa
% make
できあがったbwaにパスを通せばどこからでも使えます.

使い方

MEM, SW, backtrackの3種類のマッピング方法がありますが,MEMが一番速く,精度模様そうです.
最初にリファレンスとなるゲノムのfastaファイルからインデックスファイルを作ります.
デフォルトではゲノムのfastaファイルと同じディレクトリ,同じファイル名の拡張子違いを作ります.-pでファイル接頭語を変えられます.
% bwa index [-p prefix] genome.fasta
MEMでマッピングします.
シングルエンドの場合
% bwa mem refarence.fasta reads.fastq > aln_se.sam

ペアエンドの場合
% bwa mem refarence.fasta read1.fastq read1.fastq > aln_pe.sam
このときのfastqはgzでも良いです.
その他コマンド.
-t n スレッド数
-M Pickard用に短いindelに印をつける
-R '@RG\tID:XXX\tXX:XXXX' リードグループの追加

参考文献

http://bio-bwa.sourceforge.net/