Bismark

2016年03月9日 更新

Bismarkとは

Bisulfite-Seq(バイサルファイト シークエンス)の高速解析ツールセット.
バイサルファイト処理された塩基配列をマッピングすることで,メチル化の位置とレベルを特定します.
その他にもBSMAPなどがあります.

インストール

1.最初に、bowtie か bowtie2をDL.bowtie2を推奨.
2.bismarkをここからダウンロード、ダブルクリック等で解凍.
3.bowtie2もbismarkも好きな場所に移動させてパスを通せばすぐに使えます.

使い方

1. 配列を貼り付けるリファレンスを準備します.
指定したゲノムディレクトリ内の全てのfastaファイルからリファレンスとなるインデックスを作成し,Bisulfite_Genomeというディレクトリに保存します.
最もシンプルに
% bismark_genome_preparation genome_directory/

bowtie2のPATHを指定し,アウトプットを詳細に
% bismark_genome_preparation --path_to_bowtie bowtie_PATH --verbose genome_directory/
2. fastqをリファレンスに貼り付けます.
single endの場合
% bismark genome_directory/ file.fastq

paired endの場合
% bismark genome_directory/ -1 file_1.fastq -2 file_2.fastq

seed内の最大ミスマッチ数を0に,seedの長さを20に.(デフォルト)
% bismark -N 0 -L 20 genome_directory/ file.fastq

出力先ディレクトリを指定.gzipで.
% bismark -N 0 -L 20 --gzip -o out_dir/ genome_directory/ file.fastq
-Nは0か1.1の方が時間はかかるがセンシティブ.-Lは小さいほど時間はかかるがセンシティブ.
3. 同じPCR産物由来の配列を取り除きます.
single endの場合
% deduplicate_bismark -s output_bismark_bt2.bam

paired endの場合
% deduplicate_bismark -p output_bismark_bt2_pe.bam

bam形式で出力
% deduplicate_bismark --bam -s output_bismark_bt2.bam
4. メチル化情報を抽出します.
single endの場合
% bismark_methylation_extractor -s output_bismark_bt2.deduplicated.bam

paired endの場合
% bismark_methylation_extractor -p output_bismark_bt2_pe.deduplicated.bam
出力先ディレクトリを指定.gzipで.
% bismark_methylation_extractor --gzip -o out_dir/ -s output_bismark_bt2.deduplicated.bam

どのコマンドも,-hか--helpでヘルプが見られます.
どうしてもbowtie2ではなくbowtieが使いたい場合,いくつかオプションの追加,変更が必要です.

参考文献

http://www.bioinformatics.babraham.ac.uk/projects/bismark/