Bismark
2016年03月9日 更新
Bismarkとは
Bisulfite-Seq(バイサルファイト シークエンス)の高速解析ツールセット.
バイサルファイト処理された塩基配列をマッピングすることで,メチル化の位置とレベルを特定します.
その他にもBSMAPなどがあります.
インストール
1.最初に、bowtie か
bowtie2をDL.bowtie2を推奨.
2.bismarkを
ここからダウンロード、ダブルクリック等で解凍.
3.bowtie2もbismarkも好きな場所に移動させてパスを通せばすぐに使えます.
使い方
1. 配列を貼り付けるリファレンスを準備します.
指定したゲノムディレクトリ内の全てのfastaファイルからリファレンスとなるインデックスを作成し,Bisulfite_Genomeというディレクトリに保存します.
最もシンプルに
% bismark_genome_preparation genome_directory/
bowtie2のPATHを指定し,アウトプットを詳細に
% bismark_genome_preparation --path_to_bowtie bowtie_PATH --verbose genome_directory/
2. fastqをリファレンスに貼り付けます.
single endの場合
% bismark genome_directory/ file.fastq
paired endの場合
% bismark genome_directory/ -1 file_1.fastq -2 file_2.fastq
seed内の最大ミスマッチ数を0に,seedの長さを20に.(デフォルト)
% bismark -N 0 -L 20 genome_directory/ file.fastq
出力先ディレクトリを指定.gzipで.
% bismark -N 0 -L 20 --gzip -o out_dir/ genome_directory/ file.fastq
-Nは0か1.1の方が時間はかかるがセンシティブ.-Lは小さいほど時間はかかるがセンシティブ.
3. 同じPCR産物由来の配列を取り除きます.
single endの場合
% deduplicate_bismark -s output_bismark_bt2.bam
paired endの場合
% deduplicate_bismark -p output_bismark_bt2_pe.bam
bam形式で出力
% deduplicate_bismark --bam -s output_bismark_bt2.bam
4. メチル化情報を抽出します.
single endの場合
% bismark_methylation_extractor -s output_bismark_bt2.deduplicated.bam
paired endの場合
% bismark_methylation_extractor -p output_bismark_bt2_pe.deduplicated.bam
出力先ディレクトリを指定.gzipで.
% bismark_methylation_extractor --gzip -o out_dir/ -s output_bismark_bt2.deduplicated.bam
どのコマンドも,-hか--helpでヘルプが見られます.
どうしてもbowtie2ではなくbowtieが使いたい場合,いくつかオプションの追加,変更が必要です.
参考文献
http://www.bioinformatics.babraham.ac.uk/projects/bismark/