Canu

2020年05月10日 更新

Canuとは

PacBioやNanoporeのロングリードシーケンサー用アセンブラ。correct, trim, assembleの3ステップ。
ハイブリッド法ではカバレッジが20xあれば足りるけど、少なくとも30xや60xくらいが推奨。

インストール

% git clone https://github.com/marbl/canu.git
% cd canu/src
% make -j 4
正常に完了するとcanuのインストールされたディレクトリが表示されるので、それにパスを通す。またはシンボリックリンク。

使い方

correct, trim, assembleの3ステップすべてをまとめて実行。
INPUTはfastaでもfastqでもgzになっていても可。
nanoporeのリードをアセンブル
% canu -p PREFIX -d OUT_DIRECTRY genomeSize=3g -nanopore-raw INPUT1 [INPUT2...]
PacBioのリードをアセンブル
% canu -p PREFIX -d OUT_DIRECTRY genomeSize=3g -pacbio-raw INPUT1 [INPUT2...]
nanoporeでcorrectのみ
% canu -correct -p PREFIX -d OUT_DIRECTRY genomeSize=3g -nanopore-raw INPUT1 [INPUT2...]
nanoporeでtrimのみ
% canu -trim -p PREFIX -d OUT_DIRECTRY genomeSize=3g -nanopore-corrected INPUT1 [INPUT2...]
nanoporeでassembleのみ
% canu -assemble -p PREFIX -d OUT_DIRECTRY genomeSize=3g -nanopore-corrected INPUT1 [INPUT2...]

参考文献

https://canu.readthedocs.io/en/latest/