Jellyfish

2016年5月2日 更新

Jellyfishとは

k-merを高速かつ並列に数える.k-merとは,k bpの長さの塩基のこと.mono-mer, di-mer, poly-mer, k-mer.fastaもfastqも可.

インストール

1. ここから最新版をDL.
2. ダブルクリック等で解答.
3. 以下、よくある手順。
% cd jellyfish-2.x.x
% ./configure
% make
% sudo make install
g++が古いと動かないので、その場合はupgrade。
4. bin/jellyfishができていればインストール完了.パスを通せばどこからでも使えます.

使い方

以下のコマンドがある.
count kmerを数える.
bc 2回以上見られるk-merだけを残す.アウトプットをcount -bc へ.
info .jfファイルの作成時の情報を出力.
stats .jfファイルの簡単な統計情報を出力.
histok-mer頻度のヒストグラムで出力.
dump全k-merの情報を出力.
merge
query指定した塩基のk-merを出力.
cite jellyfish論文の引用文を表示.-bでBibtexフォーマット.なんて便利なんだ!(マニュアルの直訳)
memメモリー使用情報の出力.
jfクラゲを出力.
コマンド入力後に-hでそれぞれのヘルプ.

reads.fastaから10スレッドと初期サイズ100Mのハッシュを使って21merを(相補鎖も併せて)数えて,output.jfへ出力.
% jellyfish count -m 21 -s 100M -t 10 -o output.jf -C reads.fasta

参考文献

Jerryfish2の公式ページ