ADMIXTURE

2016年3月29日 更新

ADMIXTUREとは

複数SNPから各個体の祖先を最尤推定するためのソフトウェアツール.STRUCTUREと同じ統計モデルで,より高速.

インストール

1.ここからMac用の最新版をDL,ダブルクリックで解凍.
2. admixtureを好きなところに移動させてPATHを通せばどこからでも使えます.

使い方

入力ファイルにはbed, bim, famの3つの形式のファイルが必要です.これらはvcf形式からPLINK(1.9以降)で変換できます.
admixtureでfile.bed, file.bim, file.famから集団数K=3で計算する.
% admixture file.bed 3
file3.P, file3.Qが出力されます.
最適なKの値を推定したい場合は,それぞれのKのcross-validationによる標準誤差を比較する.
% for K in `seq 1 N`; do admixture --cv file.bed $K | tee log${K}.out; done
% grep -h CV log*.out
2行目の出力結果のうち,最も値の小さいものが Nはサンプルサイズ.
Kが決まったら,Rで図示する.
> tbl=read.table("file.3.Q")
> barplot(t(as.matrix(tbl)), col=rainbow(3), xlab="Individual #", ylab="Ancestry", border=NA)

参考文献

公式のマニュアル(PDF)