ADMIXTURE

2016年3月29日　更新

ADMIXTUREとは

複数SNPから各個体の祖先を最尤推定するためのソフトウェアツール．STRUCTUREと同じ統計モデルで，より高速．

1．ここからMac用の最新版をDL，ダブルクリックで解凍．
2. admixtureを好きなところに移動させてPATHを通せばどこからでも使えます．

入力ファイルにはbed, bim, famの3つの形式のファイルが必要です．これらはvcf形式からPLINK(1.9以降)で変換できます．
admixtureでfile.bed, file.bim, file.famから集団数K=3で計算する．

% admixture file.bed 3

file3.P, file3.Qが出力されます．
最適なKの値を推定したい場合は，それぞれのKのcross-validationによる標準誤差を比較する．

% for K in `seq 1 N`; do admixture --cv file.bed $K | tee log${K}.out; done
% grep -h CV log*.out

2行目の出力結果のうち，最も値の小さいものが Nはサンプルサイズ．
Kが決まったら，Rで図示する．

> tbl=read.table("file.3.Q")
> barplot(t(as.matrix(tbl)), col=rainbow(3), xlab="Individual #", ylab="Ancestry", border=NA)