本文へスキップ

未観測対立遺伝子を含む対立遺伝子頻度のカーネル密度推定


論文情報
タイトル
Kernel density estimation of allele frequency including undetected alleles.
未観測対立遺伝子を含む対立遺伝子頻度のカーネル密度推定
著者
青木聡志・深澤圭太
*下線で示した著者は国立環境研究所所属
雑誌
PeerJ   DOI: 10.7717/peerj.17248 
受理・掲載
2024年3月25日受理、2024年2月22日オンライン掲載 オンライン公開への外部リンク
概要

未観測(※脚注1)種が種多様性の推定に貢献する一方、未観測対立遺伝子は遺伝的多様性の推定に使われてこなかった。無作為抽出(※脚注2)は対立遺伝子頻度と遺伝的多様性の不偏推定を保証するが、未観測対立遺伝子は偏ってはいるがより正確な推定を与える可能性があり、これは保全上有用である。著者らは新たに未観測対立遺伝子を含めた対立遺伝子頻度のカーネル密度推定(※脚注3)を行う方法を開発し、シミュレーションデータと実データを使って検証を行った。実験の結果、予想に反してカーネル密度推定で得られた塩基多様度は偏り・精度ともに悪化した。対立遺伝子頻度に関してもサンプルサイズが小さい場合を除いて悪化した。これらの結果は母集団の有限性や次元の呪いが原因である可能性がある。結論として、対立遺伝子頻度のカーネル密度推定は遺伝的多様性の推定の改善には寄与しなかった。

図:実データによるカーネル密度推定した対立遺伝子頻度の比較

図1:実データによるカーネル密度推定した対立遺伝子頻度の比較。縦軸:真の頻度との一致率。横軸:母集団に対するサンプルサイズの比率。凡例1:カーネル密度推定無しの推定。2:最小二乗クロスバリデーションという方法によるカーネル密度推定。3尤度クロスバリデーションという方法によるカーネル密度推定。

<脚注>
※1.未観測:統計標本の中に含まれていないこと。
※2.無作為抽出:調べたい集団のすべての個体が等しい確率で取り出される取り出し方。
※3.カーネル密度推定:ヒストグラムをより一般化させた確率密度分布の推定方法。