- 研究課題コード
- 2022CD026
- 開始/終了年度
- 2020~2022年
- キーワード(日本語)
- 環境DNAメタバーコーディング,サイト占有モデル,調査設計,魚類群集
- キーワード(英語)
- environmental DNA metabarcoding,site occupancy model,survey design,fish communities
研究概要
野外において生息種を網羅的に把握するための新しい観測手法として、環境DNAメタバーコーディングが広く利用され始めている。本研究では、環境DNAメタバーコーディングにおける偽陰性の種検出誤差に適切に対処し、正確かつ効率的に種多様性の評価・予測を行うための統計的な枠組みを構築する。提案手法を淡水魚類を対象とした環境DNAメタバーコーディングデータに適用してその有効性を検証するとともに、提案手法を実装したプログラム群を一般に公開し、検出誤差に頑健な環境DNAメタバーコーディングの普及を目指す。
研究の性格
- 主たるもの:技術開発・評価
- 従たるもの:モニタリング・研究基盤整備
全体計画
1. 種検出誤差を考慮した種多様性評価の統計的枠組みの構築
まず、本研究課題の基盤となる統計モデルを定式化する。環境DNAメタバーコーディングでは、野外での資料収集からライブラリ調整のための室内実験、次世代シーケンサによる配列解析、生命情報科学的なデータ処理まで、質的に異なる複数の段階を経由して、最終的には配列ごとのリード計数という形式で出力されるデータに基づいて各種の在・不在が判断される。偽陰性の検出誤差は、これらの段階のいくつかで(潜在的に異なる要因と起こりやすさで)複合的に生じ得る。こうした逐次的なデータ生成過程で生じる偽陰性を説明する統計モデルとしてサイト占有モデルに着目し、環境DNAメタバーコーディングの多変量リード計数データに適合する拡張を検討する。多地点で得られた環境DNAメタバーコーディングデータにこのモデルを統計的に当てはめて得られる情報(各段階における検出率の推定値と、各地点で不検出の種が実際には存在する事後確率)を用いることで、検出誤差を考慮した種多様性評価を実現する。さらに、このモデルの下で評価できる種検出の有効性に基づき、限られた予算や労力の下で最適な種多様性評価を実現するサンプリングデザインを導く数理計画法を構築する。
2. 実データによる検証評価
淡水魚類を対象とした環境DNAメタバーコーディングを主なモデルケースとして、課題1で構築した手法を実証する。環境条件や種構成が異なる霞ヶ浦水系の多定点で採水を行い、魚類に対して有効なユニバーサルプライマMiFishを用いて環境DNAメタバーコーディングによる種検出を行う。得られたデータに提案モデルを当てはめることで各種の地点間分布と局所・地域種多様性を評価するとともに、検出誤差率の変動(データを得るまでの複数の段階間での変動、地点間の変動、種間の変動)を定量して環境DNAメタバーコーディングにおける種検出の潜在的なボトルネックを特定する。また、課題2を通して提案手法の実用上の改善点を洗い出し、課題1の手法構築にフィードバックする。
3. 提案手法の実装とフリーソフトウェアとしての公開
環境DNAメタバーコーディングは水域・陸域に生息する幅広い分類群に応用できることが確認されており、本研究で提案する手法もこれらの対象に共通して適用可能である。そこで、提案手法を利用しやすい形で一般に提供することで、検出誤差に頑健な環境DNAメタバーコーディングの普及を目指す。具体的には、(a)提案モデルの構築と当てはめ、(b)その結果に基づく種多様性評価、(c)検出効率の観点からのサンプリングデザインの評価と最適化を容易に行うためのプログラム群を、統計解析に特化したフリーソフトウェアであるRの拡張パッケージとして実装して公開する。
今年度の研究概要
提案手法を簡便に扱うことのできる解析ソフトウェアの開発を進め、その正式版をリリースする。また、本ソフトウェアについて解説した論文を執筆し、国際誌に投稿する。