ユーザー別ナビ |
  • 一般の方
  • 研究関係者の方
  • 環境問題に関心のある方

情報科学の援用による多様な化学物質の包括的・即応的環境計測(令和 5年度)
Comprehensive and responsive environmental measurement of various contaminants assisted by intelligence science

予算区分
基盤研究(A)(一般)
研究課題コード
2325CD102
開始/終了年度
2023~2025年
キーワード(日本語)
ノンターゲット分析,環境モニタリング,計算科学
キーワード(英語)
non-targeted analysis,environment monitoring,computational scinence

研究概要

 本研究は、多様化する化学物質による環境汚染実態を把握し、包括的な化学物質の管理や対策に資するため、我が国と国際的な包括的化学物質監視に貢献する、即応的・先駆的な包括的環境計測とその解析の仕組みを先端的な統計学・情報(計算)科学的手法を取り込むことで開発・構築するものである。
 質量分析を中心に重金属などの無機元素やイオンなどの各種計測を加えた包括分析を行うことで、より広範囲な化学種の検出を目指し、そのカバー範囲や再現性等の検証は複数の協力機関が参加する共通試料分析により実施する。
 また、人工知能や計算科学的手法を投入することにより、包括的分析データから原因物質に係る有意成分を抽出し、その構造を予測する一連の解析法を開発する。
 収集した包括データのレトロスペクティブ解析やオンデマンド解析による物質探索を可能にし、環境イベントの要因 (化学物質・化学種)を特定・推定するための即応的・実践的かつ先駆的な手順を提案する。

研究の性格

  • 主たるもの:モニタリング・研究基盤整備
  • 従たるもの:応用科学研究

全体計画

1. 様々な手法による共通試料の包括・ノンターゲット分析
 サブテーマ1では、異常の原因究明を目的とした包括分析法・およびノンターゲット分析法に関する共同分析を行う。具体的には、(1)環境試料あるいは模擬試料、(2)多種多様な物理化学的特性を持つ環境汚染物質の調合試料、(3)国際的にコンセンサスの得られた認証標準試料から成る3種類の共通試料を対象に、参加機関のインハウス法やAIQS法により化学分析を行い、得られたデータの妥当性、信頼性、標準性を評価する。アウトプットとして、異常事象の原因究明を目的とした調査分析法のプロトタイプを提示する。
(1)では、過去の異常事象の調査対象試料(例えば、河川水、魚や野生生物)を特定し、それらを模擬した共通試料による実情に即した共同分析を行い、参加機関の実測データをもとに異常事事象の原因究明のための調査分析における妥当性を評価する。
(2)では、過去の異常事象の原因物質(界面活性剤や農薬など)、欧米の先行研究で特定された化学物質(ストックホルム条約や化審法の規制対象物質、PRTR対象化学物質、PPCPs、プラスチック添加剤など)、欧米の先行研究で特定された保持指標を対象に共同分析を行い、参加機関の実測データをもとに現行の調査分析法の検出・認知可能な化学種の種類(物性範囲)を把握するとともに、異常事象の原因究明のための調査分析における信頼性を評価する。
(3)では、過去の異常事象の調査対象試料に類似したNISTの認証標準試料(底質、魚貝組織など)を対象に共同分析を行い、参加機関の実測データをもとに異常事故の原因究明のための調査分析における標準性・適合性を評価する。

2.計測データの統合解析と物質推定の高度化
 包括・ノンターゲット分析によって得られたデータについて、各種計測データの統合、計算科学的アプローチによる総合解析とインフォマティクス的物質推定手法を開発し、それらを一連のワークフローとすることで、a)有意成分の抽出、b)構造推定と類似成分の量的推算、c)個々の未同定成分の物性(と生体活性)情報の取得を行う。理想的には、ワークフローをツール化することで、「未知化合物の迅速な構造推定」と「原因予測モデル」を組み込んだ「大規模ノンターゲットデータ処理パイプライン」の構築を目指す。
 目指すワークフロー(パイプラインユニット)は、(1)データ縮約によるスクリーニング、(2)計測信号のデコンボリューション(分離精製)、(3)フィーチャーネットワーク化、(4)未同定物質に対応した半定量手法開発で構成する。
 (1)では、縮約手法には多次元部分最小二乗(M-PLS)などのPLSの応用、あるいは、勾配ブースティング回帰木(XGBoosting)などのAIを活用した手法を新規に開発する。データの統合には、一元配列化をオプションとして計画している。この過程で、計測信号からのノイズ成分の除去、(2)以降の構造推定フローに送るデータ(信号)の選別を行う。ここで、異種計測値の混合データをPLS等の解析で得られる因子付加量が寄与率評価に使用できる可能性がある。この過程で試行錯誤される異種の機器データの比較可能な尺度への変換と調整は、スクリーニングと寄与率推定の鍵になる。また、計算負荷の軽減や現実的なデータ処理のためには、データ解像度(時間分解能、質量分解能)を段階的に上げるステップスクリーニングについて検討する。
 (2)では、これまでGC-MSあるいはLC-MS用に開発してきた非負制限因子分解(NMF)による成分デコンボリューション(分離精製)を他の計測機器の信号への応用を試みる。また、適宜、マスデフェクトフィルタリング(MDF)などのin silico クリンナップを精密マススペクトルデータに施し、不要スペクトルやノイズを除去し、その後の処理の助けとする。
 (3)では、マススペクトルの類似度を元にデータをネットワーク化して未知化合物のスペクトル情報を整理し構造解析を行うフィーチャーネットワーキングの技術をLC-MSおよびGC-MSのスペクトルにも適用することで試料中の膨大な未知化合物の構造情報(化合物クラス・構造類似性・部分構造等)の網羅的な抽出を行う。
 (4)では、標準品の測定に基づく検量線が得られず、濃度決定の出来ないGC-MSあるいはLC-MSのノンターゲット成分やサスペクト成分の量的把握を可能にするため、定量に利用可能なイオンピーク面積値の算出と共に、これに分子構造やマススペクトルデータからイオン化効率などを推算して加味するin silico 半定量法開発を行う。

3.ノンターゲットデータからの原因探索
 開発・改良手法を環境試料に応用し、異常事象時の原因探索「イベントドリブンな原因探索」および平常時とのデータ比較による異常検出とその原因推定「データドリブンな異常検出」を可能にするためのデータの検索方法について課題の整理と要素技術の開発を行う。
 包括的ノンターゲットデータからの異常検知には、スパース主成分分析 (sPCA) などの次元圧縮手法と、ホテリングのT2法, 局所外れ値因子法 (LoF) に基づく異常検知アルゴリズムを組み合わせ、急激な濃度変化など異常な化学種情報が含まれる測定データを特定する。
 データベースの本格運用などは、今課題の範疇には含めないが、収集される包括的化学計測データは、いつでも再解析・遡上解析によって任意の物質情報をデータから探索できるデジタルアーカイビングのためのノウハウをまとめる。

今年度の研究概要

サブ1:様々な手法による共通試料の包括・ノンターゲット分析
過去の異常事象の原因物質(界面活性剤や農薬など)、欧米の先行研究で特定された化学物質(ストックホルム条約や化審法の規制対象物質、PRTR対象化学物質、PPCPs、プラスチック添加剤など)を対象に共同分析を行い、参加機関の実測データをもとに現行の調査分析法の検出・認知可能な化学種の種類(物性範囲)を把握する。
サブ2:計測データの統合解析と物質推定の高度化
a)有意成分の抽出、b)構造推定と類似成分の量的推算、c)個々の未同定成分の物性(と生体活性)情報の取得のために、計測信号からのノイズ成分の除去、データの配置法、非負制限因子分解(NMF)による成分デコンボリューション、マススペクトルの類似度を元にデータをネットワーク化して未知化合物のスペクトル情報を整理し構造解析を行うフィーチャーネットワーキングのGC-(EI)MSデータへの対応に着手し、試作手法から、課題の抽出を行う。
サブ3:ノンターゲットデータからの原因探索
比較可能なデータ内容に対検討するとともに模擬データからの異常検出手法として、包括的ノンターゲットデータからの異常検知には、スパース主成分分析 (sPCA) などの次元圧縮手法と、ホテリングのT2法, 局所外れ値因子法 (LoF) などに基づく異常検知アルゴリズムの試行と組み合わせについて、検出力などを比較する

外部との連携

江口哲史(千葉大学)
大谷隆浩(名古屋市立大学)
大塚宜寿(埼玉県環境科学国際センター)
頭士泰之(産業技術総合研究所)
竹峰秀祐(埼玉県環境科学国際センター)
早川英介(理化学研究所)
宮脇 崇(北九州市立大学)
山本敦史(公立鳥取環境大学)

関連する研究課題

課題代表者

橋本 俊次

  • 環境リスク・健康領域
    計測化学研究室
  • 室長(研究)
  • 学術博士
  • 農学,化学
portrait

担当者