Project/Area Number |
22K21324
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1101:Environmental analyses and evaluation, environmental conservation measure and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
新福 優太 東京大学, 大学院工学系研究科(工学部), 特任研究員 (60964666)
|
Project Period (FY) |
2022-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | 環境化学 / 高分解能質量分析 / 構造推定 / 定量的構造保持相関 / 計算化学 |
Outline of Research at the Start |
現代においては多種多様な化学物質が恒常的に利用されている。これらの化学物質が環境中に放出されると、光分解・加水分解・共存物質との化学反応等の結果として、未知の変化体が環境中で生成すると予想される。そのような変化体が周辺環境に悪影響を及ぼす事例が散見されるが、一般に環境中の未知物質はごく微量であり、かつ環境試料には目的成分以外にも多数の夾雑物質が含まれているため、物質同定には多大な困難を伴うケースが多い。本研究はこうした困難に対し、高分解能質量分析、ケモインフォマティクス、計算化学等の手法を組み合わせることで、時間的・経済的負担の大きい未知物質の同定作業の簡便化・高効率化を目指すものである。
|
Outline of Annual Research Achievements |
本研究は、質量分析法を基礎とする環境中の未知汚染物質の構造推定の迅速化を目的とするものであり、この達成のために、ケモインフォマティクス的手法による保持時間の予測方法、および量子化学計算による開裂反応(フラグメンテーション)の予測方法の開発を試みるものである。 昨年度に引き続き、各種分子に対する記述子の一斉検索システムを構築した。構築にはPython言語を使用し、同言語にて利用可能なライブラリであるRDkit, Pubchempy(PCP)を使用した。昨年度の検討では、任意の分子式をPubchem上で検索した後、得られる構造異性体の集団の各分子に対してcanonical SMILESを一斉に取得して、各分子中のカルボキシ基、フェニル基、三級アルコール、三級アミンの官能基数をカウント可能であった。しかし、計数可能な官能基が4種のみと限定的であった。今年度の検討では、計数対象の官能基の種類を大幅に拡張し、これら4種に加えて炭素-炭素二重/三重結合、ヒドロキシ基(一, 二, 三級アルコール)、ケトン、エステル、アミノ基(一, 二, 三級アミン)、ニトロ基、イミン、ニトリル基、メルカプト基、スルホニル基、スルホ基が検索可能となった。多段階精密質量分析では、未知物質が有する官能基情報を取得可能な場合がある。したがって、同一の分子式を有する構造異性体の集団の中から特定の官能基を有する分子のみを抽出する初次的な構造推定において、本法は有効である。 また、これらの官能基情報に加え、XLogP(個々の原子の寄与率から推算される水/オクタノール分配係数)、トポロジカル極性表面積、水素結合アクセプター/ドナー数などの情報が取得可能となった。本年度の検討において、取得可能な記述子の種類が拡張されたため、保持時間予測モデルの開発加速が期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
分担研究者として実施した他の研究課題に関連する作業に、研究開始当初の予想よりも時間を要したため、進捗状況としては遅れが見られる。これを踏まえ、科学研究費助成事業補助事業期間を1年間延長し、さらなる研究成果の取得に取り組む。
|
Strategy for Future Research Activity |
RDkitおよびPCPにて取得可能となった種々の記述子を用いて、保持時間予測モデルを開発する。モデル開発のための手法としては重回帰分析、部分最小二乗回帰分析、サポートベクターマシン、モンテカルロ最適化などを使用予定である。本検討においては、構造推定のための保持時間予測法の開発を目的としていることから、互いに似た構造や物性を有する構造異性体の保持時間を高い分解能で識別可能な予測モデルが必要となる。 これと並行して、多段階精密質量分析における種々の分子の結合乖離パターンを一斉に取得して、データベースを構築予定である。データベース構築に際しても、保持時間予測モデルの開発と同様にPython言語を使用し、Web上の質量分析データベースを対象としてWebスクレイピングを実施することで関連情報の一斉取得を試みる。スクレイピング用のライブラリとしてBeaultiful SoupやSeleniumなどを使用予定である。推定対象とする未知物質から取得したプロダクトイオンスペクトルと、構築するデータベースに収録されたフラグメンテーションパターンを比較し、一致度の高いものから順に優先的な調査対象としていくことで構造推定の所要時間を短縮可能と期待される。 さらに、Python上で利用可能な量子化学ライブラリPsi4を用いて、量子化学的にフラグメンテーションパターンを予測することも検討している。ETKDGなどの手法を用いて生成した三次元コンフォーマーを出発構造とするab initio計算(密度汎関数理論によるものなど)で、結合開裂パターンの予測に道を拓ける可能性がある。ただしこの計算手法は莫大な演算量を有し、相応の計算資源が必要となるため、まずは上述の保持時間予測モデルの開発およびフラグメンテーションパターンのデータベース構築を優先する。
|