2022 Fiscal Year Research-status Report
A development of a methodology for high-efficiency structure elucidation of unknown compounds using chemoinformatics and computational chemistry
Project/Area Number |
22K21324
|
Research Institution | The University of Tokyo |
Principal Investigator |
新福 優太 東京大学, 大学院工学系研究科(工学部), 特任研究員 (60964666)
|
Project Period (FY) |
2022-08-31 – 2024-03-31
|
Keywords | 環境化学 / 高分解能質量分析 / 構造推定 / 定量的構造保持相関 |
Outline of Annual Research Achievements |
本研究は、質量分析法を基礎とする環境中の未知汚染物質の構造推定の迅速化を目的とするものであり、この達成のために、ケモインフォマティクス的手法による保持時間の予測方法、および量子化学計算による開裂反応(フラグメンテーション)の予測方法の開発を試みるものである。 まず、前者のケモインフォマティクス的手法の開発を目的として、種々の化学物質を四重極-飛行時間型高分解能LC/MS分析に供した。具体的には、環境省の定める要調査項目のうち103物質を分析し、これらの物質の実測保持時間情報を取得した。要調査項目として指定されている化学物質は、その化学的特徴が多岐に渡ることから、得られた保持時間情報は将来的な保持時間予測モデルの開発において有益性が高い。 量子化学計算による開裂反応の予測方法についても開発を試みるが、これは要求される計算時間が膨大となる可能性が高いため、前段階としてジェネラルフラグメンテーションルールを用いた構造推定とデータベースマッチングの組み合わせを検討中である。現時点では、プログラミング言語Pythonを使用した構造候補物質のスクリーニング法の確立に、部分的ではあるが成功している。具体的には、Python中のライブラリであるPubChemPyおよびRDkitを用いて、特定の分子式を有する物質をPubChem上で検索し、該当する物質群のcanonical SMILESを一斉に取得し、そのリストからのカルボキシ基、フェニル基、三級アルコール、三級アミンを有する物質の抽出、および各物質についてのこれらの官能基数のカウントに成功している。ただし将来的な展望に鑑みると、ヒドロキシ基などの他の官能基も対象として、現時点でのスクリーニング法をより広範に拡大していく必要性が高いと言える。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題の遂行にあたっては、四重極-飛行時間型高分解能LC/MS分析を使用している。しかし同機器について、ロータリーポンプの故障といった機器トラブルが頻繁に発生したほか、制御用PCにインストールされている解析ソフトウェアの設定上の不備が見つかり、これらの修正に時間を要したため計画の進展はやや遅れている。ただしこれらのトラブルは現在おおむね解決されており、今後は本研究課題を加速可能と予想している。
|
Strategy for Future Research Activity |
短期的な視点における今後の研究の推進方策は、大きく2つに分けられる。 まず1つは、未知物質を対象とする保持時間予測モデルの開発であり、この開発にあたっては前出の要調査項目103物質から得られた実測保持時間情報を教師データとして使用予定である。現時点では部分最小二乗回帰(PLS)法を用いて、物質中に含まれるカルボキシ基、フェニル基、ヒドロキシ基等の種々の官能基や多重結合等の数を独立変数とする線形回帰モデルの開発を検討しているが、PLS法が上手く機能しない場合には代替として人工ニューラルネットワークやサポートベクターマシンを使用予定である。 もう1つはPythonによる構造候補物質のスクリーニング法の拡充である。先述の通り、現時点でのスクリーニング法では対象としている官能基種類が限定的であるため、これをより広範な官能基に対して適用することを試みる。この達成のためにRDKit中のChemモジュールを使用して、SMARTS記法による部分構造の探索を試みるほか、代替手法としてobgep等のgrep系のプログラムの使用も予定している。 質量分析法を用いる未知物質の構造推定における最大の弱点は、同一の分子式を有する膨大な構造異性体の中から正解の構造を探り当てるのに時間を要する点であるが、上記2点が達成された場合、候補構造を大きく絞り込めると期待される。その上で、絞り込みの結果得られたごく少数の候補構造に対して、量子化学計算によるより厳密な構造推定(生成するプロダクトイオンの予測)を実施予定である。長期的な研究戦略として、このような量子化学計算のほか、未知物質をスパイクした模擬環境試料を用いる実証実験を計画している。
|
Causes of Carryover |
本研究においては量子化学計算を用いるフラグメンテーション反応の予測法開発を目的としており、このために中規模程度の計算リソースを有するPCの導入を予定していたが、現時点においてはまだ導入されていない。これは現在、保持時間予測モデルの開発を主に検討しており、そのための回帰モデル作成にあたっては現有のPCで十分に対応可能なためである。研究の進展に応じて、適宜計算資源を導入予定である。
|