• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

嗅球糸球体層の活性パターン画像と分子パラメタに基づく物質の匂い情報の定量化

Research Project

Project/Area Number 21K19796
Research InstitutionKyushu University

Principal Investigator

冨浦 洋一  九州大学, システム情報科学研究院, 教授 (10217523)

Co-Investigator(Kenkyū-buntansha) 林 健司  九州大学, システム情報科学研究院, 教授 (50202263)
Project Period (FY) 2021-07-09 – 2024-03-31
Keywords匂い物質 / 匂い情報の定量化 / SMILES / 分子構造 / 匂い識別子 / 事前学習 / Transformer
Outline of Annual Research Achievements

分子物性を予測するためのTransformerモデルを構築した。このモデルでは、入力は分子を構成する原子の列である。構造情報をembeddingに含めることができるように、原子間の結合と原子間の距離を重みに反映させてself-attentionを改良している。10万個の分子のSMILESデータを収集し、入力分子が特定の分子部分構造を持つか否かの予測実験を行った。予測性能はF1値で0.98を達成した。また、正例の予測に寄与した原子をEncoder-Decoder Attentionを利用して調べたところ、対象となる部分構造中の原子を正確にアノテーションしていることがわかった。さらに、4462個の分子とその匂い記述子を収集し、提案モデルを用いて98個の匂い記述子を予測し、平均F1値0.33を得た。また、0.45以上のF1値を得た19個の匂い記述子については、Encoder-Decoder Attentionを利用して、分子部分構造と匂いの質の関係を要約することを試みた。
別のモデルとして、自然言語処理で用いられているBERTを改良した事前学習モデルを考案した。BERTはTransformer Encoderで構成され、事前学習のためのタスクの一つとして、一部の単語をマスクした入力からマスクした単語を予測するというタスク(MLM)を用いている。しかし、自然言語文と異なり SMILES では1記号が置き換わっただけで別の分子を表すことになるため、単にBERTを用いてSMILESのembeddingを求めるのは適切でない。匂い分子の匂い記述子の予測において、事前学習を用いない場合、及び、BERTのMLMだけを用いた場合と比較して、提案する事前学習モデルを用いた場合が最も良い予測性能を示した。
上記の2つのモデルで得られる分子のembeddingを匂いコードとして用いることを検討中である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

これまでに提案されたモデルによる分子物性予測や匂い分子の匂い記述子の予測と比較して同等かそれ以上の性能を示すモデルを構築できている。また、SMILESのembeddingの事前学習モデルでは、得られた事前学習済みモデルを匂い識別子の予測タスク等でfine tuningすることで、少ないトレーニングデータでも高い性能を示すことができるため、得られたembeddingを匂いコードに利用できる可能性が高い。

Strategy for Future Research Activity

匂いの合成に使えるような匂いコードは線形性(物質AとBを混合したときの匂いが物質Cと類似するならば、物質Aの匂いコードと物質Bの匂いコードの線形和は物質Cの匂いコードに類似する)を持つ必要がある。R4年度に開発した手法で得られる分子のembeddingは線形性を持つ保証はない。このため、線形性を持つと予想されるラットの嗅球画像の予測もタスクに追加することで、線形性を有するembedding、つまり匂いコードを求める手法を開発する。

Causes of Carryover

コロナ禍にあって、国際会議での発表を控えていたため、残額が生じた。
R5年度は、国際会議参加(2名、2回)を予定しており、主にそれに使用する。

  • Research Products

    (1 results)

All 2022

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results)

  • [Journal Article] Investigation of the structure-odor relationship using a Transformer model2022

    • Author(s)
      Xiaofan Zheng, Yoichi Tomiura, Kenshi Hayashi
    • Journal Title

      Journal of Cheminformatics

      Volume: 14(1):88 Pages: 1-16

    • DOI

      10.1186/s13321-022-00671-y

    • Peer Reviewed / Open Access

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi