• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

嗅球糸球体層の活性パターン画像と分子パラメタに基づく物質の匂い情報の定量化

研究課題

研究課題/領域番号 21K19796
研究機関九州大学

研究代表者

冨浦 洋一  九州大学, システム情報科学研究院, 教授 (10217523)

研究分担者 林 健司  九州大学, システム情報科学研究院, 教授 (50202263)
研究期間 (年度) 2021-07-09 – 2024-03-31
キーワード匂い物質 / 匂い情報の定量化 / SMILES / 分子構造 / 匂い識別子 / 事前学習 / Transformer
研究実績の概要

分子物性を予測するためのTransformerモデルを構築した。このモデルでは、入力は分子を構成する原子の列である。構造情報をembeddingに含めることができるように、原子間の結合と原子間の距離を重みに反映させてself-attentionを改良している。10万個の分子のSMILESデータを収集し、入力分子が特定の分子部分構造を持つか否かの予測実験を行った。予測性能はF1値で0.98を達成した。また、正例の予測に寄与した原子をEncoder-Decoder Attentionを利用して調べたところ、対象となる部分構造中の原子を正確にアノテーションしていることがわかった。さらに、4462個の分子とその匂い記述子を収集し、提案モデルを用いて98個の匂い記述子を予測し、平均F1値0.33を得た。また、0.45以上のF1値を得た19個の匂い記述子については、Encoder-Decoder Attentionを利用して、分子部分構造と匂いの質の関係を要約することを試みた。
別のモデルとして、自然言語処理で用いられているBERTを改良した事前学習モデルを考案した。BERTはTransformer Encoderで構成され、事前学習のためのタスクの一つとして、一部の単語をマスクした入力からマスクした単語を予測するというタスク(MLM)を用いている。しかし、自然言語文と異なり SMILES では1記号が置き換わっただけで別の分子を表すことになるため、単にBERTを用いてSMILESのembeddingを求めるのは適切でない。匂い分子の匂い記述子の予測において、事前学習を用いない場合、及び、BERTのMLMだけを用いた場合と比較して、提案する事前学習モデルを用いた場合が最も良い予測性能を示した。
上記の2つのモデルで得られる分子のembeddingを匂いコードとして用いることを検討中である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

これまでに提案されたモデルによる分子物性予測や匂い分子の匂い記述子の予測と比較して同等かそれ以上の性能を示すモデルを構築できている。また、SMILESのembeddingの事前学習モデルでは、得られた事前学習済みモデルを匂い識別子の予測タスク等でfine tuningすることで、少ないトレーニングデータでも高い性能を示すことができるため、得られたembeddingを匂いコードに利用できる可能性が高い。

今後の研究の推進方策

匂いの合成に使えるような匂いコードは線形性(物質AとBを混合したときの匂いが物質Cと類似するならば、物質Aの匂いコードと物質Bの匂いコードの線形和は物質Cの匂いコードに類似する)を持つ必要がある。R4年度に開発した手法で得られる分子のembeddingは線形性を持つ保証はない。このため、線形性を持つと予想されるラットの嗅球画像の予測もタスクに追加することで、線形性を有するembedding、つまり匂いコードを求める手法を開発する。

次年度使用額が生じた理由

コロナ禍にあって、国際会議での発表を控えていたため、残額が生じた。
R5年度は、国際会議参加(2名、2回)を予定しており、主にそれに使用する。

  • 研究成果

    (1件)

すべて 2022

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件)

  • [雑誌論文] Investigation of the structure-odor relationship using a Transformer model2022

    • 著者名/発表者名
      Xiaofan Zheng, Yoichi Tomiura, Kenshi Hayashi
    • 雑誌名

      Journal of Cheminformatics

      巻: 14(1):88 ページ: 1-16

    • DOI

      10.1186/s13321-022-00671-y

    • 査読あり / オープンアクセス

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi