2009 Fiscal Year Annual Research Report
パスフラグメントによる分子グラフのクイックマイニング
Project/Area Number |
21700159
|
Research Institution | Kanazawa Technical College |
Principal Investigator |
藤島 悟志 Kanazawa Technical College, 電気電子工学科, 准教授 (10411787)
|
Keywords | パスフラグメント / 簡易マイニング / パスフラグメントグループ / 頻度分布 / 薬理活性クラス / 化学構造データマイニング |
Research Abstract |
構造特徴表現として考案したパスフラグメントに対して,フラグメント中のヘテロ原子や結合多重度も考慮した拡張表現の提案を行った.これにより,例えば,先行研究では同一のフラグメントとされていた,=0と-OHの酸素原子を区別することが可能となった.たとえ簡易マイニングを主眼とする手法であっても,化学的な性質が明らかに異なる化学種を考慮することは極めて重要であり,新たな知見の獲得につながると考える. 頻出パスフラグメントの統計的解析の手順を検討し,化学構造に特徴的なパスフラグメントの獲得を試みた,解析手順の第1ステップは生成されたパスフラグメントを系統的に纏める作業であり,パスフラグメントを両端の原子ラベルのみに注目してグループ化し,その頻度分布をみる.この作業を行うことで,原子ラベルのみで薬理活性クラスの特徴解析が行える.次に第2ステップとして,特定のグループに対して,距離情報を横軸とした頻度分布を生成する.この頻度分布からは薬理活性クラスに特徴的な,フラグメントの距離情報などが得られる可能性がある.3種のドーパミンデータを用いて段階的に解析を行ったところ,原子ラベルは同じでも,その間の距離によって「ドーパミン活性の発現が異なる」という,先行研究では見出せなかった知見を獲得することができた.この結果は本手法が化学構造データマイニングにおいての有用性を示唆するものであると考える. 構造特徴の抽出には,頻度分布から得られる統計量の定義や閾値の設定などが必要であり,現段階では未だ決定的なものが得られていない.今後は,自然言語処理分野で使用されているTF/IDF法の適用も含め引き続き統計量の検討を行っていく.
|