• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

混合正規分布モデルを用いた低解像度密度マップ・原子モデルの重ね合わせ比較法の開発

Research Project

Project/Area Number 26440078
Research InstitutionOsaka University

Principal Investigator

川端 猛  大阪大学, たんぱく質研究所, 招へい研究員 (60343274)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywords電子顕微鏡 / 密度マップ / 混合正規分布モデル / 形状比較 / EMアルゴリズム
Outline of Annual Research Achievements

本年度は、データベースに登録された3次元密度マップと3次元原子モデルの両方の構造データに対して形状の検索を行うことができる「Omokage検索」というWEBサービスを開発し、一般公開を始めた。このサービスでは、ユーザ―が指定した密度マップや原子モデルを問い合わせ(クエリ)として、EMDBとPDBデータベース内の類似した形状を高速に検索することができる。高速に検索を行うため、データベース内の全ての3次元データを点群に変換し、それらの点間距離を特徴量として検索を行う方法を採用した。検出された類似構造とクエリ構造を重ね合わせるために、混合正規分布モデル(Gaussian Mixture Model; GMM)を用いたプログラムgmfitを用いて、pairwise gmfit というWEBサーバを開発した。2つの構造の重ね合わせは、主成分軸の重ね合わせを利用して初期姿勢を決め、それを最急降下法で修正するアルゴリズムを採用した。この重ね合わせサービスを行うためには、データベース内の全ての密度マップ、原子モデルを、あらかじめ混合正規分布モデルに変換しておく必要がある。この変換を高速に安定して行うため、従来、採用していた、入力する原子や格子を「点群」とみなしたEMアルゴリズムを改良し、入力を「ガウス関数群」とするEMアルゴリズムを考案し実装した。この結果、原子半径や格子幅といった大きさの情報も考慮できるようになり、より正確かつ剛健に混合正規分布モデルに変換することができるようになった。また、複数のサブユニットを重ねる計算法については、セグメンテーション&フィティング法という算法を開発し、その性能評価を進めた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度に計画した、原子モデルと密度マップのデータの形状比較検索のWEBサービス、重ね合わせ計算のWEBサービスについては、ほぼ計画通り開発することができた。できるだけ早急に論文にまとめ投稿する予定である。また、計画にはなかったが、大規模なデータベースを扱う上で不可欠な、混合正規分布モデルを生成するアルゴリズムの改良を行うこともできた。当初、予定していた重ね合わせた二つの密度マップの変形と差分を検出するアルゴリズムの開発については、それほど進展していないが、平成27年度以降、重点的に行っていきたい。

Strategy for Future Research Activity

今後は、以下の二つに絞って、研究を進めていきたい。一つは、平成26年度に開発を行った「Omokage検索」とPairwise gmfitのWEBサービスの機能の一層の高度化である。特に、類似性スコアの見直し(点間距離によるスコアと混合正規分布モデル(GMM)による重ね合わせのスコアの統合)、キーワード検索と形状検索との組み合わせ、ユーザーがアップロードした密度マップ、原子モデルの重ね合わせ機能の充実、重ね合わせた類似構造の変形と差分を検出する方法の開発などを行っていきたい。もう一つは、複数のサブユニットと密度マップを重ね合わせる多対1の計算法の開発である。これは、低解像度の密度マップからの原子モデルを導出するための重要な計算であるが、サブユニットの数が多くなると正確な重ね合わせは大変難しくなる。本年度は、以下の3点からより効果的な方法の開発を試みたい。まず、(1)計算効率の高いサブユニット配置の探索法の開発を行いたい。セグメンテーション&フィッティングなどいくつかのアイデアを試していきたい。二つ目は、(2) 実験から得られたサブユニットの配置に関する部分的な知識を拘束として取り込むことである。化学的架橋などによる、特定の残基ペアの距離拘束、あるいはより粗く、特定のサブユニットが近接しているという条件を、gmfitの新たなエネルギー関数として取り込み、拘束付きの最適化のアルゴリズムを実装することを考えている。最後に、(3)GMMで得られたサブユニット配置を、原子モデル・密度マップに戻して、再計算することで、精密化する機能の実装である。GMMは、あくまで計算を高速化するための簡易表現モデルであるため、詳細なモデルで計算時間をかけて精密化することで、より高い精度の重ね合わせが実現できると期待している。

Causes of Carryover

当初は、密度マップ・原子モデルの形状比較WEBサーバを構築するために、サーバ計算機を購入予定であったが、既に保有しているサーバ計算機であっても、粗視化された形状比較と、二つの構造の「1対1」の重ね合わせ計算には十分な性能であることが判明したため。

Expenditure Plan for Carryover Budget

平成27年度からは、WEBサービスの機能拡張を予定しており、既有のサーバ機より高い性能の計算機が必要となる。また、多対1の重ね合わせ計算を本格的に開始することを考えているため、より高性能な計算サーバが必要となる。よって、WEBサーバ用のサーバ計算機、および計算サーバとしてのサーバ計算機の2台を購入することを予定している。

  • Research Products

    (5 results)

All 2014 Other

All Presentation (2 results) Book (1 results) Remarks (2 results)

  • [Presentation] セグメンテーション&フィッティング ‐低解像度密度マップへの複数のサブユニットのあてはめ計算法‐2014

    • Author(s)
      川端 猛、鈴木博文、中村春木.
    • Organizer
      日本生物物理学会第52回年会
    • Place of Presentation
      札幌コンベンションセンター
    • Year and Date
      2014-09-25 – 2014-09-27
  • [Presentation] 構造データベース中の3次元電子顕微鏡データの形状比較とフィッティング2014

    • Author(s)
      鈴木博文、川端猛、中村春木
    • Organizer
      日本生物物理学会第52回年会
    • Place of Presentation
      札幌コンベンションセンター
    • Year and Date
      2014-09-25 – 2014-09-27
  • [Book] 見てわかる構造生命科学 -生命科学研究へのタンパク質構造の利用-2014

    • Author(s)
      中村春木、大島勘二、緒方一博、笠原浩太、神谷成敏、川端 猛、寒川剛、椎名政昭、鈴木博文、鷹野 優
    • Total Pages
      320
    • Publisher
      化学同人
  • [Remarks] Omokage検索 (生体超分子の形状類似性検索)

    • URL

      http://pdbj.org/emnavi/omo-search.php?lang=ja

  • [Remarks] Pairwise gmfit (二つの原子モデル・密度マップの重ね合わせ計算)

    • URL

      http://pdbj.org/gmfit/pairgmfit.html

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi