研究課題/領域番号 |
26440078
|
研究機関 | 大阪大学 |
研究代表者 |
川端 猛 大阪大学, たんぱく質研究所, 招へい研究員 (60343274)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 電子顕微鏡 / 密度マップ / 混合正規分布モデル / 形状比較 / EMアルゴリズム |
研究実績の概要 |
本年度は、データベースに登録された3次元密度マップと3次元原子モデルの両方の構造データに対して形状の検索を行うことができる「Omokage検索」というWEBサービスを開発し、一般公開を始めた。このサービスでは、ユーザ―が指定した密度マップや原子モデルを問い合わせ(クエリ)として、EMDBとPDBデータベース内の類似した形状を高速に検索することができる。高速に検索を行うため、データベース内の全ての3次元データを点群に変換し、それらの点間距離を特徴量として検索を行う方法を採用した。検出された類似構造とクエリ構造を重ね合わせるために、混合正規分布モデル(Gaussian Mixture Model; GMM)を用いたプログラムgmfitを用いて、pairwise gmfit というWEBサーバを開発した。2つの構造の重ね合わせは、主成分軸の重ね合わせを利用して初期姿勢を決め、それを最急降下法で修正するアルゴリズムを採用した。この重ね合わせサービスを行うためには、データベース内の全ての密度マップ、原子モデルを、あらかじめ混合正規分布モデルに変換しておく必要がある。この変換を高速に安定して行うため、従来、採用していた、入力する原子や格子を「点群」とみなしたEMアルゴリズムを改良し、入力を「ガウス関数群」とするEMアルゴリズムを考案し実装した。この結果、原子半径や格子幅といった大きさの情報も考慮できるようになり、より正確かつ剛健に混合正規分布モデルに変換することができるようになった。また、複数のサブユニットを重ねる計算法については、セグメンテーション&フィティング法という算法を開発し、その性能評価を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度に計画した、原子モデルと密度マップのデータの形状比較検索のWEBサービス、重ね合わせ計算のWEBサービスについては、ほぼ計画通り開発することができた。できるだけ早急に論文にまとめ投稿する予定である。また、計画にはなかったが、大規模なデータベースを扱う上で不可欠な、混合正規分布モデルを生成するアルゴリズムの改良を行うこともできた。当初、予定していた重ね合わせた二つの密度マップの変形と差分を検出するアルゴリズムの開発については、それほど進展していないが、平成27年度以降、重点的に行っていきたい。
|
今後の研究の推進方策 |
今後は、以下の二つに絞って、研究を進めていきたい。一つは、平成26年度に開発を行った「Omokage検索」とPairwise gmfitのWEBサービスの機能の一層の高度化である。特に、類似性スコアの見直し(点間距離によるスコアと混合正規分布モデル(GMM)による重ね合わせのスコアの統合)、キーワード検索と形状検索との組み合わせ、ユーザーがアップロードした密度マップ、原子モデルの重ね合わせ機能の充実、重ね合わせた類似構造の変形と差分を検出する方法の開発などを行っていきたい。もう一つは、複数のサブユニットと密度マップを重ね合わせる多対1の計算法の開発である。これは、低解像度の密度マップからの原子モデルを導出するための重要な計算であるが、サブユニットの数が多くなると正確な重ね合わせは大変難しくなる。本年度は、以下の3点からより効果的な方法の開発を試みたい。まず、(1)計算効率の高いサブユニット配置の探索法の開発を行いたい。セグメンテーション&フィッティングなどいくつかのアイデアを試していきたい。二つ目は、(2) 実験から得られたサブユニットの配置に関する部分的な知識を拘束として取り込むことである。化学的架橋などによる、特定の残基ペアの距離拘束、あるいはより粗く、特定のサブユニットが近接しているという条件を、gmfitの新たなエネルギー関数として取り込み、拘束付きの最適化のアルゴリズムを実装することを考えている。最後に、(3)GMMで得られたサブユニット配置を、原子モデル・密度マップに戻して、再計算することで、精密化する機能の実装である。GMMは、あくまで計算を高速化するための簡易表現モデルであるため、詳細なモデルで計算時間をかけて精密化することで、より高い精度の重ね合わせが実現できると期待している。
|
次年度使用額が生じた理由 |
当初は、密度マップ・原子モデルの形状比較WEBサーバを構築するために、サーバ計算機を購入予定であったが、既に保有しているサーバ計算機であっても、粗視化された形状比較と、二つの構造の「1対1」の重ね合わせ計算には十分な性能であることが判明したため。
|
次年度使用額の使用計画 |
平成27年度からは、WEBサービスの機能拡張を予定しており、既有のサーバ機より高い性能の計算機が必要となる。また、多対1の重ね合わせ計算を本格的に開始することを考えているため、より高性能な計算サーバが必要となる。よって、WEBサーバ用のサーバ計算機、および計算サーバとしてのサーバ計算機の2台を購入することを予定している。
|