研究課題/領域番号 |
17K07364
|
研究機関 | 大阪大学 |
研究代表者 |
川端 猛 大阪大学, 蛋白質研究所, 特任准教授(常勤) (60343274)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 電子顕微鏡 / 単粒子解析 / 混合正規分布モデル / フィッティング / 原子モデリング |
研究実績の概要 |
本研究課題の目標は、密度マップ、原子モデルを、混合正規分布モデル(GMM)で表現することで、重ね合わせ計算を効率化することである。H29年度は、そのためにマップやモデルを大きさ(分散・共分散)を維持したままGMMに変換するガウス関数入力型GMMとダウンサンプルガウス関数の算法の開発・論文発表に注力した。H30年度は、これらのGMMの応用として、二つの課題に取り組んだ。 一つ目の課題は、電顕密度マップの全体ではなく、一部分に原子モデル群を重ねる算法の開発である。このためには、サブユニットの周辺のマスク領域を設定し、マスク領域内だけで密度相関を計算する必要がある。これまで、複数サブユニット群を与えられた密度マップに重ねる算法として「セグメンテーション・フィッティング法」を開発してきたが、これを改良し「マスク付きセグメンテーション・フィッティング法」を開発した。 もう一つの課題は、密度マップからα-ヘリックスを認識する問題である。α-ヘリックスを1つの細長いガウス関数で近似して高速に認識するアイデアを以前から、試験実装してきた。これまでは、最尤法の枠組みで認識する算法を採用してきたが、α-ヘリックスの本数を事前に与える必要があるという問題があった。H30年度は、この点を改良し、画像処理のブロブ認識でよく用いられるLoGフィルタを用い、与えたしきい値以上のスコアを持つ領域を候補領域として抽出する算法に変更した。これにより、適用する密度マップに応じた本数のヘリックスを出力できるようになった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
密度マップの一部分に原子モデル群を重ねる算法は、これまで、開発したきた「セグメンテーション・フィッティング法」をもとに開発した。これは、マップのサブユニットへの領域分割のステップ(segmentation)と、分割されたマップ領域だけにフィットさせるステップ(fitting)を交互に行う算法である。この算法の領域分割を行うときに、現行のサブユニットの周辺のマスク領域内に限定するようにアルゴリズムに改良し、「マスク付きセグメンテーション・フィッティング法」として、プログラムgmfitに実装した。また、高解像度のマップの情報を有効に使うため、マップのGMMはダウンサンプルガウス関数により生成するように実装を改良した。新しい手法の概要については、第18回日本蛋白質科学会年会でポスター発表を行った。 密度マップからα-ヘリックスを認識する問題は、以前から、最尤法の枠組みで、従来のGMMのアルゴリズムを、αヘリックスの形状に対応するガウス関数ライブラリに限定するライブラリGMMという算法で、試験実装してきた。しかし、この算法ではα-ヘリックスの本数を事前に与える必要があるという問題があった。H30年度は、この点を改良し、画像処理のブロブ(blob;小さなかたまり)認識でよく用いられるLoG (Laplacian of Gaussian)フィルタを細長い異方ガウス関数を使って実装し、与えたしきい値以上のスコアを持つ領域を候補領域として抽出する算法に変更した。これによって、適用する密度マップに応じた本数のヘリックスの候補を認識できるようになった。この算法については、第56回日本生物物理学会年会で口頭発表を行った。
|
今後の研究の推進方策 |
残りの研究期間が1年を残すのみとなったので、マスク付きセグメンテーション・フィッティング法によるサブユニット・フィティングと、ガウス関数のラプラシアンフィルタを用いたα-ヘリックスの認識について、論文の執筆作業に注力したいと考えている。論文化に向けて、算法の洗練化、マルチスレッド並列計算による高速化、包括的なテスト計算などを行っていきたい。また、並行して、フィティングのWEBサービスサイトの開設、プログラムのソースコードの公開などの準備も行いたいと考えている。
|
次年度使用額が生じた理由 |
H30年度は、計算機2台・ノートPC1台を購入し、当面の研究に必要な計算機環境は十分整ったと考えられたこと、また、H31年度は、複数の論文の執筆を予定しているため、英文校正・出版費用の支払いが相当額必要であろうと思われた。よって、使い切らずに次年度に繰り越したほうが良いと判断し、16万円ほど繰り越すことにした。
|