2017 Fiscal Year Research-status Report
混合正規分布を用いた電顕密度マップからのマルチスケール原子モデル構築法の開発
Project/Area Number |
17K07364
|
Research Institution | Osaka University |
Principal Investigator |
川端 猛 大阪大学, たんぱく質研究所, 寄附研究部門准教授 (60343274)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 混合正規分布モデル / 電子顕微鏡 / 原子モデル / 最尤法 / EMアルゴリズム |
Outline of Annual Research Achievements |
本研究課題の基本的なアイデアは、密度マップ、原子モデルを、混合正規分布モデル(GMM)で表現することで、重ね合わせ計算を効率化することである。そのためには、まず、マップやモデルをGMMに変換する必要があるが、その標準的なEMアルゴリズムは、入力原子群・入力ボクセル群を点群として取り扱う点入力GMMである。しかし、点入力GMMは、原子の大きさ(半径)、ボクセルの大きさ(格子幅)を評価せず、反復計算の途中にガウス関数の共分散行列がランク落ち(ガウス関数のある方向の広がりがゼロ)して異常終了する問題(singularity)を持っていた。本年度は、まず、この点入力GMMを改良し、原子・ボクセルに相当する分散を持つガウス関数群を入力とする、ガウス入力型GMM(G-inputGMM)という定式を考案し、その尤度を最大するEMアルゴリズムを導出した。この算法を用いることで、異常終了を完全に回避して、入力原子群・ボクセル群と同じ慣性半径のGMMを計算することに成功した。また、ボクセル数の多い高解像度のマップのGMMを高速に計算するために、近傍のボクセルをガウス関数にまとめて計算する、ダウンサンプルガウス関数(DSG)という方法も開発した。DSGを用いると数百のガウス関数のGMMを高速に計算できる。DSGを入力とするガウス入力型GMM(DSG-input GMM)を用いることで、高解像度のマップを少数のガウス関数に変換する計算の高速化も成功した。本手法は、技巧的な側面が強いもの、本研究が目的とするフィッティング・モデリングの基礎となるものであり、今後の研究の発展を支えるものとなることが期待される。この成果は、Journal of Structural Biology誌に投稿し、受諾された。考案した算法は、プログラムgmconvertに実装され、ソースは一般公開している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成29年度の5月に投稿したガウス関数入力型の混合正規分布モデルの論文は、数式の多いテクニカルな論文であったためか、二度の改訂を要求されたが、丁寧に改訂を行うことで投稿から10か月後に、受諾まで至ることができた。この論文の基本的なアイデアは、本研究課題開始以前に得られていたものであったが、論文の執筆・改訂の過程で、ダウンサンプルによるガウス関数の生成というアイデア、GMMの反復中の分散の保存性の証明など予期せぬ副産物も得ることができ、意義のある研究成果が得られたと思っている。このアルゴリズムは、今後のモデリングの基礎を与える重要な算法だと考えており、今後は、これを利用して、より実戦的なモデリングの方法を開発していきたい。また、電子顕微鏡の密度マップに基づくモデリング手法の総説記事の執筆、αへリックスの同定アルゴリズムの基本的な算法についての論文作成も行った。
|
Strategy for Future Research Activity |
今後は、以下の二つのより実践的なモデリングの問題に取り組んでいきたい。一つは、サブユニットの原子モデルを密度マップの一部にあてはめる、部分フィットの計算である。一般に、密度マップの一部だけが既知の原子モデルだけで表現できるケースは多く、この手法の需要は高い。これまで開発してきたマップ全体にフィットするプログラム(gmfit)を基にして、サブユニットの原子モデルの周りにマスク領域を設定し、その内側にあるボクセルだけで計算を行うように既存の算法を改良する予定である。もう一つは、ガウス関数を用いたαへリックスの認識プログラムの開発である。特に膜タンパク質の多くは多数のαへリックスからできており、モデリングの前段階としてαへリックス認識を行う必要性は高い。この方法も、試験的なプログラムは既に開発しているが、精度・計算速度の上でまだ改良の余地がある。より実践的な目的に使えるよう、定式化や算法を改善していきたい。
|
Causes of Carryover |
平成29年度は、原著論文2報と総説1報の執筆・投稿を行った。こうしたいくつかの論文の投稿を行ったため、2月以降に、受諾され出版料を請求される可能性と、査読の結果さらなる英文校正の要求がある可能性があった。よって、今年度は、全額使い切らないことにさせていただいた。案の定、3月になってから受諾連絡があり、3月に出版料を支払うことができた。次年度使用額は25万円ほどである。
|
Research Products
(6 results)