研究課題/領域番号 |
19K06516
|
研究機関 | 大学共同利用機関法人高エネルギー加速器研究機構 |
研究代表者 |
清水 伸隆 大学共同利用機関法人高エネルギー加速器研究機構, 物質構造科学研究所, 教授 (20450934)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | X線溶液散乱 / 小角X線散乱 / ゲル濾過クロマトグラフィー / 相関構造解析 |
研究実績の概要 |
ゲル濾過クロマトグラフィー(Size-Exclusion Chromatography)と組み合わせたタンパク質溶液試料の小角X線散乱(Small-Angle X-ray Scattering)法、SEC-SAXSの全自動解析ソフトウェアの開発を進めており、SAngler、Serial Analyzerという我々が開発中の2つのソフトウェアに関して、2019年度は以下の進展があった。SAnglerに関しては、第1に多数の連続データの処理の高速化を目指して、マルチスレッド環境に対応したパラレル処理を可能とする高度化を行なった。第2に、X線画像検出器のピクセル感度の均一性を評価して、閾値に基づき不良と判定したピクセルのデータを処理から除外するアルゴリズムを導入した。これらの改良により、2019年度中にSAnglerについてはVer 2.1.13から2.1.34まで7つの更新バージョンを公開した。Serial Analyzerに関しても、検出された複数ピーク、また一つのピーク中に複数の成分が予想される状態などでも、確度の高い安定した成分分離解析が行える様に、様々な最適化、高精度化はもちろん、高速化を行った。その結果、2019年度中にSerial AnalyzerはVer 1.1.3から1.3.0まで6つの更新バージョンを公開した。一方で、これらの解析を推進するために、32スレッドのCPUを2機搭載したWorkstationを整備して、開発に活用した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
Serial Analyzerにおいては、随所に情報科学的手法を活用している。特に行列で表わされる多量の連続データから個別成分の散乱プロファイルを安定、かつ高精度に抽出できるようにすることが本プロジェクトの第1目標である。この行列データを解くための連立方程式を定め、個別の散乱プロファイルの最適解を得るために機械学習でも活用される勾配降下法を利用している。このプロセスの最適化に多くの時間を費やしたが、この1年でかなりの改良が進み、多くのデータを安定的に解析出来るようになったと考える。
|
今後の研究の推進方策 |
2020年度においては、引き続きソフトウェアの改良を進める。SAnglerに関しては、解析ツール更新、機能追加などを予定している。Serial Analyzerに関しては、成分分離解析の高度化を目指して、新たなアルゴリズム開発に着手する。現行のバージョンでは、特殊なガウシアン様関数を用いて散乱曲線・吸収スペクトルの行列データをGlobal Fittingする際に、別プロセスから想定される成分数推定と合せて処理が進む仕様になっている。一方で、新しいアイデアでは、モデル関数によるFittingとベイズ推定を用いた成分分離数(状態)の最適化プロセスを混合して適用するアルゴリズムを開発し、Fittingの再現度を重視しながら成分数ありきの解析から脱却することを目指す。一方で、ソフトウェア利用者にも配慮し、現行の仕様はバージョン1.0系列として整備と改良を進め、新アルゴリズムはバージョン2.0系列として、別途開発を進める。本プロジェクトにおいてバージョン2.0を開発し、公開できることを目指していく。
|
次年度使用額が生じた理由 |
購入品の仕様や価格の精査を行なうことによって差額が生じたが、次年度において標準試料や消耗品の購入費として活用する計画である。
|