2014 Fiscal Year Research-status Report
糖鎖機能解明のための機械学習モデル開発及び糖鎖プロファイルデータベースの構築
Project/Area Number |
26330333
|
Research Institution | Soka University |
Principal Investigator |
木下 聖子 創価大学, 工学部, 教授 (50440235)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 糖鎖インフォマティクス / 機械学習 / アラインメント / アルゴリズム |
Outline of Annual Research Achievements |
ProfilePSTMMとは、特に糖鎖構造を解析するための機械学習モデルの一つである。本研究では、ProfilePSTMMと同様の性能を保ちつつ計算量を抑えることのできるProfileOTMMもでるを考案する。そしてProfilePSTMMにもProfileOTMMにも必要となる出力するプロファイルの形を決めるステートモデルを自動的に計算するプログラムも同時に開発する。このステートモデルを抽出するために、糖鎖の多重木アラインメントアルゴリズムを実装したプログラムであるMCAWを拡張することになった。 MCAWを利用してステートモデルを抽出するため、まずMCAWの解析できるデータの現状を把握する必要があり、糖鎖アレイ実験データベースを2つ用いて解析を行った。Consortium for Functional Glycomics (CFG) および JCGGDBのLectin Fronter Database (LfDB) よりデータを選別し、ダウンロードし、MCAWに入力できる形に変換し、解析を行った。CFGもLfDBもウェブサービスなどプログラムから自動的にデータを取得し形式変換をできるサービスを提供していないため、数百の実験データの内、数個しか取得できなかった。さらに、CFGに保管されたデータはマイクロソフト社のエクセル形式であったため、テキスト形式に変換する手間も倍増した。そこで、今後の解析の手間を考慮し、まずはエクセルデータを自動的に変換するプログラムをMCAWに入れ込むことにした。 そのため、JavaライブラリであるApache POIを利用することにした。POIはマイクロソフト社の様々な形式をJavaから利用できるようにするライブラリである。そして本年度はPOIをインストールし、MCAWを呼び出す前段階で複数のエクセル形式のファイルを指定し、データを取得し、MCAW用に利用できるような形に処理するプログラムを開発した。現在はテストやデバッグ段階であるが、次年度からは実際に利用し、MCAWからステートモデルを抽出し、ProfileOTMMを開発し、データ解析を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
当初はMCAWプログラムからステートモデルを抽出する作業が5月に完了し、それからProfileOTMMの開発が始まる予定であったが、最初のステートモデルの開発が難航し、特に利便性のためにApache POIを使ってエクセルからデータを自動的に抽出する必要があり、この新しいプログラムの開発を進めることにした。次年度は1人の学生から2人になるため、遅れた分を取り戻すことが可能であると考えられる。
|
Strategy for Future Research Activity |
今後の予定としては、MCAWプログラムからステートモデルを抽出することができれば、ProfileOTMMの開発に入り、できたステートモデルを利用する。そしてProfileOTMMの解析データを集めて、解析を行い、結果となるプロファイルデータを生成する。そして新しいサーバーに設置し、デバッグ及びテストを行う。
|
Causes of Carryover |
人件費の誤差である。
|
Expenditure Plan for Carryover Budget |
次年度の人件費に当てる予定である。
|