研究課題/領域番号 |
26330333
|
研究機関 | 創価大学 |
研究代表者 |
木下 聖子 創価大学, 工学部, 教授 (50440235)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 糖鎖インフォマティクス / 機械学習 / アラインメント / アルゴリズム |
研究実績の概要 |
ProfilePSTMMとは、特に糖鎖構造を解析するための機械学習モデルの一つである。本研究では、ProfilePSTMMと同様の性能を保ちつつ計算量を抑えることのできるProfileOTMMもでるを考案する。そしてProfilePSTMMにもProfileOTMMにも必要となる出力するプロファイルの形を決めるステートモデルを自動的に計算するプログラムも同時に開発する。このステートモデルを抽出するために、糖鎖の多重木アラインメントアルゴリズムを実装したプログラムであるMCAWを拡張することになった。 MCAWを利用してステートモデルを抽出するため、まずMCAWの解析できるデータの現状を把握する必要があり、糖鎖アレイ実験データベースを2つ用いて解析を行った。Consortium for Functional Glycomics (CFG) および JCGGDBのLectin Fronter Database (LfDB) よりデータを選別し、ダウンロードし、MCAWに入力できる形に変換し、解析を行った。CFGもLfDBもウェブサービスなどプログラムから自動的にデータを取得し形式変換をできるサービスを提供していないため、数百の実験データの内、数個しか取得できなかった。さらに、CFGに保管されたデータはマイクロソフト社のエクセル形式であったため、テキスト形式に変換する手間も倍増した。そこで、今後の解析の手間を考慮し、まずはエクセルデータを自動的に変換するプログラムをMCAWに入れ込むことにした。 そのため、JavaライブラリであるApache POIを利用することにした。POIはマイクロソフト社の様々な形式をJavaから利用できるようにするライブラリである。そして本年度はPOIをインストールし、MCAWを呼び出す前段階で複数のエクセル形式のファイルを指定し、データを取得し、MCAW用に利用できるような形に処理するプログラムを開発した。現在はテストやデバッグ段階であるが、次年度からは実際に利用し、MCAWからステートモデルを抽出し、ProfileOTMMを開発し、データ解析を行う予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
当初はMCAWプログラムからステートモデルを抽出する作業が5月に完了し、それからProfileOTMMの開発が始まる予定であったが、最初のステートモデルの開発が難航し、特に利便性のためにApache POIを使ってエクセルからデータを自動的に抽出する必要があり、この新しいプログラムの開発を進めることにした。次年度は1人の学生から2人になるため、遅れた分を取り戻すことが可能であると考えられる。
|
今後の研究の推進方策 |
今後の予定としては、MCAWプログラムからステートモデルを抽出することができれば、ProfileOTMMの開発に入り、できたステートモデルを利用する。そしてProfileOTMMの解析データを集めて、解析を行い、結果となるプロファイルデータを生成する。そして新しいサーバーに設置し、デバッグ及びテストを行う。
|
次年度使用額が生じた理由 |
人件費の誤差である。
|
次年度使用額の使用計画 |
次年度の人件費に当てる予定である。
|