2012 Fiscal Year Research-status Report
パレート学習型自己組織化マップのマルチモーダル,大規模データ解析への応用
Project/Area Number |
24500279
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Saga University |
Principal Investigator |
堂薗 浩 佐賀大学, 工学(系)研究科(研究院), 准教授 (00217613)
|
Co-Investigator(Kenkyū-buntansha) |
中國 真教 福岡大学, 総合情報処理センター, 准教授 (10347049)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 自己組織化マップ / 大規模データ解析 / ゲノム解析 / IPパケット解析 |
Research Abstract |
まず,今年度の研究ではパレート型自己組織化マップを用いた大規模データ解析で必要となる2つの基礎研究を開始した. 1つは隠れマルコフモデル(HMM)を記憶ユニットに用いた自己組織化マップ(HMM-SOM)の開発である.HMM-SOMに関しては,以前開発したアルゴリズムを改良し,球面自己組織化マップ(球面SOM)に適用したものと,大規模データ用に新たに開発したアルゴリズムを用いたHMM-SOMの2つの方向から研究を行っている.特にHMMはゲノム解析の分野において,シーケンスのモデル化に用いられており,本研究においてもDNAやアミノ酸の大規模シーケンス解析への適用を考えている.HMM-SOMに関しては博士前期課程の院生と共同で研究を行っており,ICAN2012において研究発表を行い,SpringerのLecture Note in Computer Scienceにも掲載された. もう1つは計算機合成ホログラムを記憶ユニットに用いた自己組織化マップ(CGH-SOM)を用いた大規模データ解析手法の開発である.大規模データ解析において,大規模データをそのまま学習させるのは困難であるため,何らかの前処理が重要となる.本研究においては,頻度情報を用いる方法を提案してきたが,頻度情報は1次元情報であり,頻度間の関連性はない.そこで,前処理用のSOMで大規模データを画像データに変換し,その画像データをCGH-SOMで解析することで,大規模データ間の関連性を視覚化する手法を提案し,DNAシーケンスデータ,IPパケットトラフィックデータに適用を行った. それに加え,新たな生体認証システムの開発に関しても研究を進めている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
HMM-SOM,CGH-SOMなどのマルチモーダルなパレート型SOMの開発に必要となる基礎的なアルゴリズムの開発は順調に進んでおり,新たに,CGH-SOMを用いた大規模データ解析手法についても開発を行い,アルゴリズム開発に関しては順調に行っている. 応用に関しては,ゲノムデータ,IPパケットデータ,画像データなどの解析の実験を進めており,有用な結果が得られている. 生体認証システムに関しても,自動的に特徴点を生成する新たな認証方式を提案し,実験を進めている.
|
Strategy for Future Research Activity |
まず,HMM-SOM, CGH-SOMなどのアルゴリズムを組み合わせてマルチモーダル化し,パレート学習型SOMの特性を生かした研究を進めていく. 具体的には,ゲノム解析において,現在は頻度情報,隠れマルコフモデル,自己組織化マップを用いてプローブ情報により生成された画像データなどを用いて,シーケンスの集合のマッピングを行い視覚化を行っているが,今後はこれらを組み合わせてマルチモーダル化を行い,パレート型学習SOMで解析を行う手法を開発する.また,CGH-SOMは2次元の画像のみでなく3次元図形のマッピングも行えるため,アミノ酸配列から構成されたタンパク質の3次元構造のマッピングを行いたい.また,3次元情報に加えて,シーケンス自体の情報,隠れマルコフモデル,2次構造,水素結合の分布などを統合して解析し,タンパク質の構造のマッチングやドッキングの可能性の確認が行える手法の開発を進めていく. また,IPパケット解析に関しては,現在研究を進めているCGH-SOMを用いた手法に加え,隠れマルコフモデルを用いた時系列情報を用いた解析手法の開発を行い,これまでより少ないパケット数で異常の検出を可能としたい.また,これらの手法を組み合わせて用いることで,様々な状況での異常を検出可能なIDSの開発を行っていく予定である. また,学生の演習時の端末使用状況を記録し,そのデータをパレート型自己組織化マップで解析することで,学生本人の確認,学生の履修状況や演習の内容の理解度を確認可能なシステムの開発を行う予定である.
|
Expenditure Plans for the Next FY Research Funding |
基本的には24年度に購入したコンピュータ類を用いて解析を行っていく予定であるが,今後のアルゴリズム開発の状況により,計算速度が現状では追いつかない場合,GPUコンピューティングやXenonPsiなどのマルチプロセッサシステムの導入を考えている.また,IPパケット解析に用いるための,ミラーリングが可能な高速なルータやハブ類などのネットワーク機器なども購入する予定である. また,今年度はIEEEのComputer Intelligence Soceityが主催するSCCIがシンガポールで開かれるので,そこで研究発表を行い,また,様々な人工知能分野の応用例の情報収集を行う予定である.さらに,11月には韓国でICONIP2013が行われるので,本研究課題に関連して博士前期課程,後期課程の学生と共同で研究を行っている研究内容に関して発表を行い,情報収集を行う予定である.
|