2013 Fiscal Year Research-status Report
パレート学習型自己組織化マップのマルチモーダル,大規模データ解析への応用
Project/Area Number |
24500279
|
Research Institution | Saga University |
Principal Investigator |
堂薗 浩 佐賀大学, 工学(系)研究科(研究院), 准教授 (00217613)
|
Co-Investigator(Kenkyū-buntansha) |
中國 真教 福岡大学, 公私立大学の部局等, 准教授 (10347049)
|
Keywords | 自己組織化マップ / 大規模データ解析 / 隠れマルコフモデル / ゲノム解析 / IPパケット解析 |
Research Abstract |
平成25年度には,以下のような研究を行った. (1) ゲノム解析への応用に関して,隠れマルコフモデルを用いた自己組織化マップの研究を進め,強化学習アルゴリズムを応用した高速学習アルゴリズムの開発,文字列の頻度を用いたマッピングと組み合わせて学習を高速化する方法について研究を行い,それぞれ,IEEEConference on Computational Intelligence in Bioinformatics and Computational Biology 2013, 14th International Symposium on Advanced Intelligent Systems (ISIS2013)の査読付き国際会議に投稿し,発表を行った. (2) 同じくゲノム解析への応用に関して,ゲノム内の各塩基間の相関係数を入力ベクトルとして,パレート型自己組織化マップを用いて解析を行う方法を開発し,従来の頻度情報に基づく解析手法より低次元のベクトルを用いて高速に同等の解析が可能であることを示し,The IEEE International Conference on Bioinformatics and Biomedicine (BIBM2013)のポスターセッションに投稿し,発表を行った. (3)新たな応用分野として,大規模なプログラミング言語教育における教育支援システムとして,自己組織化マップを用いたC言語学習状況の視覚化手法を提案し,14th International Symposium on Advanced Intelligent Systems (ISIS2013) ,および,14th International Conference on Applied Computer Science (ACS '14)に投稿し,発表を行った. (4)パレート型自己組織化マップを用いた大規模データ解析の1手法として,Computer Generated Hologram SOM: CGH-SOM)の研究を開始し,パケットデータの解析,および,ゲノムデータへの解析への応用に関して研究を進めているが,今のところ,発表には至っていない,
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
25年度までの研究において,自己組織化マップ,および,パレート型自己組織化マップを,ゲノム解析,パケット解析,および,新たな分野として大規模プログラミング言語教育支援システムへの応用について研究を進めている.要素技術としては,隠れマルコフモデルを用いた自己組織化マップに関するアルゴリズムの開発が進んでおり,頻度情報と組み合わせて学習する手法や,強化学習的な学習法で高速化を行う手法について開発し,ゲノムデータの解析を対象に実験を進めている. また,ゲノムデータ解析においては,これまでのシーケンスの頻度を用いた方法に対して,塩基間の相関係数を用いた方法を開発し,パレート型自己組織化マップを用いて,従来の自己組織化マップよりも良好な分類が行えることがを示している.また,昨年度研究を行った文脈情報を用いた場合や頻度情報を用いた場合と比較して,より小さな次元のベクトルで,同等以上の分類が行えることがわかり,相関係数を入力ベクトルとして用いる方法は,大規模データの解析には有用な手段であることがわかった. また.パケットデータやゲノムデータのような大規模データの解析に,大規模データを自己組織化マップを用いて画像データに変換し,その画像データをCGH-SOMを用いて処理することで,大規模データの大域的な特徴を解析する方法を提案し,実験を進めている. また,新たに,プログラミング言語の演習時の学生の状況を自己組織化マップを用いて視覚化する方法を提案し,大規模E-Learningシステムへの応用を考えている.現在の実験は1クラス程度で行っているが,学生の学習の進行状況や,学生間の依存関係等が2次元のマップ上に視覚化され,理論的に計算時間上は,そのまま大規模なクラスやオンラインの学習システムにも適用可能であると考えられる.
|
Strategy for Future Research Activity |
これまでの実験において,パレート型自己組織化マップは従来の自己組織化マップと比較して数倍から十数倍の計算時間を要することがわかった.また,入力データの分布により,類似したデータが多いほどパレート集合が大きくなり,計算時間を要することがわかった.この問題に対して,アルゴリズムの改良や,並列計算手法の適用が考えられる.平成25年度の研究費で超並列演算を行うXeon Phiを搭載したワークステーションを購入しており,パレート型自己組織化マップの並列化を行う予定である. また,現状では各要素技術の開発は進めているが,これらを統合したマルチモーダルな学習方式については不十分な状況である.ゲノム解析においては,これまで用いられてきた頻度情報と相関係数の統合や,隠れマルコフモデルと相関係数や頻度情報の統合,また,DNAシーケンスのアノーテーションデータとの統合等を考えている.パケット解析においては,現在全てのデータを画像データに変換してCGH-SOMで処理を行っているが,数値ベクトルと画像データを統合して学習する方法を検討している.また,これらの手法を用いて,パケットのログからこれまでのアクセス状況を解析するシステムや,リアルタイムに攻撃を検出可能なIDSへの応用を考えている. また,プログラミング言語の教育支援システムにおいては,現在行っている実験では従来の自己組織化マップを用いており,パレート型自己組織化マップへの変更を行い,キーボード入力やマウス入力を別々のベクトルとして統合する方法を検討している. また,さらなる応用分野として,WEBページなどのインターネットから得られる文字情報,画像情報,ページ間のリンク情報等を統合してWEBページの分類を行い,WEB-SOMに代表されるようなページ間の関係の視覚化や検索を行うシステム,WEBページの安全性等を判定するシステム等の開発を行っていきたいと考えている.
|
Expenditure Plans for the Next FY Research Funding |
26年度に開催されるWSOMの旅費の一部にあてるために残した 26年度WSOM2014にて講演時に使用
|