• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

仮想並列計算機を活用したデータ解析法の開発と実装に関する研究

研究課題

研究課題/領域番号 14780165
研究種目

若手研究(B)

配分区分補助金
研究分野 統計科学
研究機関北海道大学

研究代表者

南 弘征  北海道大学, 情報基盤センター, 助教授 (80261395)

研究期間 (年度) 2002 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2003年度: 1,400千円 (直接経費: 1,400千円)
2002年度: 2,100千円 (直接経費: 2,100千円)
キーワード計算機統計学 / 並列データ解析 / 高速アルゴリズム / 仮想並列計算機環境
研究概要

本研究は,既存のパーソナルコンピュータをコンピュータネットワークで相互接続した仮想並列計算機環境において,並列計算機に適したデータ解析法・アルゴリズムを開発,実装するとともに,仮想並列計算機上であることをユーザに意識させることなく利用可能なグラフィカルインタフェースの構築を目的とする.
平成15年度においては,平成14年度に得られた知見に基づき,並列計算機上で有効な,新たな解析手法を開発,検討するとともに,インターネットと親和性の高い,並列データ解析用のグラフィカルユーザインタフェースを構築することを目的とした.
具体的な研究内容としては,平成14年度中に実装したブートストラップ法に加え,アルゴリズム中の部分計算の分割が容易であり,かつ,初期値が結果に及ぼす影響の大きいk-means法の並列化を行い,有効性を比較検討した.また,各々の代表的手法における仮想並列計算機内での挙動詳細を精査すべく,中途過程の履歴をGUIにより図示させ,アルゴリズムによる挙動の差異を確認した.その結果,代表的な探索的データ解析手法において,複数の部分計算の粒度が均一でない場合においても,MPIライブラリによる実装が安定した挙動を示すこと,PVMライブラリによる実装では,各ノードにおいて待ち時間が発生し,効率的計算という観点からは疑義が認められることなどが明らかになった.
以上から,仮想並列計算機環境は既存の手法への応用可能性が充分であり,並列実行を前提とした新手法の開発を待たずとも有用性を検証することができた.また,各並列化ライブラリ用に開発されたインタフェース環境を基本としながらも組み合わせを工夫することで,並列実行環境を整え得ることも明らかとなった.今後も,これらの成果に基づく改善を継続していきたい.なお,成果以外にも,仮想並列計算機の実装を視野に入れた応用に関する内容を原著論文および国際会議等で公開した.

報告書

(2件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (17件)

すべて その他

すべて 文献書誌 (17件)

  • [文献書誌] H.Minami: "Empirical Study of Parallel-oriented Statistical Procedure"Bulletin of the International Statistical Institute. Book 2. 51-52 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 南 弘征: "高速計算機環境の多様化と計算機統計学との接点"計算機統計学. 15-2(印刷中). (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] S.Hiro, Y.Komiya, H.Minami, M.Mizuta: "Hall Type Projection Index for Relative Projection Pursuit"Bulletin of the International Statistical Institute. Book 1. 492-493 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Y.Sato, H.Minami, M.Mizuta: "Adaptive Spain Filtering with Text Mining"Bulletin of the International Statistical Institute. Book 2. 371-372 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] T.Shimamura, H.Minami, Y.Komiya, M.Tada, T.Moriuchi, M.Mizuta: "Penalized Regression Modeling for Gene Expression Data Analysis"Bulletin of the International Statistical Institute. Book 2. 426-427 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 弘 新太郎, 小宮由里子, 南 弘征, 水田正弘: "経験分布関数を用いた新たな射影指標の提案"応用統計学. 32-1. 17-29 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 南 弘征: "データ解析とコンピュータネットワークの相補関係に関する考察"統計数理研究所「統計科学情報の高度利用」研究会報告集. 47-54 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 南 弘征, 水田正弘: "仮想並列計算機によるデータ解析の実行時間に関する考察"計算機統計学. 14・2. 111-122 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Minami, H., Mizuta, M.: "Evaluation of Execution Time on data Analysis with Parallel Virtual Machine"Journal of the Japanese Society of Computational Statistics. 15(In press). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Minami, H., Mizuta, M.: "Comparative study of PC cluster environments in statistical computing"Proceedings of the 4th Conference of Asian Regional Section of the International Association for Statistical Computing. 151-154 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Ohgiya, A., Komiya, Y., Minami, H., Mizuta, M.: "Search for the effective dimension reduction directions in Sliced Inverse Regression model with ICA"Proceedings of the 4th Conference of Asian Regional Section of the International Association for Statistical Computing. 5-8 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Sato, Yu., Minami, H., Mizuta, M.: "Analysis of spam mail based on email contents"Proceedings of the 4th Conference of Asian Regional Section of the International Association for Statistical Computing. 12-14 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Shimamura, T., Minami, H., Mizuta, M.: "Discrimination with Variable Selection for the Ananlysis of Microarray Data"Proceedings of the 4th Conference of Asian Regional Section of the International Association for Statistical Computing. 118-121 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 島村徹平, 南 弘征, 小宮由里子, 多田光宏, 守内哲也, 水田正弘: "cDNAアレイデータに基づくp53遺伝子の判別モデルについて"2002年度統計関連学会連合大会講演報告集. 70-71 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 小宮由里子, 南 弘征, 水田正弘: "関数多次元尺度構成法に関する考察"2002年度統計関連学会連合大会講演報告集. 251-252 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 佐藤祐介, 南 弘征, 水田正弘: "判別分析によるスパムメールの解析"2002年度統計関連学会連合大会講演報告集. 459-460 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 南 弘征: "データ解析の並列化におけるPVMとMPIの特性について"第16回目本計算機統計学会シンポジウム論文集. 151-152 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi