• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

計量心理モデルにおける統計的推定の高速化と大規模データへの応用

Research Project

Project/Area Number 23530968
Research InstitutionThe National Center for University Entrance Examinations

Principal Investigator

大津 起夫  独立行政法人大学入試センター, 研究開発部, 教授 (10203829)

Co-Investigator(Kenkyū-buntansha) 宮埜 壽夫  独立行政法人大学入試センター, 研究開発部, 教授 (90200196)
Project Period (FY) 2011-04-28 – 2015-03-31
Keywords多変量データ解析 / 潜在変数 / 記号処理 / 並列計算
Research Abstract

心理学をはじめとする行動諸科学および社会科学の研究においては,多変量統計データの統計的分析が,研究を進める上で重要な役割を果たしており,適用領域の拡大とともに分析対象となるデータの規模も急速に大型化してきている。本研究では,並列計算により大きな効率化の望める次の4点に重点をおき,計算方法の改善,その実装,および実データへの適用(特に大規模学力試験の難易度分析)を行う。1)直接には観測されない潜在変数の存在を仮定し,この潜在変数と観測変数の期待値との間に非線形の関係を仮定するモデル(非線形因子分析およびIRTの拡張モデル)の尤度計算の高速化 2)シンボリックデータ(数値の区間によって表現されるデータ)を対象とする大規模MDSの推定の高速化。 3)最尤推定に用いられる数値最適化(準ニュートン法およびEMアルゴリズム)の並列化による高速化 4)大規模試験データへモデルを適用し,特にMDSと潜在変数モデルを利用して試験を構成する設問の潜在構造と難易度の特徴を明らかにする。 本年度の研究成果は次のようなものである。1) マルチコアおよびGPGPUを用いて統計計算を行うための計算機環境,特にソフトウェア環境の整備をおこなった。(GPUGPUボードの導入,および並列計算に対応したコンパイラとアプリケーションプログラムを導入した。)2) マルチコアを用いた計算法,特にOpenMPおよびGPGPUの線形計算および統計計算への利用法について調査した。3) 大きな数の組み合わせの計算に対応するため,多倍長整数計算ライブラリの確率計算への利用法について調査した。また,大規模データの基礎統計量を求めるためのユティリティプログラムの整備を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成23年度の実施計画の主要な課題は次の2点である。1)高速な推定を可能とするためのプログラム開発方法の選択:ここでは心理学や社会科学研究における一般的な環境を想定し,単独の計算機システムを主な対象とした並列化の方法を検討する。平成23年度における検討から,第1にOpenMPを主要な開発ツールとして用いることとした。また,加えて、より高速な方法の実現のために,特殊なハードウェアを必要とはするが,GPGPU(特にCUDAおよびOpenCL)を用いて一部の開発を行うこととした。2)計量心理学モデルにおける基礎統計導出の効率化:これについては,一般的な頻度集計を高速に行うためのC++関数および、多倍長精度整数の表現機能(GMP)を用いた組み合わせ数の計算のための関数(多項分布の導出に必要)を作成した。 いずれの課題についても,計画に予定した目標を達成した。

Strategy for Future Research Activity

平成24年度は、平成23年度の成果をもとに,以下のように研究を進める。1)基礎統計量導出化の効率化の拡張 これらに対応したソフトウェアの開発と改善を継続する。特に,条件付き正規分布モデル(Conditional Gaussian)(対数線形モデルと多変量共分散分析モデルの上位クラスに相当し,汎用性が大きい)のための十分統計量の導出の高速化を目標として開発を引き続き行う。また、多次元尺度構成法への応用を念頭に,2つの対象の対によって定義されるポテンシャル関数の並列化による高速計算の方法を実現する2)シンボリックデータ(区間データ)のための多次元尺度法(MDS)の高速化ノンメトリックMDSは多量の計算を必要とする計量心理モデルの典型であり,これもまた並列化による推定の効率化を期待できるテーマである。このモデルための高速な推定アルゴリズムとその実装を行う。分担者宮埜は,このテーマについて研究の蓄積があり,これまでに得られた成果をもとにさらに大規模データへの適用を試みる。

Expenditure Plans for the Next FY Research Funding

平成23年度の調査結果をもとに,高速計算を実現するためのハードウェアおよびソフトウェアの整備を引き続き行う。平成23年度当初に計画していた海外学会への参加を本務との関係で中止としたため,このための予算約43万円を平成24年度に繰り越して利用する。 購入を予定しているのは,汎用品のワークステーションと,高速化のための部品(GPUボード)およびソフトウェアであるため,個別に50万円を超える物品の購入は予定していない。物品費としては書籍資料費を含め70万円を予定している。旅費としては,海外への学会参加2件に関し約70万円を使用する予定である。平成23年度からの繰り越し分は,おもに海外旅費に使用する。また、データ入力、英文校閲、別刷り費用として33万円を使用する予定である。

  • Research Products

    (5 results)

All 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

  • [Journal Article] Prologを用いたXMLパーザによる統計情報の分析と表示2011

    • Author(s)
      大津起夫
    • Journal Title

      応用統計学

      Volume: 40 Pages: 173-191

    • Peer Reviewed
  • [Journal Article] 非線形因子分析によるセンター試験英語問題の難易度比較2011

    • Author(s)
      大津起夫,橋本貴充
    • Journal Title

      日本テスト学会誌

      Volume: 7 Pages: 1-14

    • Peer Reviewed
  • [Presentation] 条件付き尤度による層別多重分割表の分析2011

    • Author(s)
      大津起夫
    • Organizer
      第39回日本行動計量学会
    • Place of Presentation
      岡山理科大学(岡山市)
    • Year and Date
      2011年9月13日
  • [Presentation] 大学入試センター試験科目別得点の非線形因子分析による難度比較2011

    • Author(s)
      大津起夫
    • Organizer
      北海道心理学会・東北心理学会第11回合同大会
    • Place of Presentation
      北翔大学(札幌市)
    • Year and Date
      2011年8月20日
  • [Presentation] Comparing test difficulties of NCT English examinations using non-linear factor analysis.2011

    • Author(s)
      Otsu,T. , Hashimoto,T.
    • Organizer
      The 17th International Meeting of the Psychometric Society
    • Place of Presentation
      香港教育学院(香港)
    • Year and Date
      2011年7月19日

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi