研究課題/領域番号 |
23530968
|
研究機関 | 独立行政法人大学入試センター |
研究代表者 |
大津 起夫 独立行政法人大学入試センター, 研究開発部, 教授 (10203829)
|
研究分担者 |
宮埜 壽夫 独立行政法人大学入試センター, 研究開発部, 教授 (90200196)
|
キーワード | 多変量データ解析 |
研究概要 |
心理学をはじめとする行動諸科学および社会科学研究においては,多変量統計データの統計分析が,研究を進める上で重要な役割を果たしており,適用領域の拡大とともに分析対象となるデータの規模も急速に大型化してきている。本研究においては,近年進展の著しいコンピュータの並列処理機能(マルチコア化)を前提に,これまで心理統計および心理測定分野で開発されてきた統計モデル(特に,大規模な非線形の潜在変数モデルと区間データを対象とする多次元尺度法)の高速な推定法の検討と実装を行う。また,大規模なテストデータを対象としてモデルの推定を行い,特に試験問題の潜在構造と難易度比較についての分析例を示す。 本研究では,並列計算により大きな効率化の望める領域に重点をおき,計算方法の改善,その実装,および実データへの適用(特に大規模学力試験の分析)を行う。具体的には,潜在変数を用いた非線形の統計モデルの推定,および大規模な多次元尺度構成法における計算の高速化を目標としている。 本年度(平成24年度)においては,以下の2点について成果を得た。1) 並列計算環境の調査とプログラミングの試作を行った。特に近年技術計算への利用が広まっているGPUを用いたプログラミング環境の整備を行い,統計計算プログラムの試作を行った。2) 制約論理プログラミングCLP(FD)を用いた,離散多変量データの条件付き尤度推定プログラムを作成し,センター試験における受験生の属性と科目選択の関係を調べた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(理由) 平成23年度までの研究においては,マルチコアCPU上でOpenMPの機能を用いて,マルチスレッドのプログラムを作成し,これによって統計計算の高速化を図ることを主たる目標としていた。しかしながら,GPU(本来は画像処理のための専用プロセッサ)を数値計算に転用するための技術環境の進展が急速であり,また特に大量データを対象とする統計計算においては,この利用により大きな効率化が望めると予測されるため,主たる開発目標をGPUを用いたプログラム作成に変更し,このための開発環境をハードウェアを含め整備した。この環境を利用した基礎統計量の導出を行うプログラムの試作と評価を継続中である。 また,当初予定していた多次元尺度構成法のプログラムの高速化については、開発プラットフォームの変更により,プログラムの開発が未完成ではあるが,平成23年度に開発をおこなった多倍長精度に対応した組み合わせ数の計算プログラムと,論理プログラミングシステム上の制約解消システム(制約論理プログラミング(CLP(FD)))を用いて,周辺度数の制約がある場合の多重分割表の確率分布を正確に計算するプログラムを開発し,これを利用することによりセンター試験における科目選択における性別による影響の推定を行い,日伊分類学会(JCS-CLADAG 2012)にて成果を発表した。
|
今後の研究の推進方策 |
平成25年度は平成24年度までの成果をもとに,以下のように研究を進める。 1) 平成24年度までに整備を行った計算環境とプログラムを前提として,多変量の潜在変数モデルにおける尤度計算の高速化を行う。特に,連続変数と離散値が混在する多変量データに対応したモデルのための計算を目標とし、高速化を図る。 2) 多次元尺度構成法とその拡張(シンボリック多次元尺度構成法)のための計算の高速化を,GPU上の汎用計算(GPGPU)を用いて実現する。研究分担者の宮埜は,当初平成24年度までの所属の予定であったが,平成25年度においても当該研究機関において研究を継続することが可能となったため,引き続き研究に参加する。
|
次年度の研究費の使用計画 |
平成25年度においては,平成24年度までに整備した計算環境を利用し,上記の推進方策にしめしたプログラムの作成と評価とに注力する。主たる経費の利用目的は、研究資料(図書、論文)などの取得、ソフトウェアライセンスの継続費用,ハードウェアの拡張および補修,および研究交流のための旅費である。 また,平成24年からの繰越金は,主に宮埜の研究活動のために用いる。
|