2013 Fiscal Year Research-status Report
計量心理モデルにおける統計的推定の高速化と大規模データへの応用
Project/Area Number |
23530968
|
Research Institution | The National Center for University Entrance Examinations |
Principal Investigator |
大津 起夫 独立行政法人大学入試センター, 研究開発部, 教授 (10203829)
|
Co-Investigator(Kenkyū-buntansha) |
宮埜 壽夫 独立行政法人大学入試センター, 研究開発部, 教授 (90200196)
|
Keywords | 多変量統計モデル / 計量心理 / 並列計算 |
Research Abstract |
心理学をはじめとする行動諸科学および社会科学の研究においては,多変量統計データの統計的分析が,研究を進める上で重要な役割を果たしており,適用領域の拡大とともに分析対象となるデータの規模も急速に大型化してきている。本研究においては,近年進展の著しいコンピュータの並列処理機能(マルチコア化)を前提に,これまで心理統計および心理測定分野で開発されてきた統計モデル(特に,大規模な非線形の潜在変数モデルと区間データを対象とする多次元尺度法)の高速な推定法の検討と実装を行う。また,大規模なテストデータを対象としてモデルの推定を行い,特に試験問題の潜在構造と難易度比較についての分析例を示す。 本年度達成度または研究の成果 1)非線形因子分析の尤度計算に,OpenMP(マルチコアを用いた共有メモリ方式による並列化支援機能)による並列計算を実装し,計算の高速化を実現した。センター試験の科目得点を対象にした計算例では,4コアあるいは6コアのワークステーション上で,シングルスレッドに比べ1/3~1/4に計算時間を短縮することができた。 2)OpenMPを用いた文字列検索機能の高速化を行い,対話的な記号処理言語と組み合わせることにより,長文の文書間での任意文字列の一致箇所の列挙を高速に行う機能を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成24年度までの研究において整備した環境によって,並列計算を計量心理分野に係る統計計算の高速化を,以下の2つについて実現した。整備した計算機環境にて利用可能な並列計算方法は,マルチコアCPUの機能を用いるOpenMP、およびグラフィックス用の拡張計算ボード(GPU)を用いる方法である。これらのうち,本年度の成果は、主としてOpenMPの利用によるものである。 成果のうちのひとつは,当初計画と隣接する課題であるが,試験問題作成を意図したテキスト中の文字列検索に係るものである。実用的には,試験問題文の内容の重複特に,2つのかなり長い文書間の任意の一致文字列の一致箇所を列挙するものである。現状での文字列探索は、ナイーブなアルゴリズムによるものであるが,並列化が有効に機能する問題であり,ほぼコア数に比例した速度を実現できる。この成果については,日本テスト学会第11回大会(九州大学)にて発表した。 もうひとつの成果は,潜在変数をもつ多変量統計モデル(非線形因子分析モデル)の推定の高速化である。これについてもOpenMPを用いることで,計算の高速化を実現した。基本的なモデルと推定アルゴリズムは,既に開発済みのものであるが,特に大量のデータを対象にすると,極めて長時間の計算が必要であった。このモデルに尤度計算の部分に,並列化を適用することにより,6コアのCPU上で,従来の3倍程度の速度での計算の実行が可能になった。これを用いて,不規則な欠測パターンのある複数のテストスコアの等化曲線の推定や,このモデルについてのブートストラップ計算が実用的になった。大学生を被験者とするセンター試験問題と英語外部試験の間の等化曲線の推定については,日本心理学会第77回大会(札幌)にて発表した。また,センター試験の科目別得点の分析にも利用した。後者の結果については,大学入試センター内の報告書に結果を示した。
|
Strategy for Future Research Activity |
これまで並列化を実現し、公表した成果はいずれもOpenMPによるものである。GPUの利用については,すでに開発環境を整備し,いくつか試験的な計算を実現はしているが,込み入った多変量統計モデルへの効率的な適用には至っていない。また,多次元尺度構成法の高速化の実現も,課題として残っている。本最終年度においては、GPUを利用して一層の推定の高速化を非線形因子分析モデルと多次元尺度法において実現することを目標とする。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度に計画していた研究分担者宮埜の出張計画が,本務などの都合により平成26年度に延期されたため,平成26年度の出張費用に用いる。 平成26年度においては,平成26年度までに整備した計算機環境,およびこれまでに作成した並列化プログラムをもとに,特にGPUを用いて高速計算手法を計量心理モデルに適用することに注力し,また国際学会での成果発表および研究交流を行う。主たる経費の利用目的は、ソフトウェアライセンスの継続費用,計算機のハードウェア修理および増強のための部品購入,海外出張のための費用である。
|
Research Products
(3 results)