2015 Fiscal Year Research-status Report
社会学的データ分析へのランダム行列理論の応用にかんする研究
Project/Area Number |
26380658
|
Research Institution | Ritsumeikan University |
Principal Investigator |
中井 美樹 立命館大学, 産業社会学部, 教授 (00241282)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 社会調査データの分析 / ランダム行列理論 / 共分散行列 / 欠損値データの処理 |
Outline of Annual Research Achievements |
本プロジェクト2年目の平成27年度には、主に3つの課題、(1)昨年度の研究開始1年目に提案したランダム行列理論にもとづくデータ分析手法の、大規模社会調査データセットへの応用、(2)データ分析の精緻化と、国際学会での成果の報告、(3)欠損値を含むデータ(欠測データ、不完全データ)の問題への対処手法に関する先行研究のレビュー、に取り組み成果をあげた。 第1,第2の成果について具体的には、連続変数とカテゴリカルデータの混在する社会調査データの共分散行列/相関係数行列共分散構造の推定において、ランダム行列理論を適用していわゆる"ノイズ"を除去した相関行列を再構築し、これに基づく種々の分析(主成分分析など)を進めた。この成果は国際学会において報告し、手法の応用領域についてや、欠損データの対処手法についてなど多様なフィードバックを得ることができた。また非対称データ分析を用いた成果報告においては、非対称クラスター分析を用いた分析結果と多次元尺度構成法による結果とを比較し、併用が推奨されるこれらの手法から共通に得られる知見と個別に得られる知見があることを例証した。第三の、社会調査データにほぼ必然的に発生しうる欠損値問題への対処にかんする先行研究レビューからは、慣例的に使用されてきた技法の欠点・課題を明確にするとともに、望ましいとして近年は適用が推奨されている技法である多重代入法(MI)およびEMアルゴリズムを用いた最尤推定、完全情報最尤法(FIML)等について理解を深めた。現在、(3)で得た知見を踏まえつつ、既存の手法と本研究で取り組む手法とを比較しながら適切な手法を定式化している段階である。分析技法の顕著な発展に比して、欠損値への対処手法は調査データ分析においてはあまり注意が払われないが、起こりうる推定バイアスを回避するための技法という点で、本研究成果は重要な意義を持つ。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度の目標としていた、3つの課題、(1)昨年度の研究開始1年目に提案したランダム行列理論にもとづくデータ分析手法の、大規模社会調査データセットへの応用、(2)データ分析の精緻化と、国際学会での成果の報告、(3)欠損値を含むデータ(欠測データ、不完全データ)の問題への対処手法に関する先行研究レビュー、について成果をあげた。研究実績の概要に示したように、2015年7月に行った研究成果の発表(イタリア・ボローニャ)では、手法の応用領域についてや欠損データの対処手法についてなど多様なフィードバックを得ることができ、本研究の意義とその限界をあわせて示すとともに今後の研究を深化させることに繋がったと考える。 欠損値への対処問題についても、学会報告において情報交換を行うとともに、先行研究の収集とレビューを進める中で、既存アプリケーションソフトおよび既に提案されたパッケージの理解を深め、次年度に向けてソフトの環境整備も計画的に進めている。この点において、欠損値への対処技法を備えた各種アプリケーション・パッケージとの比較およびプログラムの作成という次年度の研究目標を速やかにスタートできる状況にある。
|
Strategy for Future Research Activity |
平成28年度は、3つの課題を柱に研究を進める。第一に、社会調査データでは避けられない欠損値問題への対処に、昨年度までに提案した手法を応用することである。欠損値処理の方法として慣例的に用いられてきたリストワイズ除去は分析結果にバイアスをもたらすことが指摘されてきたが、対処法の採用に関しては従来あまり注意が払われてこなかった。近年は利用が推奨される多重代入法(multiple imputation: MI)や最尤推定法などの技法もあり、今年度の研究においては、ここで提案する幾何学的アプローチを応用した手法と従来の手法との比較評価を行う。第二に、最近収集された社会調査データに提案手法を応用することである。すでに昨年度中に、新たに提案した手法を2005年SSM調査データの分析に応用し、その成果を国際学会において報告し、現在、論文を雑誌に投稿中である。今年度は幾何学的手法を欠損値処理への対処にも応用・発展させ、「階層と社会意識全国調査(SSP2015)」を用いてこれら複数の手法の比較を行い、本研究で提案する手法の優位性を示すことを目的としている。計算には、数値計算のためのパッケージである Matlab/Octave の使用を予定している。第三に、研究成果のより積極的な公開と還元を目指して、本研究で提案する手法のためのプログラムとしてのRパッケージを作成し公開する予定である。本研究が取り組む課題である、1)幾何学的枠組みに基づく大規模な相関行列の計算のためのプログラム、2)ランダム行列理論に基づくノイズの除去、および 3) 欠損値問題への応用手法、を可能とするプログラムを公開することを計画している。
|
Causes of Carryover |
研究2年度目も、海外(米国)の共同研究者の協力を得ながら、年2~3回の研究会を開催し連携を積極的に進めながら研究推進を行う予定であったところ、研究代表者が2015年度後期(2015年9月から)は学外研究を得て米国に滞在できることとなり、研究会のために当初予定していた日本-米国間の海外出張のための出張旅費を大幅に節約することにつながった。その点以外は、ほぼ予定通りに予算を執行した。
|
Expenditure Plan for Carryover Budget |
平成28年度は、社会調査データセットの分析について種々の既存の統計アプリケーションソフトと本研究で提案する手法との比較などを行うため、各種の統計アプリケーション(SPSS、AMOS、SAS、Rなど)のインストールと活用が可能な高性能のパソコンおよびストレージを購入しPCの環境を整備する。したがって平成27年度未執行額は平成28年度に使用する予定である。それ以外については平成28年度の交付申請書の計画通りに予算を活用し研究を進める。引き続き、海外(米国)の共同研究者の協力を得ながら研究を推進している予定であり、年に数度の研究会を実施するための研究打ち合わせ旅費および成果発表のための旅費を計上している。
|
Research Products
(3 results)