研究課題/領域番号 |
17K04103
|
研究機関 | 立命館大学 |
研究代表者 |
中井 美樹 立命館大学, 産業社会学部, 教授 (00241282)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 社会調査データの分析 / ランダム行列理論 / 共分散行列 / 欠損値データの処理 |
研究実績の概要 |
本プロジェクト初年度である平成29年度には、主に3つの課題、(1)行列理論の応用と欠損値を含む大規模社会調査データセットの最適化、(2)反復調査データの分析、(3)国際学会での成果の報告、を柱に研究に取り組み成果をあげた。第一の成果は具体的には、社会調査データにほぼ必然的に発生しうる欠損値の問題に関し、欠損値が存在するデータセットを扱う際によく用いられるリストワイズ削除法を適用する場合の最適化の手法を提案した。新規のアルゴリズムにより、回答者と変数からなる最適なデータセットを選択して分析対象とすることができる。さらにこれを実行するためのアルゴリズムを Matlab およびRにより作成した。第二について具体的には、反復社会調査データを用いた分析を進める中で、複数年次にわたる繰り返しのクロスセクション調査を扱う際の、データの欠損のために生じる可能性のあるバイアスについて検討を行った。年次によって欠測サンプルによる推定のバイアスが生じる可能性があるため、サンプリングウェイトを考慮した分析を進めた。この研究はミラノビコッカ大学の研究協力者との共同研究により進めており、知見は論文(英語)としてまとめている最中である。(1)および(2)の一部の研究成果については国際学会(IFCS2017 および CLADAG2017)において報告し、手法の応用領域についてや、欠損データの対処手法についてなど多様なフィードバックを得ることができた。近年の統計分析技法の顕著な発展に比して、欠損データへの対処手法は調査データ分析においてはあまり注意が払われないが、起こりうる推定バイアスを回避するための技法という点で、本研究成果は重要な意義を持つ。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度の目標としていた課題、とくに欠損データを含むデータセットの諸課題について成果をあげた。行列理論の応用による新たなアルゴリズムにより変数選択手法を提案し、その提案手法を社会学的なデータセットに応用した。最適な変数選択の計算過程で浮上した課題に取り組むため、複数の社会学的な大規模データセット(2015年SSP調査データおよびHomeless Management Information System (HMIS)によるホームレス調査データ)に提案手法を応用した研究を進め、その成果の一部は国際学会において発表を行ってきた。研究実績の概要に示したように、2017年7月と9月の国際学会での研究成果の発表(東京およびイタリア・ミラノ)では、行列理論の応用についてや欠損のあるデータセットへの対処に関する新たな手法の提案などを行い、多様なフィードバックを得ることができ、本研究の意義とその課題をあわせて示すとともに今後の研究を深化させることに繋がったと考える。発表へのコメントなどから課題への対処や新たな課題が明確になり、国際学会での議論を契機として新たな国際共同研究の開始にも結びついており、2018年よりミラノビコッカ大学の共同研究者とともに共同研究に取り組んでいるところである。 国際学会報告において情報交換を行うとともに、プログラミング言語Rによるパッケージの作成にすでに着手した。この点において、欠損値への対処技法を備えた各種アプリケーション・パッケージとの比較およびプログラムの作成という次年度の研究目標を速やかにスタートできる状況にもある。
|
今後の研究の推進方策 |
平成30年度は、第一に、欠損値を含むデータセットを解析する際に最適な変数選択を行い最適なデータセットを得る技法を提案する。変数選択についての既存研究における議論(先験的情報がある場合の変数選択の考え方、情報量基準など)を再検討し、提案手法の改善に取り組む。第二に、本研究で提案する手法の実行を可能とするプログラムを作成し公開する予定である。本研究が取り組む課題である、1)幾何学的枠組みに基づく大規模な相関行列の計算のためのプログラム、2)ランダム行列理論に基づくノイズの除去、および 3) 欠損値問題への応用手法、を可能とするプログラムを公開することを計画している。第三に、複数年次にわたる繰り返しのクロスセクション調査を扱う際の、データの欠損のために生じる可能性のあるバイアスについて検討を行う。昨年度より取り組んでいる、サンプリングウェイトを考慮した分析を進める。この研究はミラノビコッカ大学の研究協力者との共同研究により進めており、今年度中に成果を論文(英語)としてまとめる。近年の統計分析技法の顕著な発展に比して、欠損データへの対処手法は調査データ分析においてはあまり注意が払われないが、起こりうる推定バイアスを回避するための技法という点で、本研究成果は重要な意義を持つ。 上記の研究遂行は研究協力者との連携を通じて全体テーマを学際的・総合的に推進する。海外の研究協力者とは、日常的には電子メールなどオンラインによる情報の共有を図るとともに、本格的な議論を展開し新たな知見を見いだしていくための研究会開催を年2回程度予定している。
|
次年度使用額が生じた理由 |
(理由) 平成29年度は、当初予定していたラップトップパソコンの購入を次年度に延ばし、既存のデータセット分析の精緻化に注力した。また、3月初旬(平成29年度内)に行った研究打合せのための海外出張の旅費執行が年度内に執行せず次年度になったため、次年度使用額として残っている。その点以外は、ほぼ予定通りに予算を執行した。 (使用計画) 昨年度に行った海外出張旅費の平成29年度未執行分の執行がまず行われる予定である。研究2年度目も、海外(米国)の共同研究者の協力を得ながら、年2~3回の研究会を開催し連携を積極的に進めながら研究推進を行う予定である。そのため、年に数度の研究打合せ旅費を計上している。
|