研究課題/領域番号 |
22530516
|
研究機関 | 敬愛大学 |
研究代表者 |
高橋 和子 敬愛大学, 国際学部・国際学科, 教授 (30211337)
|
研究分担者 |
田辺 俊介 東京大学, 社会科学研究所, 准教授 (30451876)
吉田 崇 東京大学, 社会科学研究所, 助教 (80455774)
|
キーワード | 社会調査 / Web公開システム / 自由回答 / 産業・職業自動コーディグ支援システム / ISCOコーディング / サポートベクターマシン / クラス所属確率 / アンサンブル学習 |
研究概要 |
本研究では、昨今大規模化する社会調査において、自由回答を少ない労力で正確に基礎データに変換し随時提供できるシステムを開発し、各研究者が自分のパソコンからデータを送信すれば、人間のチェックの要/不要も付与した自動コードの結果が得られるシステムを構築中で、具体的には「産業・職業自動コーディング」を対象とする。 初年度である平成22年度の成果は以下の通りである。「研究実施計画」(1)[システム公開]におけるシステム構成が最も単純なルールベース手法による職業自動コーディングシステムのWeb公開については、Web公開に向けプログラム整備を完了した(学会発表「職業・産業自動コーディングシステムのWeb公開に向けて」)。ただし、公開の場である東大社研HPが平成23年度初めに更新予定となったために、公開は次年度に変更。次年度は機械学習手法によるシステムのプログラム整備も完了し、公開を予定。(2)[新システム開発]におけるISCO自動コーディングの性能向上において、(c)有効なアンサンブル学習手法を提案については、手法を提案し有効性の確認実験中である(学会発表「クラス所属確率を用いたアンサンブル学習」「クラス所属確率を用いた多クラスSVMにおけるアンサンブル学習」)。(a)訓練データ増量のために新規データに対する人手によるISCOコード付与については、研究代表者が嘱託研究員であるJGSS(日本版総合的社会調査)プロジェクトの許可によりISCOコードが付与されたデータセット(JGSS-2006、2008、2010)が利用できることになったために取りやめ、すでに利用中の2005SSMデータセットと併せて、ISCO自動コーディングにおける有効な訓練事例を決定するための実験を行った(雑誌論文「ISCO自動コーディングシステムの分類精度向上に向けて一SSMおよびJGSSデータセットによる実験の結果」)。(b)システム既処理データについてのエラー解析については、今年度行えなかったために次年度の課題とする。
|