2015 Fiscal Year Annual Research Report
社会調査の基盤を提供する自動コーディングシステムのWeb提供:その国際化と汎用化
Project/Area Number |
25380640
|
Research Institution | Keiai University |
Principal Investigator |
高橋 和子 敬愛大学, 国際学部, 教授 (30211337)
|
Co-Investigator(Kenkyū-buntansha) |
多喜 弘文 法政大学, 社会学部, 講師 (20634033)
田辺 俊介 早稲田大学, 文学学術院, 准教授 (30451876)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 社会調査 / 職業・産業コーディング自動化システム / ルールベース手法と機械学習の組み合わせ手法 / 国内/国際標準職業コード / 国内/国際標準産業コード / 確信度 / Webによる一般公開 |
Outline of Annual Research Achievements |
前年度までの成果として、職業・産業コーディング自動化システムは、Webを通じた利用サービス(東京大学社会科学研究所附属社会調査・データアーカイブ研究センター(CSRDA))の試行提供が開始されたため、利用者は所定の形式の入力ファイルをアップロードすれば、希望に応じて、最大4種類までの国内/国際標準職業・産業コードに変換された確信度付きの結果ファイルをダウンロードできるようになった。 今年度の成果は次のとおりである。(1)システムの分類精度(特にSSM職業コード)をさらに向上させるため、ルールベース手法における2つのシソーラス(述語シソーラスと名詞シソーラス)とルールを見直し、必要な修正を行った(2)SVMにおける訓練事例(SSM職業コード)の正解を現状に合わせたものへと修正を開始した(3)当初の計画にはなかったが、本システムが実際に利用される社会階層分野の研究者により、システムの評価を行った(4)当初の計画にはなかったが、本システムのメンテナンスの一部の処理(訓練事例の新規追加)について自動化を行った。 一方で、研究計画としていた「本システムの自由回答一般への拡張」は、懸念していたように研究期間中の完成とはならなかった。しかし、操作画面やアルゴリズムは決定しており、その場合の対応として予定していたように、1年遅れるが、平成28年度中にプログラムを完成する見込みである。 最後に、本システムの開発におけるこれまでの研究成果と合わせて、『職業・産業コーディング自動化システム』を成果報告書としてまとめ、関係する研究者に配布した(122頁)。
|
Research Products
(4 results)