• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自然言語処理技術を適用した自由回答コーディング支援システムの開発

研究課題

研究課題/領域番号 16530341
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 社会学
研究機関敬愛大学

研究代表者

高橋 和子  敬愛大学, 国際学部, 助教授 (30211337)

研究分担者 高村 大也  東京工業大学, 精密工学研究所, 助手 (80361773)
研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
2,800千円 (直接経費: 2,800千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
2004年度: 1,700千円 (直接経費: 1,700千円)
キーワード自由回答 / コーディング支援 / 機械学習 / サポートベクターマシン / 自然言語処理 / クラス所属確率推定 / 分類スコア / NANACO / クラス事後確率 / 平滑化 / 職業コーディング / タグ付け / ルールベース
研究概要

研究成果は、社会調査において代表的な自由回答である職業データのコーディング(「職業コーディング」)において、コーダ(人間)を支援する「NANACOシステム」を完成させたことである。システムは職業データに限定されるものではなく、「分類カテゴリーをもつ」自由回答であれば適用可能である。
1.まず、支援するための最優先課題は、事例に対して高精度なコーディング(分類)結果を提示することである。このために、自然言語処理分野の中でも特に「文書分類」における先端的な技術を応用し、職業分類コードを決定するルールを辞書にまとめて利用する手法(「ルールベース手法」)と、過去の事例を訓練データとして用いる「機械学習による手法」を有機的に組み合わせた手法を考案し有効性を示した。2.次に、システムを利用したコーダ達からもっとも要請の高かった「分類結果に対するシステムの確信度(クラス所属確率)」を付与した。クラス所属確率の推定をできる限り正確に行う方法として、訓練データにおける複数次元の分類スコアを用いて作成した「正解率表」を利用する方法を考案し有効性を示した。3.さらに、コーダの作業そのものを支援するために、「分類カテゴリーの定義ファイルの閲覧」「コーディング時に参照したいデータの表示」「注意マークの付与」などの機能も充実させた。4.現在は提示情報のすべてをバッチにより作成しているが、今後は一部をWeb処理に移行する予定である。5.システムは、2003年SSM予備調査、JGSS-2005調査、2005年SSM調査(産業コーディングも)に適用された。今後、2005年SSM若年層調査(2007年3月)、JGSS-2006調査(ISCO ; International Standard Classification of Occupationsコードによるコーディングも)(2007年5月)が予定されている。

報告書

(3件)
  • 2005 実績報告書   研究成果報告書概要
  • 2004 実績報告書
  • 研究成果

    (19件)

すべて 2007 2006 2005 2004

すべて 雑誌論文 (19件)

  • [雑誌論文] Estimation of Class Membership Probabilities in the Document Classification2007

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Lecture Notes in Artificial Intelligence (LNAI)(published by Springer-Verlag Berlin Heidelberg) Vol.4426

      ページ: 284-295

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Estimation of Class Membership Probabilities in the Document Classification2007

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Lecture Notes in Artificial Intelligence (LNAI)(Springer-Verlag Berlin Heidelberg) Vol. 4426

      ページ: 284-295

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 分類スコアに基づいたクラス事後確率の推定2006

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

    • NAID

      110002973365

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 実績報告書 2005 研究成果報告書概要
  • [雑誌論文] Transforming Scores from a Classifier into Posterior Probability Estimates2006

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Proceedings : 12th Conference of the Association for Natural Language Processing

      ページ: 376-379

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 職業コーディング支援システム(NANACO)の開発とJGSS-2003における適用2005

    • 著者名/発表者名
      高橋和子, 須山敦, 村山紀文, 高村大也, 奥村学
    • 雑誌名

      <文部科学省指定学術フロンティア推進研究プロジェクト>JGSS Research Series 日本版General Social Surveys研究論文集(4) JGSSで見た日本人の意識と行動(東大社会科学研究所資料集)

    • NAID

      110007721984

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 実績報告書 2005 研究成果報告書概要
  • [雑誌論文] 機械学習とルールベースの組み合わせによる自動職業コーディング2005

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      言語処理学会論文誌 自然言語処理 Vol.12 No.2

    • NAID

      10015447288

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 実績報告書 2005 研究成果報告書概要
  • [雑誌論文] Automatic Occupation Coding with Combination of Machine Learning and Hand-Crafted Rules2005

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Lecture Notes in Artificial Intelligence (LNAI)(published by Springer-Verlag Berlin Heidelberg) Vol.3518

      ページ: 269-279

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 分類スコアに基づいたクラス事後確率の推定2005

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      情報処理学会研究報告 2005-NL-170 Vol.2005 No.170

    • NAID

      110002973365

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Applying the Automatic Occupation Coding Supporting System for Coders (NANACO) in JGSS-20032005

    • 著者名/発表者名
      Kazuko Takahashi, Atsushi Suyama, Norifumi Murayama, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      JGSS Monographs, Institute of Regional Studies(University of Tokyo [eds.]) (Osaka University of Commerce, and Institute of Social Science) No.4

      ページ: 225-241

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Automatic Occupation Coding with Machines Learning and Hand-Crafted Rules2005

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Journal of the Natural Language Processing Vol.12 No.2

      ページ: 3-24

    • NAID

      10015447288

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Automatic Occupation Coding with Combination of Machine Learning and Hand-Crafted Rules2005

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Lecture Notes in Artificial Intelligence (LNAI)(Springer-Verlag Berlin) Heidelberg Vol.3518

      ページ: 269-279

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Transforming Scores from a Classifier into Posterior Probability Estimates2005

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      2005-NL-170(16) IPSJ (Information Processing Society of Japan) SIG/NL (Special Interest Group of Natural Language Processing) Technical Reports

      ページ: 97-104

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Automatic Occupation Coding with Combination of Machine Learning and Hand-Crafted Rules2005

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Lecture Notes in Artificial Intelligence(LNAL) (published by Springer-Verlag Berlin Heidelberg) Vol.3518

      ページ: 269-279

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 分類スコアに基づいたクラス事後確率の推定2005

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      情報処理学会研究報告 2006-NL-170 Vol.2006 No.6

      ページ: 97-104

    • NAID

      110002973365

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 職業コーディング支援システム(NANACO)の開発とJGSS-2003における適用2005

    • 著者名/発表者名
      高橋和子, 須山敦, 村山紀文, 高村大也, 奥村学
    • 雑誌名

      <文部科学省指定学術フロンティア推進研究プロジェクト>JGSS Research Series日本版General Social Surveys研究論文集(4)JGSSで見た日本人の意識と行動(東大社会科学研究所資料集)

      ページ: 225-241

    • NAID

      110007721984

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 機械学習とルールベースの組み合わせによる自動職業コーディング2005

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      言語処理学会論文集 自然言語処理 Vol.12 No.2(3月31日予定)

    • NAID

      10015447288

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] ルールベース手法と機械学習による自由回答の分類-職業コーディング自動化の方法-2004

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      数理社会学会論文誌 理論と方法 36 Vol.19 No.2

    • NAID

      110000991720

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Classification of Responses to Open-ended Questions with Machine Learning and Hand-Crafted Rules : Automatic Occupation Coding Methods2004

    • 著者名/発表者名
      Kazuko Takahashi, Hiroya Takamura, Manabu Okumura
    • 雑誌名

      Journal of the Japanese Association for Mathematical Sociology Vol.19 No.2

      ページ: 177-196

    • NAID

      110000991720

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] ルールベース手法と機械学習による自由回答の分類-職業コーディング自動化の方法-2004

    • 著者名/発表者名
      高橋和子, 高村大也, 奥村学
    • 雑誌名

      数理社会学会論文誌 理論と方法 36 VoL.19 No.2

      ページ: 177-196

    • NAID

      110000991720

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi