• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実施状況報告書

社会調査におけるテキスト型データ分析支援システムの開発

研究課題

研究課題/領域番号 23730502
研究機関立命館大学

研究代表者

樋口 耕一  立命館大学, 産業社会学部, 准教授 (00452384)

研究期間 (年度) 2011-04-28 – 2014-03-31
キーワード社会調査法 / 内容分析 / テキストマイニング / 質的データ
研究概要

第一に、社会調査における日本語テキスト型データの計量的な分析方法の提案に関しては、既存研究の知見を集約するとともに、意味解析などに関する近年の技術的な側面の研究動向を把握し、本研究の基本的な枠組みと方向性を確定した。ここでは研究文献の検討だけでなく、商用ソフトウェアを複数調達し、試用と評価を行った。具体的にはProvalis Research社のWordStat 6.1、Prof. Roderick P. HartおよびProf. Craig Carrollが開発・販売するDiction 6.0、日本電子計算社および富士通エフ・アイ・ピー・システムズ社によるWordMiner、IBM社のSPSS Text Analytics for Surveys 4.0.1、数理システム社のText Mining Studio 3.1ふろく版などについて評価を行った。 第二に、提案する分析方法を実現するための分析支援システム開発においては、以下の進捗があった。従来は日本語データのみしか分析できなかったが、英語のほか蘭・仏・独・伊・葡・西語の分析に実験的に対応した。また多重対応分析・MDSとクラスター分析の併用・バブルプロット・デンドログラムの色分けなどの点で、多変量解析の機能を拡充した。従来は分析対象とする「文書」の数を1万件程度までに抑えなければ、多変量解析に数時間以上の長い処理時間を要していたが、この処理時間を短縮した。論文タイトルやTwitterの投稿のように、1つの1つの文書が短い場合には、10万件程度の文書を分析する場合でも、3分程度で多変量解析を実行可能となった。 第三に、応用に適したデータと研究領域を探索するために、本研究で開発を継続している支援ソフトウェアを利用した研究例や、それ以外の内容分析を用いた近年の研究事例の集約を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

既存研究並びに既存の商用ソフトウェアのレビューから本研究の基本的な枠組みと方向性を定められたこと、また支援システムの開発についても構想のみならず複数の機能について実装を進められたこと、応用研究を収集できたことなどの点で、当初の目的をほぼ達成できている。

今後の研究の推進方策

第一に、社会調査における日本語テキスト型データの計量的な分析方法の提案においては、前年度に評価した新しい技術を取り入れることで自動化を目指す部分と、人間・研究者の判断が欠かせない部分、すなわち自動化というよりもむしろ研究者が比較的少ない負担で確認を行えるような支援機能を考える部分とを区別しつつ、新たな分析方法を提案する。 第二に分析支援システムの開発においては、前年度の構想にもとづいて、機能の追加をさらに進めるともに、実データの分析から新機能の有効性を確認する。 第三に、応用に適したデータと研究領域の探索においては、普及過程論に関する応用研究を自ら実施することを目指す。

次年度の研究費の使用計画

内容分析およびテキストマイニング用のコンピュータ・プログラムを調達・評価する。これらのプログラムは専門性が高く用途が特殊であるため、比較的安価なものでも1 点で10 万円から20 万円と高価なものが多い。しかし優れた独自システム開発のためには、可能な限り多くのプログラムを試用し、それぞれの優れた点に学ぶことが必要である。よって、前年度に引き続き次年度も可能な範囲での調達を行う計画である。 新聞記事データは、社会意識が年月とともに変化してきた様相を記述するための重要な資料であり、本研究で提案する方法の主要な適用対象の1 つである。よって、1 つの新聞社の1 年分の記事が23 万円から28 万円程度と高価ではあるが、可能な範囲での調達を実施する計画である。 その他に書籍・資料と、独自システム開発のためのコンピュータ関連機器およびソフトウェア、研究打合せならびに成果発表のための旅費を執行する計画である。

  • 研究成果

    (6件)

すべて 2012 2011 その他

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (2件) 備考 (2件)

  • [雑誌論文] 質問紙調査における自由回答項目の分析: KH Coderによる計量テキスト分析の手順と実際2012

    • 著者名/発表者名
      樋口耕一
    • 雑誌名

      社会と調査

      巻: 8 ページ: 92-96

  • [雑誌論文] 児童養護施設内における子ども間暴力の内容と対応の分析2011

    • 著者名/発表者名
      酒井佐枝子・稲垣由子・樋口耕一・加藤寛
    • 雑誌名

      子どもの虐待とネグレクト

      巻: 13 ページ: 115-124

    • 査読あり
  • [学会発表] The Internet in Newspaper Articles and People's Minds: A Corpus-Based Exploratory Approach to Social Consciousness in Japan2012

    • 著者名/発表者名
      HIGUCHI, Koichi
    • 学会等名
      4th International Conference on Corpus Linguistics
    • 発表場所
      Jaen, Spain
    • 年月日
      2012年3月22日
  • [学会発表] Web調査における公募型モニターと非公募型モニターの回答傾向2012

    • 著者名/発表者名
      樋口耕一・中井美樹・湊邦生
    • 学会等名
      数理社会学会第53回大会
    • 発表場所
      鹿児島大学(鹿児島県)
    • 年月日
      2012年3月14日
  • [備考]

    • URL

      http://khc.sourceforge.net/

  • [備考] 本研究で開発を進めている分析支援システム「KH Coder」の頒布ページ。

URL: 

公開日: 2013-07-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi