研究課題/領域番号 |
23730502
|
研究機関 | 立命館大学 |
研究代表者 |
樋口 耕一 立命館大学, 産業社会学部, 准教授 (00452384)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 社会調査法 / 内容分析 / テキストマイニング / 質的データ |
研究概要 |
第一に、社会調査における日本語テキスト型データの計量的な分析方法の提案に関しては、既存研究の知見を集約するとともに、意味解析などに関する近年の技術的な側面の研究動向を把握し、本研究の基本的な枠組みと方向性を確定した。ここでは研究文献の検討だけでなく、商用ソフトウェアを複数調達し、試用と評価を行った。具体的にはProvalis Research社のWordStat 6.1、Prof. Roderick P. HartおよびProf. Craig Carrollが開発・販売するDiction 6.0、日本電子計算社および富士通エフ・アイ・ピー・システムズ社によるWordMiner、IBM社のSPSS Text Analytics for Surveys 4.0.1、数理システム社のText Mining Studio 3.1ふろく版などについて評価を行った。 第二に、提案する分析方法を実現するための分析支援システム開発においては、以下の進捗があった。従来は日本語データのみしか分析できなかったが、英語のほか蘭・仏・独・伊・葡・西語の分析に実験的に対応した。また多重対応分析・MDSとクラスター分析の併用・バブルプロット・デンドログラムの色分けなどの点で、多変量解析の機能を拡充した。従来は分析対象とする「文書」の数を1万件程度までに抑えなければ、多変量解析に数時間以上の長い処理時間を要していたが、この処理時間を短縮した。論文タイトルやTwitterの投稿のように、1つの1つの文書が短い場合には、10万件程度の文書を分析する場合でも、3分程度で多変量解析を実行可能となった。 第三に、応用に適したデータと研究領域を探索するために、本研究で開発を継続している支援ソフトウェアを利用した研究例や、それ以外の内容分析を用いた近年の研究事例の集約を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
既存研究並びに既存の商用ソフトウェアのレビューから本研究の基本的な枠組みと方向性を定められたこと、また支援システムの開発についても構想のみならず複数の機能について実装を進められたこと、応用研究を収集できたことなどの点で、当初の目的をほぼ達成できている。
|
今後の研究の推進方策 |
第一に、社会調査における日本語テキスト型データの計量的な分析方法の提案においては、前年度に評価した新しい技術を取り入れることで自動化を目指す部分と、人間・研究者の判断が欠かせない部分、すなわち自動化というよりもむしろ研究者が比較的少ない負担で確認を行えるような支援機能を考える部分とを区別しつつ、新たな分析方法を提案する。 第二に分析支援システムの開発においては、前年度の構想にもとづいて、機能の追加をさらに進めるともに、実データの分析から新機能の有効性を確認する。 第三に、応用に適したデータと研究領域の探索においては、普及過程論に関する応用研究を自ら実施することを目指す。
|
次年度の研究費の使用計画 |
内容分析およびテキストマイニング用のコンピュータ・プログラムを調達・評価する。これらのプログラムは専門性が高く用途が特殊であるため、比較的安価なものでも1 点で10 万円から20 万円と高価なものが多い。しかし優れた独自システム開発のためには、可能な限り多くのプログラムを試用し、それぞれの優れた点に学ぶことが必要である。よって、前年度に引き続き次年度も可能な範囲での調達を行う計画である。 新聞記事データは、社会意識が年月とともに変化してきた様相を記述するための重要な資料であり、本研究で提案する方法の主要な適用対象の1 つである。よって、1 つの新聞社の1 年分の記事が23 万円から28 万円程度と高価ではあるが、可能な範囲での調達を実施する計画である。 その他に書籍・資料と、独自システム開発のためのコンピュータ関連機器およびソフトウェア、研究打合せならびに成果発表のための旅費を執行する計画である。
|