2012 Fiscal Year Research-status Report
社会調査におけるテキスト型データ分析支援システムの開発
Project/Area Number |
23730502
|
Research Institution | Ritsumeikan University |
Principal Investigator |
樋口 耕一 立命館大学, 産業社会学部, 准教授 (00452384)
|
Keywords | 社会調査法 / 内容分析 / テキストマイニング / 質的データ |
Research Abstract |
第一に、社会調査における日本語テキスト型データの計量的な分析方法の提案においては、前年度に評価した新しい技術を取り入れることで自動化を目指す部分と、人間・研究者の判断が欠かせない部分、すなわち自動化というよりもむしろ研究者が比較的少ない負 担で確認を行えるような支援機能を考える部分とを、区別するべく検討を重ねた。 この検討結果にもとづいて第二に、分析支援システムの開発において、機能追加を進めた。具体的には、自己組織化マップ(Self-organizing map)作成機能を追加した。またプロット作成時に、半透明色をもちいたり、ラベル配置アルゴリズムを改善したり、補助的な棒グラフを追加するなどして、視認性を高める工夫を行った。これらの成果の一部は書籍『コーパスとテキストマイニング』(分担執筆)にて公表した。また分析支援システムはフリーソフトウェアとしてインターネットで公開している。 第三に、応用に適したデータと研究領域の探索においては、質問紙調査における自由回答項目を分析した応用研究を自ら実施した。質問紙調査は様々な分野で頻繁に利用される調査法であるため、そのより良い実践の可能性を示すことは重要である。そこで、選択肢型の質問の分析だけでなく、自由な言葉で回答してもらった内容の計量テキスト分析を組み合わせることで、知見に相乗的な広がりが出ることを応用研究から示すことを試みた。この応用研究では、ウェブのようなイノベーションを生活に取り入れるかどうかという選択が、富の有無によってどの程度強い制約を受けるのかを分析した。特に、情報化を好むかどうかといった我々の態度の影響と、富の影響の強さを比較することを試みた。この部分の成果は『ソシオロジ』57巻3号に論文として掲載された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
分析方法を検討するのみならず、支援システムへの機能追加を行ない、この支援システムをインターネットで公開できていること。また支援システムの機能の一部を書籍(分担執筆)で公表できたこと。さらに、自ら取り組んだ応用研究を論文にまとめられたことなどから、おおむね当初の計画通りの進捗と言えよう。
|
Strategy for Future Research Activity |
(1) 社会調査における日本語テキスト型データの計量的な分析方法の提案 下記(3)にて自ら実施する応用研究の中で、この提案方法を実際に使用する。そして、分析の過程を振り返ることで、提案方法の有効性について検証と評価を行う。 (2) 分析支援システムの開発 次年度は機能の追加だけでなく、第三者にも分かりやすい操作画面や、予期しないデータ入力があった場合のエラーメッセージ表示機能、使用方法の解説など、システムを広く公開するための準備を行う。 (3) 応用に適したデータと研究領域の探索 本研究で開発している分析支援システムは既にインターネットで公開しており、幸いにして、多くの研究者によって本システムは利用されている。本システムを用いた研究事例は、学会発表と論文をあわせて年間100件程度が公表されている。よって、これらの研究のレビューを行い、分析方法・支援システムの利用に適した研究領域を探索する。これと合わせて、自ら応用研究を実施することでも、分析方法がどのような領域の研究に、またどのようなデータに向いているのかを検討する。応用研究のテーマとしては、昨年度に引き続き、イノベーション普及過程の探索を計画している。普及過程論においては、単に新しい技術や製品が広がる過程だけでなく、新しい技術が解釈されその技術に付随する新しい考え方・概念が広がるコミュニケーションの過程が重要とされているが、その過程の定量的な分析は進んでいない。質問紙調査に加えて、新聞記事・ネット発言の分析から、この過程について探索を行う予定である。
|
Expenditure Plans for the Next FY Research Funding |
引き続き、内容分析およびテキストマイニング用のコンピュータ・プログラムを調達・評価する。これらのプログラムは専門性が高く用途が特殊であるため、比較的安価なものでも1 点で10 万円から20 万円と高価なものが多い。しかし優れた独自システム開発のためには、可能な限り多くのプログラムを試用し、それぞれの優れた点に学ぶことが必要である。よって、引き続き次年度も可能な範囲での調達を行う計画である。 新聞記事データは、社会意識が年月とともに変化してきた様相を記述するための重要な資料であり、本研究で提案する方法の主要な適用対象の1 つである。よって、1 つの新聞社の1 年分の記事が23 万円から28 万円程度と高価ではあるが、次年度も可能な範囲での調達を実施する計画である。 その他に書籍・資料と、独自システム開発のためのコンピュータ関連機器およびソフトウェア、研究打合せならびに成果発表のための旅費を執行する計画である。
|