研究課題/領域番号 |
15659505
|
研究機関 | 筑波大学 |
研究代表者 |
西川 浩昭 筑波大学, 大学院・人間総合科学研究科, 助教授 (30208160)
|
研究分担者 |
城川 美佳 東邦大学, 医学部, 助手 (10177785)
|
キーワード | テキストデータ / 質的研究 / 自由記載 / 分かち書き処理 / 単語の出現頻度 / 質的データ / 対応分析 / 等質性分析 |
研究概要 |
本研究の目的は、質的研究や自由記載などによって得られたテキスト型のデータに対して、定量的な解析法を実行しようとするものである。この際に生じる2つの問題について検討した。一つはテキストを分かち書き処理した後、分析のための変数としてのキーワードの抽出、選択であり、もう一つは適用可能な分析手法である。 前者については、まず、句読点や括弧などの記号、意味を持たない助詞および助動詞、他の単語との関わりが乏しい接続詞、感動詞が分析から除外できることが判った。故に、テキストデータを分析する上で、対象とすべき品詞は、名詞・代名詞、動詞、形容詞、形容動詞、副詞の5種類とすれば良い。次に扱うキーワードの数であるが、分析の対象を個人から得た文章全体とする場合には、対象数の10〜20%程度、分析対象を個々の文(センテンス)とする場合には、レコード数の数%までにするのが適当である。ただし、いずれの場合も結果の解釈という点からは、単語数の上限を300〜500語程度にすべきである。 後者の分析手法に関しては、用いるデータが文章またはセンテンス内でのキーワードの使用の有無という2値データであるため、適用可能な方法としては、そのまま質的データの解析法を用いる、全てのキーワードの組合せについて、四分点相関係数を算出して、量的データの解析法を用いる方法、全てのキーワード間の類似性を算出して多次元尺度法を用いる方法が考えられる。このうち、相関係数を算出して、量的データの解析法を用いる方法は、相関係数の値が非常に小さいことと、1例の違いで結果が大きく変動する結果の不安定性が認められ、分析方法としてふさわしくないことが判った。多次元尺度法は可能ではあるが、多数のキーワードを2次元に表示することは、非常に困難であることから、あまり適した方法ではないと思われる。本研究で扱うデータの分析方法としては、対応分析、等質性分析等の質的データの分析方法が適していることが判った。しかしこれらの分析方法についても、単語同士の関わり(順接、逆説)に関する情報は欠落してしまっている。この点に対する検討が今後の課題である。
|