質的研究によって収集したインタビュー記録等のテキストデータの定量的解析法の検討

Research Project

Project/Area Number	15659505
Research Category	Grant-in-Aid for Exploratory Research
Allocation Type	Single-year Grants
Research Field	Fundamental nursing
Research Institution	University of Tsukuba
Principal Investigator	西川浩昭筑波大学, 大学院・人間総合科学研究科, 助教授 (30208160)
Co-Investigator(Kenkyū-buntansha)	城川美佳東邦大学, 医学部, 助手 (10177785)
Project Period (FY)	2003 – 2004
Project Status	Completed (Fiscal Year 2004)
Budget Amount *help	¥2,800,000 (Direct Cost: ¥2,800,000) Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000) Fiscal Year 2003: ¥1,700,000 (Direct Cost: ¥1,700,000)
Keywords	テキストデータ / 質的研究 / 自由記載 / 分かち書き処理 / 単語の出現頻度 / 質的データ / 対応分析 / 等質性分析 / 出現頻度
Research Abstract	本研究の目的は、質的研究や自由記載などによって得られたテキスト型のデータに対して、定量的な解析法を実行しようとするものである。この際に生じる2つの問題について検討した。一つはテキストを分かち書き処理した後、分析のための変数としてのキーワードの抽出、選択であり、もう一つは適用可能な分析手法である。前者については、まず、句読点や括弧などの記号、意味を持たない助詞および助動詞、他の単語との関わりが乏しい接続詞、感動詞が分析から除外できることが判った。故に、テキストデータを分析する上で、対象とすべき品詞は、名詞・代名詞、動詞、形容詞、形容動詞、副詞の5種類とすれば良い。次に扱うキーワードの数であるが、分析の対象を個人から得た文章全体とする場合には、対象数の10〜20%程度、分析対象を個々の文(センテンス)とする場合には、レコード数の数%までにするのが適当である。ただし、いずれの場合も結果の解釈という点からは、単語数の上限を300〜500語程度にすべきである。後者の分析手法に関しては、用いるデータが文章またはセンテンス内でのキーワードの使用の有無という2値データであるため、適用可能な方法としては、そのまま質的データの解析法を用いる、全てのキーワードの組合せについて、四分点相関係数を算出して、量的データの解析法を用いる方法、全てのキーワード間の類似性を算出して多次元尺度法を用いる方法が考えられる。このうち、相関係数を算出して、量的データの解析法を用いる方法は、相関係数の値が非常に小さいことと、1例の違いで結果が大きく変動する結果の不安定性が認められ、分析方法としてふさわしくないことが判った。多次元尺度法は可能ではあるが、多数のキーワードを2次元に表示することは、非常に困難であることから、あまり適した方法ではないと思われる。本研究で扱うデータの分析方法としては、対応分析、等質性分析等の質的データの分析方法が適していることが判った。しかしこれらの分析方法についても、単語同士の関わり(順接、逆説)に関する情報は欠落してしまっている。この点に対する検討が今後の課題である。

Report

(2 results)

2004 Annual Research Report
2003 Annual Research Report