2003 Fiscal Year Annual Research Report
アンケート調査における自由回答文の自動集計と選択肢の自動生成について
Project/Area Number |
14580350
|
Research Institution | Tokyo Denki University |
Principal Investigator |
矢口 博之 東京電機大学, 理工学部, 助教授 (30210230)
|
Keywords | アンケート調査 / 自由解答 / テキストマイニング |
Research Abstract |
平成15年度に行った研究の概要 自由回答形式のアンケートを、文章間の類似度に基づくクラスタリングにより自動集計し、次に自動計された結果から選択肢を作成し再びアンケートを行った。2つのアンケート結果を比較することで、自動集計の結果が妥当であるかどうかの検証を行った。自動集計には、昨年度開発を行った回答文を構成する形態素に着目した文章分類を行うシステムを用いた。このシステムは,アンケートによって得られた自由回答文を形態素解析し、形態素の品詞によって重み付けをして、文章分類のために文章間の類似度を基にクラスタリングを行うものである。 検証実験について 学生を対象に第1群(32名)、第2群(75名)に対しそれぞれ質問内容の違う自由回答式アンケートA、Bを実施し、アンケート結果から選択肢式アンケートA'、B'を作成した。次に作成された質問内容の異なる選択肢式アンケートA'、B'を自由回答の時とは別の対象群に対して実施した。 2つのアンケートで得られた回答を比較した結果、8つの質問のうち、選択肢式のアンケートで、自由回答形式のアンケートとほぼ同じ回答を得られるものがあった。「その他」の項目に記入された件数も、わずかでありと、自由回答文の内容を上手く選択肢へと反映できていることが確認できた。しかし、自由回答文の内容が選択肢に反映されなかった質問項目もあり、検討すべき点も多く発見された。たとえば、名詞・動詞以外の品詞は文章分類に与える影響が希薄だと考えたため、形容詞や形容動詞には形態素の重み付けを行わなかった。しかし本年度の研究により、回答文の述語として形容詞が使われることもあり、重み付けをする形態素の検討に改善の余地があることが分かった。
|