研究概要 |
計画の初年度は,回答文を構成する形態素に着目した文章分類を行うシステムを試作した。このシステムは,アンケートによって得られた自由回答文を形態素解析し、形態素の品詞によって重み付けをして、文章分類のために文章間の類似度を基にクラスタリングを行うものである。また基礎データの収集を目的とした自由回答形式のアンケート調査を実施した。収集した基礎データを用いて,データ収集登録用ソフトウェアとして,音声認識,手書き認識,手入力の各方式の入力効率と,入力エラーの評価を行った。その結果,音声認識によるデータ登録が最もバランスが良いことが分かった。 次年度では,自由回答形式のアンケートを実施し,試作したシステムを用いて,自動集計した結果に基づいて選択肢を作成し再びアンケートを行った。2回のアンケート結果を比較することで,自動集計の結果が妥当であるかどうかの検証を行った。得られた回答を比較した結果,8つの質問のうち,選択肢式のアンケートで,自由回答形式のアンケートとほぼ同じ回答を得られるものがあった。「その他」の項目に記入された件数も,わずかであり,自由回答文の内容を上手く選択肢へと反映できていることが確認できた。 最終年度では,試作したシステムに対する性能評価を中心課題として研究に取り組んだ。研究では市販されているテキストマイニングシステムについて調査し,そのうちの1つを購入し,開発したシステムと解析結果を比較することにより,性能や特性を相対的に評価する作業を行った。本システムは市販のテキストマイニングツールと同等以上の機能を有することが確認できたが,同時に市販のツールには及ばない点も数多く見つけることができた。これらの点は今後の課題として改善に取り組んで行きたいと考えている。
|