(1) 2-gramに基づいた特徴量を用いた適切な回答者の良好性の評価 これまでの研究手法は、形態素解析に基づいた手法で抽出してきた構文情報の特徴量に依存度の大きい手法であった。そこで、構文解析の代替手法として、2-gramに基づく特徴量17種を形態素解析に基づく特徴量36種の代わりに新規特徴量として使用することとした。 まず、新規質問文に適切な回答を施すことが可能な回答者を探索する可能性を検証した結果、形態素解析に基づいた手法と同様に質問回答文間の距離と距離上位の出現回数は、質問文に適切に回答できるユーザの選択に役立てる可能性を示した。この観察に基づき、出現回数と距離に基づくスコアと距離上位の出現回数に応じて、適切な回答者を決定する手法を提案した。提案手法を、スコアの平均値に基づく手法ならびに距離に基づく手法と、適合率と再現率で比較評価を行った。評価の結果、提案手法は他手法より良好に回答者を推薦できることを示した。この結果は、形態素解析に基づく手法と同様の傾向を示していることから、形態素解析と2-gramのどちらに基づく手法でも、適切な回答者を推薦することが可能であることを示している。 (2) 文章間の意味を考慮した因子得点の推定 文章間の意味や内容の考慮を目的として、word2vecを用いて文章間の意味を考慮した特徴量を追加した上で文章の因子得点の推定を行った。これまで使用してきた文章の特徴量の内容を精査した上で、N-gram(2≦N≦5)を17種、文末表現を13種、word2vecを3種、の特徴量を分析に使用した。60件のデータに対する3組の交差検証も適用して、文章の特徴量を使用して重回帰分析を施した結果、9因子とも良好な推定結果が得られた。また、各因子の標準偏回帰係数の絶対値の大きい変数を調べたところ、特定の因子においてはword2vecの考慮が効果的といえる結果となった。
|