研究課題
基盤研究(C)
本研究では,ユーザがWeb上の情報の信頼性を判断する材料として,文の典型性と文体に注目し,それぞれを推定してユーザに提示する手法を開発した.文の典型性推定では,与えられたキーワードに対する文の典型性を,語の共起関係に基づいて推定する.文体の推定では,文体クラスとして,敬体,常体,会話体,俗語体を定義し,文末の表現に注目してこれらの文体への分類を行う.文体分類には,文体ごとに異なる情報源から自動構築した文末表現辞書を用いる.
情報検索
本研究では,文の典型性の推定手法と文体分類手法を開発した.文の典型性推定では,語の共起確率だけでなく,その予測値を併用することで推定精度を向上させた.文の典型性の推定結果をユーザに提示することにより,ユーザは典型性の低い文章については世間一般に認知されていない情報として警戒して閲覧することができるようになる.また,文体分類においては,定義した4つの文体に対して高い精度での分類を実現した.さらに,文体分類の応用として,文体による注目トピックの違いや文体と文章の難易度の関係についての分析を行った.