研究課題/領域番号 |
17K00429
|
研究機関 | 兵庫県立大学 |
研究代表者 |
湯本 高行 兵庫県立大学, 工学研究科, 助教 (20453152)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 情報信頼性 / ウェブインテリジェンス |
研究実績の概要 |
(1)語の組の典型性を数値化するにあたり,類義語を考慮した典型性を推定手法を提案した.具体的には,語の組の自己相互情報量(PMI)の計算に必要な語の出現数に類義語の出現数も含めるようにする.その結果,類義語を考慮しない場合に比べて,典型的な語の組合せと典型的でない語の組合せの識別の精度が向上した.さらに,語の組合せに共起する語について調査したところ,典型的な語の組合せでは双方の語に関係の深い語が得られたのに対し,そうでない語の組合せでは関係のない語が多く得られた.この結果より,共起語を利用することで語の組の典型性推定を改善できる可能性がある. (2)文体の種類として常体,敬体,会話体,ネット文体の4種類を定義し,文をこれらに分類する手法を提案した.提案手法では特に文末表現に着目し,ニュースサイトや新聞記事などを基に文末表現辞書を構築し,この辞書を用いて文体を分類する.提案手法の評価を行ったところ,常体,敬体,会話体では比較的高い精度で分類が行えたが,ネット文体については改良の余地が残っている.また,開発した分類器を用いて,ツイートにおける文体ごとの着目点の違いおよび文体の種類と文章の難易度との関連を調査を行った.前者では,複数のトピックに関して意見極性や頻出語を比較した.その結果,意見極性は文体によって大きく違わないが,トピックによっては頻出語が異なっているという結果が得られた.また,後者では,多くのトピックで難易度の平均値は常体,敬体,会話体,ネット文体の順になった.この結果より,文体を文章の難易度の簡易推定に応用することが可能である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度に予定していた,語の組の典型性の推定および文体分類の手法が開発できたため,おおむね順調であると言える.
|
今後の研究の推進方策 |
平成29年度の研究成果を基に文章の典型性推定および文の役割分類の手法の開発を行う.
|
次年度使用額が生じた理由 |
手法の開発に使用する機器の購入計画を見直し,次年度以降に購入することにした.これにより費用対効果が高くなると考えている.また,投稿していた論文の掲載料の請求が次年度になったため,予定していた使用額を次年度に回した. 次年度は,手法の開発に必要な機器の購入や研究成果の発表のための学会参加費や旅費に使用する.
|