2017 Fiscal Year Research-status Report
Webページの大域的・局所的特徴の可視化による情報信頼性の判断支援方式の研究
Project/Area Number |
17K00429
|
Research Institution | University of Hyogo |
Principal Investigator |
湯本 高行 兵庫県立大学, 工学研究科, 助教 (20453152)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 情報信頼性 / ウェブインテリジェンス |
Outline of Annual Research Achievements |
(1)語の組の典型性を数値化するにあたり,類義語を考慮した典型性を推定手法を提案した.具体的には,語の組の自己相互情報量(PMI)の計算に必要な語の出現数に類義語の出現数も含めるようにする.その結果,類義語を考慮しない場合に比べて,典型的な語の組合せと典型的でない語の組合せの識別の精度が向上した.さらに,語の組合せに共起する語について調査したところ,典型的な語の組合せでは双方の語に関係の深い語が得られたのに対し,そうでない語の組合せでは関係のない語が多く得られた.この結果より,共起語を利用することで語の組の典型性推定を改善できる可能性がある. (2)文体の種類として常体,敬体,会話体,ネット文体の4種類を定義し,文をこれらに分類する手法を提案した.提案手法では特に文末表現に着目し,ニュースサイトや新聞記事などを基に文末表現辞書を構築し,この辞書を用いて文体を分類する.提案手法の評価を行ったところ,常体,敬体,会話体では比較的高い精度で分類が行えたが,ネット文体については改良の余地が残っている.また,開発した分類器を用いて,ツイートにおける文体ごとの着目点の違いおよび文体の種類と文章の難易度との関連を調査を行った.前者では,複数のトピックに関して意見極性や頻出語を比較した.その結果,意見極性は文体によって大きく違わないが,トピックによっては頻出語が異なっているという結果が得られた.また,後者では,多くのトピックで難易度の平均値は常体,敬体,会話体,ネット文体の順になった.この結果より,文体を文章の難易度の簡易推定に応用することが可能である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成29年度に予定していた,語の組の典型性の推定および文体分類の手法が開発できたため,おおむね順調であると言える.
|
Strategy for Future Research Activity |
平成29年度の研究成果を基に文章の典型性推定および文の役割分類の手法の開発を行う.
|
Causes of Carryover |
手法の開発に使用する機器の購入計画を見直し,次年度以降に購入することにした.これにより費用対効果が高くなると考えている.また,投稿していた論文の掲載料の請求が次年度になったため,予定していた使用額を次年度に回した. 次年度は,手法の開発に必要な機器の購入や研究成果の発表のための学会参加費や旅費に使用する.
|