2019 年度研究成果報告書

Webページの大域的・局所的特徴の可視化による情報信頼性の判断支援方式の研究

研究課題

PDF

研究課題/領域番号	17K00429
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	ウェブ情報学・サービス情報学
研究機関	兵庫県立大学
研究代表者	湯本高行兵庫県立大学, 工学研究科, 助教 (20453152)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	情報信頼性 / Webマイニング / 典型性 / 文体分類
研究成果の概要	本研究では，ユーザがWeb上の情報の信頼性を判断する材料として，文の典型性と文体に注目し，それぞれを推定してユーザに提示する手法を開発した．文の典型性推定では，与えられたキーワードに対する文の典型性を，語の共起関係に基づいて推定する．文体の推定では，文体クラスとして，敬体，常体，会話体，俗語体を定義し，文末の表現に注目してこれらの文体への分類を行う．文体分類には，文体ごとに異なる情報源から自動構築した文末表現辞書を用いる．
自由記述の分野	情報検索
研究成果の学術的意義や社会的意義	本研究では，文の典型性の推定手法と文体分類手法を開発した．文の典型性推定では，語の共起確率だけでなく，その予測値を併用することで推定精度を向上させた．文の典型性の推定結果をユーザに提示することにより，ユーザは典型性の低い文章については世間一般に認知されていない情報として警戒して閲覧することができるようになる．また，文体分類においては，定義した4つの文体に対して高い精度での分類を実現した．さらに，文体分類の応用として，文体による注目トピックの違いや文体と文章の難易度の関係についての分析を行った．