研究の全体構想は「Web上の人物を選択するためのインタフェースの開発」であり、「Web上の人物を要約する手法の開発」を目的とする。具体的には、人物の「要約」手法(キーワード、件名、概要、概要文)とインタフェース(表と概要文)を開発する。また、人物選択のためにどの情報・インタフェースがどのように有用か明らかにする。 本研究における要約とは人物を選択・理解するために有用な情報の抽出、生成、あるいは付与である。 平成30(2018)年度の主な成果は(1) 件名(BSH4)の付与と (2) キーワードの抽出と (3) 研究の総括である。 3年間の主な成果は、(a) Wikipediaの第一文風の概要文の作成と (b) 件名(NDLSHとBSH4)の付与である。どちらもWeb上の人物検索結果(HTMLファイル群)の80人物のデータセットを利用した。 (a) 属性情報(よみ、生年月日、没年月日、出身地、職業、所属、役職)を抽出してテンプレート「氏名(よみ、生年月日―没年月日)は出身地の職業、所属+役職。」に埋めることにより、Wikipediaの第一文風の概要文を作成する手法を開発し、評価実験を行った。 (b) 件名としてNDLSHとBSH4を付与する手法を検討した。検索ランキング、文書内の位置、同義語(BSH4では参照語)、文書頻度の4種類を組み合わせた405パターンについて比較実験を行った。NDLSHにおいては「上位10件、人名の前後100文字、同義語を利用、文書頻度」で重み付けする方法、BSH4においては「上位10件、全文、参照語を利用しない、文書頻度」で重み付けする方法の結果が良かった。
|