2018 Fiscal Year Annual Research Report
Creating Summary of People on the Web
Project/Area Number |
16K00440
|
Research Institution | Osaka City University |
Principal Investigator |
村上 晴美 大阪市立大学, 大学院工学研究科, 教授 (40305644)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 情報検索 / Web人物検索 / BSH / NDLSH |
Outline of Annual Research Achievements |
研究の全体構想は「Web上の人物を選択するためのインタフェースの開発」であり、「Web上の人物を要約する手法の開発」を目的とする。具体的には、人物の「要約」手法(キーワード、件名、概要、概要文)とインタフェース(表と概要文)を開発する。また、人物選択のためにどの情報・インタフェースがどのように有用か明らかにする。 本研究における要約とは人物を選択・理解するために有用な情報の抽出、生成、あるいは付与である。 平成30(2018)年度の主な成果は(1) 件名(BSH4)の付与と (2) キーワードの抽出と (3) 研究の総括である。 3年間の主な成果は、(a) Wikipediaの第一文風の概要文の作成と (b) 件名(NDLSHとBSH4)の付与である。どちらもWeb上の人物検索結果(HTMLファイル群)の80人物のデータセットを利用した。 (a) 属性情報(よみ、生年月日、没年月日、出身地、職業、所属、役職)を抽出してテンプレート「氏名(よみ、生年月日―没年月日)は出身地の職業、所属+役職。」に埋めることにより、Wikipediaの第一文風の概要文を作成する手法を開発し、評価実験を行った。 (b) 件名としてNDLSHとBSH4を付与する手法を検討した。検索ランキング、文書内の位置、同義語(BSH4では参照語)、文書頻度の4種類を組み合わせた405パターンについて比較実験を行った。NDLSHにおいては「上位10件、人名の前後100文字、同義語を利用、文書頻度」で重み付けする方法、BSH4においては「上位10件、全文、参照語を利用しない、文書頻度」で重み付けする方法の結果が良かった。
|