2004 Fiscal Year Annual Research Report
文書集合の構造化に基づく効率的な情報アクセス技術の開発
Project/Area Number |
16700151
|
Research Institution | Hiroshima City University |
Principal Investigator |
難波 英嗣 広島市立大学, 情報科学部, 講師 (50345378)
|
Keywords | 対応付け / 隠れマルコフモデル / 論文 / プレゼンテーションシート |
Research Abstract |
学術会議におけるプレゼンテーションでは,限られた時間で効率的に聴衆へ情報を伝えることが重要である.そのような場では一般的に配布資料とともにそれに基づくプレゼンテーションシートが利用されており,その準備には多大な労力と時間的負担を強いられる.そのため,多くの人はプレゼンテーションシートの効率的な作成を望んでいる.プレゼンテーションシートは,多くの場合において論文の内容に即した内容を持つ.そのため,論文をもとにしてプレゼンテーションシートを作成することが効率的と考えられる. 本研究では,論文からプレゼンテーションシート自動生成を目指し,隠れマルコフモデル(HMM)を用いた論文とプレゼンテーションシート(シート)との対応付けを試みる.対応付けには,JingのHMMを用いた対応付け手法をもとに,シートごとに論文の章・節を特定することを行った.しかし,論文とシートを対象とした場合では,新聞記事と比べ一テキスト中の文数と一文当りの長さが大きく,また本文の他に図表が含まれるため,単純にJingの手法を適用しても十分な対応付けができない.そこで,本研究では,論文とシートの固有の情報を考慮した対応付け範囲の限定,タイトルによる対応付け,タイトルに対する重み付け,および背景情報の利用により,Jingの手法の改善を試みた. 提案手法の有効性を調べるため,実験を行った.実験では,Web上から収集したpdf形式の論文ファイルとMicrosoft PowerPoint形式の発表原稿データを人手で対応付けし,提案手法による自動対応付け手法が,どの程度人手による対応付け結果と一致するかにより評価を行った.実験の結果,Jingの手法では対応付け精度が68%であったのに対し,提案手法では77%の結果が得られ,提案手法がJingの手法を改良できていることが確認された.
|