Research Abstract |
本研究では,テキスト内に書かれた情報を解析し,その内容を図によって表現する技術の調査を目的としている.そのためにクリアしなければならない課題を,テキスト情報を解析する技術(テキスト解析部)と,図による出力のための素材や規則の整備の2つに大きく分けて計画し,調査,研究進めている.このうち, 12年度では,主にテキスト解析部での作業を進め,1)テキスト中の重要部分を特定する研究と,2)テキスト中の人や物,場所,その他,図式化の対象となる実体を認定する研究を行なってきた. 1)の研究では問題を,テキスト中の重要個所を選択し,元のテキストから要約を作成する問題と考えて扱っている.具体的には,我々がこれまで扱ってきた語彙的連鎖と構文解析の結果を組み合わせた情報を利用して,テキストを要約する際に,最も重要な部分を選び出すための手法を提案し,実験を行なった.この過程での成果として,テキスト中の語彙的連鎖を作成するためのプログラムを作成,整備し,一般に公開した.また,1)では,重要個所の特定によってテキストを要約するシステムを実装しており,将来このプログラムを一般に公開し,広く利用可能にする下地ができたといえる. 2)の研究では問題を,テキスト中の出現する実体の特定を行ない,その実体についての記述がされているテキスト中の個所とを結びつける問題と考えて扱っている.試験的に対象テキストを法律条文とし,実体として「法律用語」を条文中から自動的に抽出する手法と,その法律用語について定義をしている個所や,その法律用語が関わる法律条文との間にリンク関係をつけるシステムの実装と実験を行なった. なお,1)の研究は情報処理学会の研究会報告として,また,2)の研究は情報処理学会の全国大会において,それぞれ口頭で発表を行なった.
|