研究概要 |
本研究の成果は,総ペナルティ最小化係り受け解析法に関わる1.理論的基礎,2.文節分割と短文分割,3.韻律情報の利用,4.文簡約手法,に分類することができる.以下,それらの要点を述べる. 1.係り受け解析を「最小コスト分割問題」として捉え,考察した.その結果,コストの設定の仕方によって,種々のアルゴリズムが得られること,また,総ペナルティ最小化法においてはコストの設定を柔軟に行うことができ,各種の数値情報を言語知識として利用するのに適していることなどが明らかになった. 2.係り受け解析においては,まず文を文節単位に分割する必要がある.この問題に対して決定木の手法を利用することにより,比較的少量の学習データで従来法より高い分割精度が得られることが示された.また,係り受け解析の前処理として行われる短文分割においても決定木の利用を図り,短文分割点を推定するための規則が自動学習出来ることを明らかにした. 3.韻律に含まれる係り受け解析に有効な情報を見い出すため,本研究では韻律と係り受け距離の関係を統計的にモデル化し,総ペナルティ最小化法を適用するときの言語知識として用いた.その結果,ポーズは非常に有効な情報であることが明らかになった.アクセントやイントネーションの情報の利用についてはさらに研究を進める必要がある. 4.TV放送のためのオンライン字幕付与などを目的として,文を簡約する効率の良いアルゴリズムを考案した.このアルゴリズムは,文節間の係り受け整合度と文節重要度の和を評価基準として,原文から最適な部分文節列を選択するものである.今後は,文簡約に適した文節重要度や係り受け整合度の定め方について研究するとともに,多くの入力文を用いて簡約文の質の評価を行う必要がある.
|