研究概要 |
本研究課題では,文簡約,すなわち原文が持つ情報をできるだけ保持しながら,より短い文に自動書き換えを行なう処理が重要な位置を占めている.本年度は文簡約に関して次の研究を行なった. 1.文簡約においては,簡約された文における原文情報の保持と,構文的自然性が重要である.本研究では,構文的自然性を確保するために,文節間の係り受け整合度を利用している.これまでは,係り受け整合度を原文とは関係なく大規模なコーパスから統計的に推定していた.本年度は,原文とその人手による簡約文が対になったコーパスを用いて,原文の構造を考慮に入れながらこれを推定することを試みた.まず,原文を係り受け解析し,構文木を作る.そして,原文において係り受け経路を持つ文節対が,対応する簡約文において直接の係り受け関係を持って残存している割合を数え,これを基にして係り受け整合度の推定を行った.この情報を用いて実際に簡約文を生成し主観評価を行なったところ,原文情報の保持,構文的自然性,総合評価のいずれにおいても従来法より良好な結果が得られ,有効性が確認された. 2.本研究では,原文からいくつかの文節を選び出す文節抽出型の文簡約法を採用している。このような方法においては,原文で直接的な係り受け関係を持たない文節対が簡約文では係り受け関係を持つようになることもあり,そのままでは自然性を損なう原因となる場合がある.そこで,このようなことが起こったときには,係り文節の末尾を修正して読みやすさを向上させることを試みた.修正はまず人手により作成したルールを用いて行い,その結果をコーパスに照らして自然性の評価を行なう.自然性が低いと判定された場合は,統計的に作成したルールを用いてさらに修正を行なう.この方法で修正された簡約文の主観評価を行なったところ,修正前より読みやすさが向上するという結果が得られ,この方法の有効性が確認された.
|