研究概要 |
本研究では,形態素解析,構文解析,意味解析などの解析レベルで有効性が実証されている,実際の言語データからの言語知識獲得手法を談話解析のレベルに適用する.このため,まず,省略箇所の補完情報や談話単位の境界などの,談話情報をタグとして付与したコーパスを構築する.この際,省略の補完に関する付随情報として,談話中での焦点の移動に関する情報を合わせて付与する.このコーパスの構築には,多大な人的労力が必要となる.これを軽減するため,コーパスへ談話情報を人手で付与するのを支援する視覚的なツールを作成する.このツールは,我々がこれまでに開発した省略の補完および談話境界の推定を行なう手法を利用し,タグを付与する人間の労力を軽減する機能を実現する.次に,構築したコーパスから,省略の補完や談話境界の推定に利用できる規則を,確率的手法および機械学習の手法を用いて獲得し,獲得した規則集合を用いて談話解析を行なう手法を開発する.また,獲得した規則を実際のテキストに適用し,本手法の有効性を評価する.8年度では,まず,省略箇所とその補完情報や談話単位の境界などの,談話情報をタグとして付与したコーパスを構築した.このコーパスの構築には,多大な人的労力が必要となる.これを軽減するため,コーパスへ談話情報を人手で付与するのを支援する視覚的なツールを作成した.このツールは,現有のワークステーション上のWorld Wide Web(WWW)ブラウザとして実現した.ツールの利用者は,ブラウザの画面上に表示された元データに,省略の起こっている箇所,補うべき対象との対応,談話単位の境界と思われる箇所などの談話情報を付与する.
|