研究課題
本研究では、講演等の同時通訳における要素技術として利用することを想定し、音声入力に追従して処理可能(実時間性)、入力途中の段階でそれまでの部分に対する構文構造を生成可能(漸進性)、ならびに、日本語文法に逸脱する文であっても解析可能(頑健性)、を備えた独話音声の構文解析手法を開発している。最終年度は、独話音声の解析システムの設計・実現、及び、解析システムの評価を実施し、以下に示す成果を得ることができた。(1)独話音声の解析システムの設計・実装:解析単位認識プログラム、及び、統計的な係り受け解析プログラムを設計し、実装した。解析単位の認識には、節境界解析プログラムCBAPを使用し、独話文だけでなく、独話全体の解析が可能となるように、文境界が未知である状況で決定的に節境界を検出できる枠組みとした。統計的な係り受け解析では、大量の構文木データから係り受け確率を学習した。学習には、あらかじめ人手で作成した約5000文の構文木つき独話文データを使用した。係り受け解析を漸進的に実行するために、節境界が検出されるたびに、節の内部の文節の係り受け解析を実行し、また、節の最終文節の係り受け解析については、節が入力されるたびにその係り先を検討し、解析状況に応じて動的に決定する仕組みを定めた。本手法によれば、漸進的に係り受け先が決定すると同時に、解析結果に基づいて文末を判定することも可能であり、講演音声の同時的なアプリケーションにおいて利用可能なシステムとして実現している。(2)解析システムの評価:昨年度に開発した方式をもとに実装したシステムの総合評価を実施した。テストデータとして10分程度の実際の講演音声を使用した。講演全体に対する解析結果を評価対象とし、解析単位に基づく漸進的な手法の効果と限界を明らかにした。その結果、リアルタイムでの漸進的な構文解析を85%程度の精度で実行できること確認した。本研究による成果については、2編の学術雑誌論文、及び、2編の国際会議論文等により公表した。
すべて 2007 2006
すべて 雑誌論文 (6件)
電子情報通信学会論文誌 J90-D・22
ページ: 556-566
電気関係学会東海支部連合大会講演論文集
The Fourth Symposium on Intelligent Media Integration for Social Information Infrastructure
電子情報通信学会論文誌 J89-D・2
ページ: 2766-2770
Proceedings of Joint 21th International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics (COLING/ACL-2006)
ページ: 683-690
ページ: 169-176