研究課題
基盤研究(B)
本研究は、音声言語処理システムにおける「発話を聴きながら理解する機能」を実現するための日本語話し言葉処理技術の開発を目的としている。大規模音声言語データに対して、構文・意味構造を文節単位で付与したコーパスを構築し、統計的アプローチに基づく逐次的な解析技術を開発することを目指す。上述の目的を達成するために、初年度は、本研究を遂行する上で基盤となる言語資源の整備を実施した。具体的には以下の項目の研究を推進した。1.構文構造及び意味構造が付与された音声言語コーパスの作成音声が書き起こされたコーパスに対して、構文構造及び意味構造を付与するとう方針のもと、コーパスの作成を開始した。対象としての「同時通訳コーパスの日本語講演データ」「車内対話コーパスの日本語対話データ」を選定した。構造の付与は、複数のアノテーション作業者により実施し、作業効率を重視し、言語処理ツールを利用した半自動での作業環境を整備した。なお、この作業は来年度以降も継続して巣進めることを予定している。2.構文構造と意味構造を表現するデータ構造の策定日本語話し言葉の構文及び解析結果を表現するためのデータ構造について検討を行った。本研究におけるデータ構造としては、従来の解析と異なり、「文の部分に対する構文構造、意味構造を表現でき、かつ、両構造間で対応がつくこと」及び、「文節などの文構成素の追加に対応する構文構造、意味構造の更新を構成的に計算できること」を満たすという条件のもの策定した。構文構造として係り受け構造、意味構造として述語項構造を採用した。
すべて 2010 その他
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件) 図書 (1件) 備考 (1件)
IEICE Transactions on Information and Systems
巻: E93-D No.9 ページ: 2660-2663
International Journal of Knowledge and Web Intelligence
巻: 1 No.3/4 ページ: 227-242
http://www.matubara.net/kaken/slp/