研究課題/領域番号 |
22300051
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報科学研究科, 准教授 (20303589)
|
研究分担者 |
柏岡 秀紀 独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所, 室長 (10395022)
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
|
キーワード | 自然言語処理 / コーパス / 構文解析 / 意味解析 / 音声言語処理 / 漸進的解釈 / 談話理解 / 構文木 |
研究概要 |
本研究は、音声言語処理システムにおける「発話を聴きながら理解する機能」を実現するための日本語話し言葉処理技術の開発を目的としている。大規模音声言語データに対して、構文・意味構造を文節単位で付与したコーパスを構築し、統計的アプローチに基づく逐次的な解析技術を開発することを目指す。上述の目的を達成するために、23年度は、言語資源のアノテーション及びその分析を実施した。具体的には以下の項目の研究を推進した。 1.音声言語コーパスへの構文・意味構造タグ付きの付与:昨年度に引き続き、構文構造及び意味構造が付与された音声言語コーパスを構築した。構造付与の対象としては、これまでと同様、新たに音声を収録することはせず、同時通訳コーパスに収録されている日本語講演データ、及び、車内対話コーパスに収録されている日本語対話データを利用した。Web上で動作するアノテーションインタフェースを新たに作成し、効率的な作業を可能にした。 2.文節単位ごとの構文・意味構造の自動付与:上記で構築したコーパスに対して、逐次解析に利用するためのデータとして、任意の文節列に対する構文・意味構造を、文節ごとに生成し割り当てた。その際、付与した文に対する構造を接合の逆操作を適用することにより、文節ごとの構造を自動で決定した。決定した部分構造の妥当性について、データのサンプルを観察することにより検査することにより確認した。 3.音声言語コーパスの分析:上記で作成したコーパスに対して、「言語単位の分析(文節が長くなるに従って構造が成長するプロセスを観察し、逐次解析で利用すべき単位を検討)」「構文構造の分析(文節ごとの構文構造を計算するのに有効な統計情報を音響・語彙・文法・意味の観点から検討)」「意味構造の分析(文節ごとの意味構造を正しく計算するのに有効な統計情報を音響・構文の観点から検討」を各々実施した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
これまでに構文・意味構造が付与された音声言語コーパス(講演データ及び会話データ)の作成が完了しており、今後、展開する研究において使用することができる。また、作成したコーパスについて、言語、構文、意味の観点からの分析を多様な観点から施しており、この知見は、次年度以降の研究課題である解析アルゴリズムの実現に利用することができる。以上の通り、本研究課題は順調に進展しているといえる。
|
今後の研究の推進方策 |
これまでに作成・分析した音声言語コーパスは、本研究全般において利用する研究資源となる。今後は、このコーパスを用いて、同時的な解析のための構文解析アルゴリズム、意味解析アルゴリズム、及び、それらの統合である構文・意味解析アルゴリズムの開発、ならびに、その有効性の検証を推進する方針である。 現状において、研究を遂行する上での問題点などは発生しておらず、研究計画の大きな変更を要する状況にはない。
|