2010 Fiscal Year Annual Research Report
Project/Area Number |
22300051
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Nagoya University |
Principal Investigator |
松原 茂樹 名古屋大学, 大学院・情報科学研究科, 准教授 (20303589)
|
Co-Investigator(Kenkyū-buntansha) |
柏岡 秀紀 独立行政法人情報通信研究機構, 室長 (10395022)
加藤 芳秀 名古屋大学, 情報基盤センター, 特任助教 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
|
Keywords | 自然言語処理 / コーパス / 構文解析 / 意味解析 / 音声言語処理 / 漸進的解釈 / 談話理解 / 構文木 |
Research Abstract |
本研究は、音声言語処理システムにおける「発話を聴きながら理解する機能」を実現するための日本語話し言葉処理技術の開発を目的としている。大規模音声言語データに対して、構文・意味構造を文節単位で付与したコーパスを構築し、統計的アプローチに基づく逐次的な解析技術を開発することを目指す。上述の目的を達成するために、初年度は、本研究を遂行する上で基盤となる言語資源の整備を実施した。具体的には以下の項目の研究を推進した。 1.構文構造及び意味構造が付与された音声言語コーパスの作成 音声が書き起こされたコーパスに対して、構文構造及び意味構造を付与するとう方針のもと、コーパスの作成を開始した。対象としての「同時通訳コーパスの日本語講演データ」「車内対話コーパスの日本語対話データ」を選定した。構造の付与は、複数のアノテーション作業者により実施し、作業効率を重視し、言語処理ツールを利用した半自動での作業環境を整備した。なお、この作業は来年度以降も継続して巣進めることを予定している。 2.構文構造と意味構造を表現するデータ構造の策定 日本語話し言葉の構文及び解析結果を表現するためのデータ構造について検討を行った。本研究におけるデータ構造としては、従来の解析と異なり、「文の部分に対する構文構造、意味構造を表現でき、かつ、両構造間で対応がつくこと」及び、「文節などの文構成素の追加に対応する構文構造、意味構造の更新を構成的に計算できること」を満たすという条件のもの策定した。構文構造として係り受け構造、意味構造として述語項構造を採用した。
|
Research Products
(7 results)