2013 Fiscal Year Annual Research Report
Project/Area Number |
22300051
|
Research Institution | Nagoya University |
Principal Investigator |
松原 茂樹 名古屋大学, 情報科学研究科, 准教授 (20303589)
|
Co-Investigator(Kenkyū-buntansha) |
柏岡 秀紀 独立行政法人情報通信研究機構, 脳情報通信融合研究セン ター, 室長 (10395022)
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
|
Project Period (FY) |
2010-04-01 – 2015-03-31
|
Keywords | 自然言語処理 / 音声言語処理 / 構文解析 / 意味解析 / 言語生成 / 文整形 / 機械翻訳 / 音声要約 |
Outline of Annual Research Achievements |
本研究は、音声言語処理システムにおける「発話を聴きながら理解する機能」を実現するための日本語話し言葉処理技術の開発を目的としている。大規模データを用いた統計的アプローチのもと逐次的な解析技術を開発する。上述の目的を達成するために、今年度は、英語ならびに日本語の逐次解析システムの開発とリアルタイム音声言語システムへの応用を進めた。具体的には以下の項目の研究を推進した。 1.英語の解析手法の開発:長距離依存関係は、ゼロ代名詞の照応関係や構成素の移動などの言語現象を表現する。逐次構文解析において長距離依存関係を同定できれば、リアルタイム音声言語システムの性能向上につながる。本研究では、逐次構文解析において長距離依存関係を同定する手法を実現した。逐次解析により生成される部分構文木から、ルールに基づき長距離依存関係を同定でき、スラッシュ素性を構文木に付与することにより、高い精度で実現できることを解析実験により確認した。 2.日本語の解析手法の開発:逐次的な係り受け解析は、文の入力途中の段階で文節間の依存関係を同定するものであり、入力音声に追従した出力が求められる音声言語システムに有用である。本研究では、システムが文節間の依存関係に関する情報をできる限り早期に利用できることが望ましいという観点から、逐次的な係り受け解析が生成する係り受け構造とその解析手法を実現した。この手法は、文節が入力されるごとに解析を実行し、既入力の文節間の依存関係、並びに、係り先が未入力の文節に対しては既入力の文節との非依存性を同定し、それを明示した係り受け構造を生成する。 3.リアルタイム字幕生成への応用:逐次的な解析技術をリアルタイム字幕生成に適用し、係り先が未だ入力されていないという情報が文節列の構文的なまとまりの成否の検出に利用でき、字幕テキストにおける改行位置の同定に有効に機能することを確認した。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Research Products
(6 results)