2013 Fiscal Year Research-status Report
音声言語アプリケーションのための漸進的係り受け解析技術の開発
Project/Area Number |
25730134
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Nagoya University |
Principal Investigator |
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 依存構造解析 / 漸進的処理 / 構文解析 / 字幕生成 / 改行挿入 / リアルタイム処理 |
Research Abstract |
平成25年度は、係りと受けの組に加えて、係り先が未入力の文節については入力済みの文節に係らないことを明示した係り受け構造を任意の時点で出力できる係り受け解析器を開発した。具体的には、以下の【開発ステップ】、【解析実験ステップ】、【応用実験ステップ】を順に実施した。 【開発ステップ】 従来の係り受け解析手法のうち、代表的な手法を取り上げ、目的の漸進的係り受け解析器に改良可能かどうか、また、その親和性について、手法ごとに定性的な検討を行った。検討結果に基づき、各手法の解析途中結果から、任意の時点で目的の係り受け構造を出力できるように改良した。ただし、単に途中結果を出力するのではなく、入力済み文節には係らない確率を統計的に計算する機構を組み込むことにより、「入力済み文節には係らない」ことを同定する際の精度向上を図った。 【解析実験ステップ】 係り受け情報付きの講演音声コーパスを用いて解析実験を実施し、開発した各解析器の精度を定量的に比較評価した。実験結果に基づいてフィードバックできる点を考察し、各解析器をブラッシュアップした。 【応用実験ステップ】応用実験を行い、実際のアプリケーションに対する各解析器の有効性を評価した。アプリケーションとして、リアルタイム字幕生成のための逐次的な改行挿入手法を取り上げ、開発した各解析器から得られる構文的まとまりに関する情報を利用できるように改良を加えた。講演音声コーパスを用いて改行挿入実験を実施し、係りと受けの組に加えて、係り先が未入力の文節については入力済みの文節に係らないことを明示した係り受け構造を任意の時点で出力することの有効性を確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度の研究実施計画の通り、係りと受けの組に加えて、係り先が未入力の文節については入力済みの文節に係らないことを明示した係り受け構造を任意の時点で出力できる係り受け解析器を開発した。また、開発した漸進的係り受け解析器をリアルタイム字幕生成のための逐次的な改行挿入手法に応用し、実験により、その有効性を確認した。さらに、これらの研究成果を国際会議IWPT2013(The 13th International Conference on Parsing Technologies)で発表した。 ただし、初年度の研究実施計画では、人間の解析能力を複数名による被験者実験を通して調査し、その結果と開発した解析器の性能を比較評価することを計画していたが、本年度は人間の解析能力の調査方法について検討するに留まっている。 しかしその一方で、平成26年度の研究実施計画で予定していた、係り先が未入力の文節が複数ある場合、それらの係り先が同じであるかを明示した係り受け構造を任意の時点で出力できる係り受け解析器の開発を一部前倒して進め、その研究成果を言語処理学会第20回年次大会で発表した。 以上より、「概ね順調に進展している」と自己評価した。
|
Strategy for Future Research Activity |
研究はおおむね順調に進展しており、引き続き、平成26年度の研究実施計画に基づいて研究を進める。具体的には、「係り先が未入力の文節が複数ある場合、それらの係り先が同じであるかを明示した係り受け構造」を任意の時点で出力できる係り受け解析器の開発に取り組む。そのために、平成25年度と同様に、【開発ステップ】、【解析実験ステップ】、【応用実験ステップ】を順に実施する。なお、平成25年度に【開発ステップ】を一部前倒しして実施しており、その続きから研究を進める予定である。 【開発ステップ】平成25年度に開発した解析器を改良して、「係り先が未入力の文節が複数ある場合、それらの係り先が同じであるかを明示した係り受け構造」を任意の時点で出力可能な解析器を開発する。発話履歴から話者特性(係り受け構造パターンなど)を捉え、精度向上を図る。なお、開発がうまく進まない場合は、アプリケーション側の要求を考慮した特定の文節(述語の格要素など)に絞り、それらの係り先が同一かどうかのみを判定することとする。 【解析実験ステップ】平成25年度と同様に、講演音声コーパスを用いて解析実験を行い、解析器の性能を比較評価する。人間の解析能力との比較も実施する。また、実験結果に基づき解析器を洗練する。ここで、平成25年度に実施予定だった人間の解析能力調査も実施する。 【応用実験ステップ】平成25年度と同様に、応用実験を行い、実際のアプリケーションに対する解析器の有効性を評価する。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度の研究実施計画では、人間の解析能力を複数名による被験者実験を通して調査し、その結果と開発した解析器の性能を比較評価することを計画していたが、本年度は人間の解析能力の調査方法を検討するに留まったため、被験者に支払う謝金分だけ次年度使用額が生じた。なお、この遅延の一方で、平成26年度に実施予定の解析器の開発を一部前倒して実施しており、研究全体としてはおおむね順調に進んでいる。 平成26年度では、「係り先が未入力の文節が複数ある場合、それらの係り先が同じであるかを明示した係り受け構造」を任意の時点で出力可能な解析器を開発する予定である。その際、解析器の解析性能と人間の解析能力との比較を実施する予定である。この時に、人間の解析能力を複数名による被験者実験を通して調査する計画であり、次年度使用額(約20万円)を被験者への謝金として使用する予定である。
|
Research Products
(3 results)