• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

大規模音声言語コーパスを用いた独話文の統計的係り受け解析技術の開発

Research Project

Project/Area Number 17700148
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionNagoya University

Principal Investigator

松原 茂樹  名古屋大学, 情報連携基盤センター, 助教授 (20303589)

Project Period (FY) 2005 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥3,600,000 (Direct Cost: ¥3,600,000)
Fiscal Year 2006: ¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 2005: ¥1,800,000 (Direct Cost: ¥1,800,000)
Keywords音声言語処理 / 自然言語処理 / 構文解析 / 係り受け解析 / 独話 / 字幕生成 / 日本語処理 / 話し言葉 / 音声言語 / コーパス / 自然言語 / データベース / 言語資源
Research Abstract

本研究では、講演等の同時通訳における要素技術として利用することを想定し、音声入力に追従して処理可能(実時間性)、入力途中の段階でそれまでの部分に対する構文構造を生成可能(漸進性)、ならびに、日本語文法に逸脱する文であっても解析可能(頑健性)、を備えた独話音声の構文解析手法を開発している。最終年度は、独話音声の解析システムの設計・実現、及び、解析システムの評価を実施し、以下に示す成果を得ることができた。
(1)独話音声の解析システムの設計・実装:解析単位認識プログラム、及び、統計的な係り受け解析プログラムを設計し、実装した。解析単位の認識には、節境界解析プログラムCBAPを使用し、独話文だけでなく、独話全体の解析が可能となるように、文境界が未知である状況で決定的に節境界を検出できる枠組みとした。統計的な係り受け解析では、大量の構文木データから係り受け確率を学習した。学習には、あらかじめ人手で作成した約5000文の構文木つき独話文データを使用した。係り受け解析を漸進的に実行するために、節境界が検出されるたびに、節の内部の文節の係り受け解析を実行し、また、節の最終文節の係り受け解析については、節が入力されるたびにその係り先を検討し、解析状況に応じて動的に決定する仕組みを定めた。本手法によれば、漸進的に係り受け先が決定すると同時に、解析結果に基づいて文末を判定することも可能であり、講演音声の同時的なアプリケーションにおいて利用可能なシステムとして実現している。
(2)解析システムの評価:昨年度に開発した方式をもとに実装したシステムの総合評価を実施した。テストデータとして10分程度の実際の講演音声を使用した。講演全体に対する解析結果を評価対象とし、解析単位に基づく漸進的な手法の効果と限界を明らかにした。その結果、リアルタイムでの漸進的な構文解析を85%程度の精度で実行できること確認した。
本研究による成果については、2編の学術雑誌論文、及び、2編の国際会議論文等により公表した。

Report

(2 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • Research Products

    (14 results)

All 2007 2006 2005 2004

All Journal Article (12 results) Book (1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] 節境界に基づく独話の漸進的係り受け解析2007

    • Author(s)
      大野 誠寛
    • Journal Title

      電子情報通信学会論文誌 J90-D・22

      Pages: 556-566

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 独話音声の言語処理技術とその応用2006

    • Author(s)
      松原 茂樹
    • Journal Title

      電気関係学会東海支部連合大会講演論文集

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Structured Sentence Retrieval Based on Lexical Dependencies2006

    • Author(s)
      Shigeki Matsubara
    • Journal Title

      The Fourth Symposium on Intelligent Media Integration for Social Information Infrastructure

    • NAID

      120006667869

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 依存構造に基づくコーパス検索2006

    • Author(s)
      加藤 芳秀
    • Journal Title

      電子情報通信学会論文誌 J89-D・2

      Pages: 2766-2770

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Simultaneous English-Japanese Spoken Language Translation Based on Incremental Dependency Parsing and Transfer2006

    • Author(s)
      Koichro Ryu
    • Journal Title

      Proceedings of Joint 21th International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics (COLING/ACL-2006)

      Pages: 683-690

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Influence of Pause Length on Listeners' Impressions in Simultaneous Interpretation2006

    • Author(s)
      Tomohiro Ohno
    • Journal Title

      Proceedings of Joint 21th International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics (COLING/ACL-2006)

      Pages: 169-176

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 漸進的係り受け解析に基づく独話音声のリアルタイム字幕生成2006

    • Author(s)
      大野 誠寛
    • Journal Title

      言語処理学会第12回年次大会

      Pages: 1003-1006

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 日本語対話文における同時通訳単位-声対話コーパスを用いた分析-2006

    • Author(s)
      丁 哲
    • Journal Title

      言語処理学会第12回年次大会

      Pages: 272-275

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Incremental Dependency Parsing of Japanese Spoken Monologue Based on Clause Boundaries2005

    • Author(s)
      Tomohiro Ohno
    • Journal Title

      Proceedings of 9th European Conference on Speech Communication and Technology (Interspeech'2005-Eurospeech)

      Pages: 3449-3452

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Interpreting Unit Segmentation of Conversational Speech in Simultaneous Interpretation Corpus2005

    • Author(s)
      Zhe Ding
    • Journal Title

      Proceedings of International Conference on Speech Database and Assessments (Oriental COCOSDA-2005)

      Pages: 148-152

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 話し言葉解析に基づく話者知識の自動獲得2005

    • Author(s)
      小野 貴博
    • Journal Title

      人工知能学会全国大会 (CDROM)

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Towards Robust Spoken Dialogue System Using Large-Scale In-Car Speech Corpus2005

    • Author(s)
      Yukiko Yamaguchi
    • Journal Title

      Proceedings of Workshop on DSP for in-Vehicle and Mobile Systems (CDROM)

    • Related Report
      2005 Annual Research Report
  • [Book] Construction and Analysis of a Multi-Layered In-car Spoken Dialogue Corpus2005

    • Author(s)
      Nobuo Kawaguchi
    • Total Pages
      17
    • Publisher
      Springer
    • Related Report
      2005 Annual Research Report
  • [Patent(Industrial Property Rights)] 自動要約装置及びコンピュータープログラム2004

    • Inventor(s)
      大野 誠寛, 松原 茂樹, 柏岡 秀紀, 加藤 直人
    • Industrial Property Rights Holder
      中部TLO
    • Industrial Property Number
      2006-056145
    • Filing Date
      2004-07-26
    • Related Report
      2005 Annual Research Report

URL: 

Published: 2005-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi