• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

有限オートマトン近似に基づくロバストで高速な漸進的構文解析手法の開発とその評価

研究課題

研究課題/領域番号 15300044
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関名古屋大学

研究代表者

小川 泰弘  名古屋大学, 大学院・情報科学研究科, 助手 (70332707)

研究分担者 稲垣 康善  愛知県立大学, 情報科学部, 教授 (10023079)
外山 勝彦  名古屋大学, 大学院・情報科学研究科, 助教授 (70217561)
松原 茂樹  名古屋大学, 情報連携基盤センター, 助教授 (20303589)
MUHTAR Mahsut  名古屋大学, 大学院・国際開発研究科, 助手 (20283517)
大久保 弘崇 (大久保 弘祟)  愛知県立大学, 情報科学部, 助手 (40295580)
研究期間 (年度) 2003 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
13,400千円 (直接経費: 13,400千円)
2004年度: 5,000千円 (直接経費: 5,000千円)
2003年度: 8,400千円 (直接経費: 8,400千円)
キーワード自然言語処理 / 構文解析 / 有限オートマトン / アルゴリズム / 同時通訳 / 音声言語 / コーパス / 文脈自由文法 / 有限オートマン
研究概要

本研究では、同時通訳機能を備えた多言語間翻訳技術を開発することを目的に、音声入力と同程度の速度で処理できる高速な漸進的構文解析技術の開発を目標としてきた。構文木付き言語コーパスを使用し,文法規則の使用頻度等を適切に反映できる統計的手法に基づく近以変換手法を開発するというアプローチを選択した。具体的には以下の項目の研究を推進した。
○英語・日本語・タイ語のコーパス整備
名古屋大学統合音響情報研究拠点で収録された同時通訳対話コーパスを使用した。本研究では,このうち,24時間分の日本語データ,及びその英語対訳データを使用し,タイ語については,それに対する翻訳データを作成した。各言語コーパスに対して,句構造文法の形式で構文木データを付与した。
○構文木付き大規模コーパスからの統計情報の獲得
構文木が付与された言語コーパスから,各種統計情報を獲得するための手法について検討した。構文木における文法規則の出現位置を調べ,その文脈情報とともに記述することにより,それを統計的に分析した。
○有限オートマトン近似変換手法の開発
変換では,文脈自由文法を再帰遷移ネットワークの形式で表現し,それらを下降的に展開することによってオートマトンを作成した。展開方法として,確率計算にしたがって,使用頻度の高い弧を優先的に展開するアルゴリズムを開発した。
○漸進的構文解析システムの設計及び実装
文法獲得,有限オートマトン近似,及び,構文解析のシステムを設計し,実装した.実用的な解析の実現のために,数千万〜数億個程度の弧からなる有限オートマトンを作成した。
○構文解析の比較評価
ベンチマークを使って,英語,日本語,タイ語での構文解析実験を実施した。その結果に対して,精度,時間,構文木の数や形態など,多角的な観点からの本解析手法の比較評価を実施した。
2年間の研究を通し,文脈自由文法の有限オートマトン近似により,ロバストな漸進的構文解析手法の実現可能性を検証するとともに,解析の高速化への効果を確認することができた。

報告書

(3件)
  • 2004 実績報告書   研究成果報告書概要
  • 2003 実績報告書
  • 研究成果

    (19件)

すべて 2005 2004 その他

すべて 雑誌論文 (11件) 産業財産権 (2件) 文献書誌 (6件)

  • [雑誌論文] Incremental dependency parsing based on headed context-free grammar2005

    • 著者名/発表者名
      Yoshihide Kato
    • 雑誌名

      Systems and Computers in Japan 36・2

      ページ: 63-77

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [雑誌論文] Robust Dependency Parsing of Spontaneous Japanese Spoken Language2005

    • 著者名/発表者名
      Tomohiro Ohno
    • 雑誌名

      IEICE Transactions on Information and Systems E88-D・3

      ページ: 545-552

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [雑誌論文] CIAIR In-car Speech Corpus-Influence of Driving Status-2005

    • 著者名/発表者名
      Nobuo Kawaguchi
    • 雑誌名

      IEICE Transactions on Information and Systems E88-D・3

      ページ: 578-582

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Incremental dependency parsing based on headed context-free grammar2005

    • 著者名/発表者名
      Yoshihide Kato
    • 雑誌名

      Systems and Computers in Japan Vol.36, No.2

      ページ: 63-77

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Robust Dependency Parsing of Spontaneous Japanese Spoken Language2005

    • 著者名/発表者名
      Tomohiro Ohno
    • 雑誌名

      IEICE Transactions on Information and Systems Vol.E88-D, No.3

      ページ: 545-552

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] CIAIR In-car Speech Corpus-Influence of Driving Status-2005

    • 著者名/発表者名
      Nobuo Kawaguchi
    • 雑誌名

      IEICE Transactions on Information and Systems Vol.E88-D, No.3

      ページ: 578-582

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Expansion of a Japanese-Uighur Bilingual Dictionary by Paraphrasing2005

    • 著者名/発表者名
      Yasuhiro Ogawa
    • 雑誌名

      Journal of Natural Language Processing Vol.11, No.5

      ページ: 39-61

    • NAID

      10014051190

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] CLAIR in-car Speech Corpus -Influence of Driving Status-2005

    • 著者名/発表者名
      Nobuo Kawaguchi
    • 雑誌名

      IEICE Transactions on Information and Systems E88-D・3

      ページ: 578-582

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 日本語言い換え処理を利用した日本語-ウイグル語対訳辞書の拡充2004

    • 著者名/発表者名
      小川泰弘
    • 雑誌名

      自然言語処理 11・5

      ページ: 39-61

    • NAID

      10014051190

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [雑誌論文] Stochastically Evaluating the Validity of Partial Parse Trees in Incremental Parsing2004

    • 著者名/発表者名
      Yoshihide Kato
    • 雑誌名

      Proceedings of ACL Workshop Incremental Parsing

      ページ: 9-15

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [雑誌論文] CIAIR Simultaneous Interpretation Corpus2004

    • 著者名/発表者名
      Hitomi Tohyama
    • 雑誌名

      Proceedings of Oriental COCOSDA 2004

      ページ: 72-77

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [産業財産権] 同時翻訳用有限状態トランスデユーサの作成装置2004

    • 発明者名
      松原 茂樹, 稲垣 康善, 笠 浩一朗
    • 権利者名
      財団法人名古屋産業科学研究所
    • 産業財産権番号
      2004-216878
    • 出願年月日
      2004-07-26
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [産業財産権] 同時翻訳用有限状態トランスデューサの作成装置2004

    • 発明者名
      松原 茂樹, 稲垣 康善, 笠 浩一朗
    • 権利者名
      財団法人名古屋産業科学研究所
    • 産業財産権番号
      2004-216878
    • 出願年月日
      2004-07-26
    • 関連する報告書
      2004 実績報告書
  • [文献書誌] 大原 誠: "同時通訳を介した異言語間対話の時間的特長--逐次通訳との比較に基づく対訳コーパスの分析"通訳研究. 3. 35-53 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Koichiro Ryu: "Bilingual Speech Dialogue Corpus for Simultaneous Machine Interpretation Research"Proceedings of Oriental International Coordinating Committee on Speech Databases and Speech I/O System Assessment. 217-224 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Tomohiro Ohno: "Spiral Construction of Syntactically Annotated Spoken Language Corpus"Proceedings of IEEE International Conference on Natural Language Processing and Knowledge Engineering. 477-483 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Makoto Ohara: "Automatic Extraction of Translation Patterns from Bilingual Legal Corpus"Proceedings of IEEE International Conference on Natural Language Processing and Knowledge Engineering. 150-157 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Yuki Irie: "An Advanced Japanese Speech Corpus for In-car Spoken Dialogue Research"Proceedings of Oriental International Coordinating Committee on Speech Databases and Speech I/O System Assessment. 209-216 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Itsuki Kishida: "Construction of an Advanced In-Car Spoken Dialogue Corpus and its Characteristic Analysis"Proceedings of 8th European Conference on Speech Communication and Technology. (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2021-04-07  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi