人工知能技術を用いた音声理解システムの構築

研究課題

研究課題/領域番号	04044108
研究種目	国際学術研究
配分区分	補助金
応募区分	共同研究
研究機関	大阪大学
研究代表者	溝口理一郎大阪大学, 産業科学研究所, 教授 (20116106)
研究分担者	OH YungーHwan 韓国科学技術院, 電子計算機学科, 教授来村徳信大阪大学, 産業科学研究所, 助手 (20252710) 山下洋一大阪大学, 産業科学研究所, 助手 (80174689) 池田満大阪大学, 産業科学研究所, 助手 (80212786) YUNGーHWAN Oh 韓国科学技術院, 電子計算機学科, 助教授
研究期間 (年度)	1992 – 1993
研究課題ステータス	完了 (1993年度)
配分額 *注記	8,200千円 (直接経費: 8,200千円) 1993年度: 2,000千円 (直接経費: 2,000千円) 1992年度: 6,200千円 (直接経費: 6,200千円)
キーワード	音声認識 / 音声理解 / 韓国語 / ファジイ / 対話モデル / ATMS / ファジィ
研究概要	音声によるコンピュータとの対話を実現するために不可欠な技術課題として、音声の認識と理解、非単調推論(ATMS)、対話を管理するモデルの構築等を取り上げ、それぞれの技術的課題を解決するための基礎技術について研究を行なった。 1.本研究開始までに日本語に対して既に開発されていた知識工学的手法に基づく音声認識の枠組みを韓国語に対して適用し、有効に動作することを確認した。さらに、特徴パラメータの記号化および認識単位の選択法において本手法の改良を行った。音声認識ルールの記述を柔軟にするため、数値ではなく「高い」「増加する」などの言葉を使って規則を記述し、ファジイ処理によって特徴パラメータの記号化を行う。また、音声のセグメンテーションの問題を回避するため、物理的特徴の変化の極小点を境界とした不均一単位を認識対象とした。このような物理的特徴に基づいた単位を用いると単位の種類が増加するため、認識ルールの自動生成手法も導入している。認識結果として不均一単位の候補が決定された後、単位間の接続性を考慮した後処理を行い、最終的な認識結果を得る。本手法を韓国語の連続数字認識に適用し、97%の認識率を得た。 2.音声理解における自然言語処理を困難なものにしている要因の一つとして、音韻認識の不確実さに起因する候補数の増大が挙げられる。このような曖昧さを解消しつつ、与えられた音声に対する単語列を同定するためには、音声の持つ音響情報以外に高次の情報として言語情報や対話に関する情報を効果的に援用していかなければならない。そこで、音声理解のための言語処理方式として、ATMSに基づく方式を開発し、音声認識において生じる曖昧性を効率良く解消するための枠組みを示した。具体的には、文を意味的にまとまった「大きな句」と「小さな句」の二種類の単位で捉え、最適な組み合わせを探索する。音声認識の結果得られる文節ラティスから「小さな句」に相当する文構成要素を抽出し、文の構造を推定する。推定された構文のうち、もっともらしいものから順に文節候補を確定できるかどうかを単語の意味蘇生を用いて調べる。このような処理がATMS上に構築されており、一度行った推論の結果が有効に再利用される。日本語の8文章に対して評価実験を行った結果、総実行時間が64秒から45秒に減少した。 3.まず、音声による対話の特徴を調べるために、ある状況を設定して行う模擬対話の収録を行った。得られた対話例を分析することによって、「発話の対」および「意味的なまとまり」の二種類の構造が一般に対話に見られることを確認した。対話構造のモデル化に当たっては、汎用性の高い対話管理手法を実現するために、計算機側のシステム(問題解決器)に依存した知識とそうでない汎用的な知識に分離することによって、領域に依存しないような対話構造のモデル化を行なった。前者の構造に対しては、要求-応答といったやり取りを一つのプランとして捉えるSRプランによってモデル化する。対話例に見られたやり取りを分類・整理することによって、17個のプランを同定した。後者に対しては、発話の「話題」に注目した話題遷移モデル(TPN)を提案した。このモデルは関連話題をパケットにまとめ、さらにそれをネットワーク上に接続したものである。さらに、発話対を表現するSRプランにおいて、発話対の種類ごとに発話のパターンを分類整理し、話題に依存する発話の構成要素を明らかにした。このような対話モデルに基づいて、対話音声理解における発話の予測メカニズム手法を開発した。発話における話題を話題遷移モデルに基づいて決定し、さらに発話対に基づいた発話のパターンを話題によって具体化する。曖昧性を含んだ音声認識結果として分節ラティスを想定し、「案内」をタスクとした対話例に関して、本手法の有効性を検証した。

報告書

(2件)

1993 研究成果報告書概要
1992 実績報告書

研究成果
(18件)

すべてその他

すべて文献書誌 (18件)

[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of'93Korea/Japan Joint Conference on Expert Systems. 951-965 (1992)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Shingo Nishioka: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 International Conference on Spoken Language. 1641-1644 (1992)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Yoichi Yamashita: "MASCOTS II:A Dialog Manager in General Interface for Speech Input and Output" IEICE Trans.Inf.& Syst.E76-D. 74-83 (1993)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Yoichi Yamashita: "Next Utterance Prediction Based on Two Kinds of Dialog Models" Proceedings of EUROSPEECH'93.1161-1164 (1993)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Hajin Yu: "不均一単位を用いる連続音声認識エキスパートシステム" 電子情報通信学会技術研究報告. SP93-56. 57-64 (1993)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] 大田雅彰: "音声対話理解のための話題の決定について" 電子情報通信学会技術研究報告. SP93-129. 9-16 (1994)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of '93 Korea/Japan Joint Conference on Expert Systems. 951-965 (1992)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Shingo Nishioka: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 International Conference on Spoken Language. 1641-1644 (1992)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Yoichi Yamashita: "MASCOTS II : A Dialogue Manager in General Interface for Speech Input and Output" IEICE Trans. Inf. & Syst.E76-D. 74-83 (1993)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Yoichi Yamashita: "Next Utterance Prediction Based on Two Kinds of Dialog Models" Proceedings of EUROSPEECH '93. 1161-1164 (1993)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Hajin Yu: "Expert System for Continuous Speech Recognition with Non-Uniform Recognition Unit" Technical Report of IEICE. SP93-56. 57-64 (1993)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Masaaki Ohta: "Decision of Topic for Understanding of Spoken Language" Technical Report of IEICE. SP93-129. 9-16 (1994)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1993 研究成果報告書概要
[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of '93Korea/Japan Joint Conference on Expert Systems. 951-965 (1993)
- 関連する報告書
  1992 実績報告書
[文献書誌] Yoichi YAMASHITA: "MASCOTS II:A Dialog Manager in General Interface for Speech Input and Output" IEICE Trans.Inf.&Syst.E76-D. 74-83 (1993)
- 関連する報告書
  1992 実績報告書
[文献書誌] Shingo NISHIOKA: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 Intemational Conference on Spoken Language. 1641-1644 (1992)
- 関連する報告書
  1992 実績報告書
[文献書誌] 吉田英昭: "機械への音声入力のための汎用対話管理システム" 人工知能学会言語・音声理解と対話処理研究会資料. SIG-SLUD-9202-9. 77-85 (1992)
- 関連する報告書
  1992 実績報告書
[文献書誌] 平松敬史: "音声対話理解のための話題知識の利用" 電子情報通信学会技術研究報告. SP92-110. 55-62 (1992)
- 関連する報告書
  1992 実績報告書
[文献書誌] 山下洋一: "対話音声処理のための模擬対話の収録と分析" 日本音響学会秋季講演論文集. 23-24 (1992)
- 関連する報告書
  1992 実績報告書

人工知能技術を用いた音声理解システムの構築

研究代表者

溝口 理一郎 大阪大学, 産業科学研究所, 教授 (20116106)

8,200千円 (直接経費: 8,200千円)

報告書

研究成果

[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of'93Korea/Japan Joint Conference on Expert Systems. 951-965 (1992)

説明

関連する報告書

[文献書誌] Shingo Nishioka: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 International Conference on Spoken Language. 1641-1644 (1992)

説明

関連する報告書

[文献書誌] Yoichi Yamashita: "MASCOTS II:A Dialog Manager in General Interface for Speech Input and Output" IEICE Trans.Inf.& Syst.E76-D. 74-83 (1993)

説明

関連する報告書

[文献書誌] Yoichi Yamashita: "Next Utterance Prediction Based on Two Kinds of Dialog Models" Proceedings of EUROSPEECH'93.1161-1164 (1993)

説明

関連する報告書

[文献書誌] Hajin Yu: "不均一単位を用いる連続音声認識エキスパートシステム" 電子情報通信学会技術研究報告. SP93-56. 57-64 (1993)

説明

関連する報告書

[文献書誌] 大田雅彰: "音声対話理解のための話題の決定について" 電子情報通信学会技術研究報告. SP93-129. 9-16 (1994)

説明

関連する報告書

[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of '93 Korea/Japan Joint Conference on Expert Systems. 951-965 (1992)

説明

関連する報告書

[文献書誌] Shingo Nishioka: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 International Conference on Spoken Language. 1641-1644 (1992)

説明

関連する報告書

[文献書誌] Yoichi Yamashita: "MASCOTS II : A Dialogue Manager in General Interface for Speech Input and Output" IEICE Trans. Inf. & Syst.E76-D. 74-83 (1993)

説明

関連する報告書

[文献書誌] Yoichi Yamashita: "Next Utterance Prediction Based on Two Kinds of Dialog Models" Proceedings of EUROSPEECH '93. 1161-1164 (1993)

説明

関連する報告書

[文献書誌] Hajin Yu: "Expert System for Continuous Speech Recognition with Non-Uniform Recognition Unit" Technical Report of IEICE. SP93-56. 57-64 (1993)

説明

関連する報告書

[文献書誌] Masaaki Ohta: "Decision of Topic for Understanding of Spoken Language" Technical Report of IEICE. SP93-129. 9-16 (1994)

説明

関連する報告書

[文献書誌] Hajin Yu: "Fuzzy Expert System for Continuous Speech Recognition" Proceedings of '93Korea/Japan Joint Conference on Expert Systems. 951-965 (1993)

関連する報告書

[文献書誌] Yoichi YAMASHITA: "MASCOTS II:A Dialog Manager in General Interface for Speech Input and Output" IEICE Trans.Inf.&Syst.E76-D. 74-83 (1993)

関連する報告書

[文献書誌] Shingo NISHIOKA: "A Powerful Disambiguating Mechanism for Speech Understanding Systems Based on ATMS" Proceedings of 1992 Intemational Conference on Spoken Language. 1641-1644 (1992)

関連する報告書

[文献書誌] 吉田英昭: "機械への音声入力のための汎用対話管理システム" 人工知能学会言語・音声理解と対話処理研究会資料. SIG-SLUD-9202-9. 77-85 (1992)

関連する報告書

[文献書誌] 平松敬史: "音声対話理解のための話題知識の利用" 電子情報通信学会技術研究報告. SP92-110. 55-62 (1992)

関連する報告書

[文献書誌] 山下洋一: "対話音声処理のための模擬対話の収録と分析" 日本音響学会秋季講演論文集. 23-24 (1992)

関連する報告書

溝口理一郎大阪大学, 産業科学研究所, 教授 (20116106)