1993 Fiscal Year Annual Research Report
高精度音声認識と意味主導解釈による話者変動・非文法性に頑健な音声理解
Project/Area Number |
05452357
|
Research Institution | Kyoto University |
Principal Investigator |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
Co-Investigator(Kenkyū-buntansha) |
北澤 茂良 静岡大学, 工学部, 助教授 (00109018)
荒木 雅弘 京都大学, 工学部, 助手 (50252490)
河原 達也 京都大学, 工学部, 助手 (00234104)
|
Keywords | 音声認識 / 自然言語理解 / 意味解析 / 話者変動 / ロバストパーサ |
Research Abstract |
本研究は、話者や発声状況による変動、及び文法から逸脱した表現に対する頑健性を第一に指向した音声理解の方式の確立を目指すものである。平成5年度は自然な発話を収集し、分析を行なった。またその知見を基に、音声認識部・言語理解部を構築した。 1.自然な発話の収集と分析 発声サンプルの読み上げではなく、実際のマンマシンコミュニケーションに近い環境で、ユーザの自然な発話を収集し、書き起こしてデータベース化した。。そして、これらのデータから、自然な発話に固有の音声パターンの変動や、言語表現の変化、言い淀み・言い直し・間投語の挿入などの事象の分析を行なった。 2.頑健な音声認識部の構築 間投語の部分の音響的特徴としてはポーズの直後の出現が多いこと、比較的低く発音されること、モーラの長さが長いことがわかった。これらから独自の間投語HMMを構成し、間投語の抽出を試みている。また、現在の意味主導解釈手法からのフィードバックによって平均65%程度まで予測単語が絞り込めることがわかった。 3.意味主導の言語理解部の構築 文脈などの発話状況、タスクで扱う世界の常識を基に、キーワード(重要語)を手がかりに、かつ構文規則も補助的・検証的に用いつつ、発話を意味表現に変換する機構を構築した。知識表現としては意味ネットワークをを用い、その上での推論機構を実現した。現在は、話者の意図・心的状況との関係をモデル化、および韻律情報からの話者の意図の抽出に取り組んでいる。
|
-
[Publications] 河原達也,松本真治,堂下修司: "単語対制約をヒューリスティックとするA^*探索に基づく会話音声認識" 電子情報通信学会論文誌. J77-DII.No.1. 1-8 (1994)
-
[Publications] Kawahara,Araki,Doshita.: "Reducing syntactic perplexity of user utterances with automaton dialogue model." Int'l Sympo.on Spoken Dialogue. 65-68 (1993)
-
[Publications] 北岡教英,河原達也,堂下修司: "格構造を利用したright-to-left A^*探索に基づく会話音声認識." 電子情報通信学会技術報告. SP93-19. 41-48 (1993)
-
[Publications] 河原達也,荒木雅弘: "Spontaneous speechの理解のための処理モデル." Spontaneous Speechの分析・理解・生成に関するシンポジウム. 49-53 (1993)
-
[Publications] 北岡教英,河原達也,堂下修司: "自由発話認識・理解のためのフレーズスポッティング." 電子情報通信学会技術報告. SP93-116. 15-22 (1993)
-
[Publications] Araki,Kawahara,Doshita.: "A keyword-driven parser for spontaneous speech understanding." Int'l Sympo.on Spoken Dialogue. 113-116 (1993)