1992 Fiscal Year Annual Research Report
音声入力を想定したあいまいな発話文の理解システムに関する研究
Project/Area Number |
03452167
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
山本 幹雄 豊橋技術科学大学, 工学部, 助手 (40210562)
奥山 徹 豊橋技術科学大学, 工学部, 講師 (30177191)
|
Keywords | 音声対話 / 自然言語処理 / 自然言語解析 / 文脈処理 / 対話システム / 間投詞 / 言い淀み / 言い直し |
Research Abstract |
これまでに研究されてきた音声対話システムは、その対象を主に整った形の話し言葉を中心としている。しかし、話し言葉には文法を逸脱した表現が付き物であり、さまざまな逸脱した文に対する分析・理解が必要とされている。 昨年度は、助詞落ちと倒置の表現に対して、通常の文のように解析できる手法を提案した。本年度は、話し言葉の文法の逸脱の一つとして間投詞を対象として、その出現位置の特徴を分析し、その結果に基づいて音声認識システムを構築し、評価した。 今回、節という概念を導入し、最大で4個所(前後を別に考えれば6個所)の観測位置のみでも90%弱の間投詞が観測できた。この結果から、間投詞の出現位置には偏りがあり、文の意味的な区切りとなるような所に現れやすいことがわかった。 間投詞を含んだ文を音声認識部で取り扱うために、文脈自由文法によって記述されているタスクの構文知識の中に、間投詞の語彙を追加し、間投詞の挿入を認めるよう書き換え規則を修正した。 認識実験のためのタスクは観光案内に関するもので、富士山周辺以外の観光地名等を含めて、総語彙数は約500単語である。構文知識を記述する文脈自由文法は、間投詞の語彙を含まないオリジナルのものは、非終端記号184、ワードクラス数(文法的に等価な非終端記号の集合)193、書換規則数440からなっている。この他にワードクラスから終端記号への書換規則が556ある。間投詞を含んだ文の認識のための文法には、新たに「えと」、「えーと」、「あの」、「あのー」、「え」、「えー」、「あ」、「あー」、「ま」、「まー」、の計10個の間投詞を語彙として追加登録し、文頭などに入ることができるように書き換え規則を修正した。この方法は、単語パープレキシティの増加と計算量の増加が問題となるが、文認識の性能としては、間投詞を含まない文の認識結果とあまり変らず、良好な結果が得られた。
|
Research Products
(4 results)
-
[Publications] 山本 幹雄: "音声対話文における助詞落ち・倒置の分析と解析手法" 情報処理学会論文誌. 33. 1322-1330 (1992)
-
[Publications] Mikio Yamamoto: "A spoken dialog system with verification and clarification gueries" IEICE Trans.Inf.& Syst.E76-D. 84-94 (1993)
-
[Publications] 森屋 裕治: "対話予測を利用した音声による観光案内対話システム" 電子情報通信学会,音声研究会技術報告. SP92-121. 43-50 (1993)
-
[Publications] 小林 聡: "間投詞の出現位置の特徴分析と音声認識システムの評価" 電子情報通信学会,第2種研究会,SPREC,. 92-3. 21-25 (1993)