2002 Fiscal Year Annual Research Report
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
Project/Area Number |
14019046
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
北岡 教英 豊橋技術科学大学, 工学部, 助手 (10333501)
|
Co-Investigator(Kenkyū-buntansha) |
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
宇津呂 武仁 豊橋技術科学大学, 工学部, 講師 (90263433)
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Keywords | マルチモーダルインタフェース / 音声対話 / 言い直し発話検出 / 応答発話タイミング生成 / あいづち / 発話権 / フォーム型入力 / 氏名入力 |
Research Abstract |
本年度は、マルチモーダル対話インタフェースに関して以下のことを行った. 1.対話機能における認識誤り修正のための言い直し発話検出 音声対話では,状況の情報を制約として認識や対話制御に導入することが,音声認識においては性能向上に,対話理解・制御においては曖昧さ・誤解の認識と解消につながる.例えば,ユーザがシステムの誤認識に対して行う「言い直し」を検出することは認識・対話に有効であると考えられる.これまでに大語彙孤立単語認識を用いた地名入力タスクにおける言い直し検出法を提案し,認識性能改善に効果があることを示した.本報告書ではより一般的な対話における言い直しの検出に拡張することを試みた.ダイナミックプログラミングによる直前発話と現発話の対応付けおよび音声認識を行った結果に含まれる単語の重なり度合いを用いることによって,再現率94.8%、適合率89.2%で言い直しか否かを判定できた. 2.対話における応答タイミング生成 音声対話で自然さをつかさどる要素として、ユーザ発話に対して適切なタイミングで応答を返せることがある。リアルタイムに応答を返すために、韻律的情報および表層的言語情報を素性とした決定木を適用して相槌・発話権取得タイミングを生成する手法を考案し、実際の対話音声でタイミング生成させたものを主観評価した結果、人間と同等の自然さでタイミング生成できることを示した。 2.任意文字列の音声認識の研究 フォーム入力型のWebページで必要な連続音節の認識の高精度化を、特に氏名入力をタスクに行った.言語的な先見的知識を確率的に表現する言語モデルを氏名タスクに特化することで効果を得た。またその結果を音節ごとの候補リストとしてペンで選択して確定する手法を実装し、さらに効率的な入力であることを示した。
|
-
[Publications] 北岡教英: "カーナビの致命入力における誤認識時の言い直し発話の検出と認識"電気学会電子情報システム部門誌(C). Vol.122-C No.12. 2020-2027 (2002)
-
[Publications] Naoko Kakutani: "Detection and recognition of repaired speech on misrecognized ufferances for speech input of car navigation system"Proceedings of ICSLP-2002. 833-836 (2002)
-
[Publications] 竹内真士: "韻律・言語情報を素性とした決定木による自然な応答生成タイミングの検出"日本音響学会講演論文集. 75-76 (2003)
-
[Publications] 角谷 直子: "対話音声中の言い直し発話の検出"日本音響学会講演論文集. 79-80 (2003)
-
[Publications] 角谷 直子: "音声による地名入力タスクにおける誤認識時の言い直し発話の検出と認識"情報処理学会研究報告. 2002-SLP-42-11. 17-22 (2002)