2002 Fiscal Year Annual Research Report
大規模音声データベースの内容要約と音声対話による内容検索システムの研究
Project/Area Number |
13480095
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
宇津呂 武仁 豊橋技術科学大学, 工学部, 講師 (90263433)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
新田 恒雄 豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)
北岡 教英 豊橋技術科学大学, 工学部, 助手 (10333501)
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
|
Keywords | 音声認識 / 音声検索 / 音声対話 / 質問応答 / 情報検索 / ディクテーション |
Research Abstract |
前年度までに構築した音声検索システムに対して、その検索性能を推定するためのモデル化を検討した。テキスト入力のクエリーを用いた音声文書検索、音声入力型クエリーを用いたテキスト文書検索、それぞれについての検索性能を推定するためのモデル化を行った。考案したモデルにできるだけ実際の値に近いパラメータをセットし、検索シュミレーションを行った。実際の検索実験結果と比較すると検索性能に多少のずれが見いだされたが、現実に近いパラメータ(パープレキシティなど)の設定が難しいことを考えると、ほぼ実際に近いモデル化が構築できた。考案したモデルを用いることで、仮想的な検索シュミレーション行い、音声認識率の変化や文書データの大きさなどを変化させた場合にどのように検索性能が変化するのかを調べ、音声文書の検索性能は単語の正解率の影響が大きく、挿入誤り(認識精度)による影響をさほど受けないことがわかった。 音声文書検索の発展として、音声入力を用いた質問応答システムの開発を行った。現在の情報検索システムの多くは、ユーザが入力したクエリーに対する回答として文書全体を返す。しかし、実際にユーザが必要としているのは、その文書に含まれている一部分であることが多い。質問応答システムでは、文書単位の回答を行うのではなく、ずばりユーザの質問に対する答えを、数単語、1文で提示するシステムである。音声文書を対象とした質問応答システムの開発には、音声認識誤りの対処が重要である。本研究では、応答は音声で返す方法を考えており、そのため質問に対する答えの部分を見つけることに焦点をあて、単語クラス言語モデルを用いた音声認識により応答精度を高められることを明らかにした。
|
Research Products
(6 results)
-
[Publications] H.Nishizaki, S.Nakagawa: "Comparing Isolately Spoken Keywords with Spontaneously Spoken Queries for Japanese Spoken Document Retrieval"Proc. of ICSLP2002. 1505-1508 (2002)
-
[Publications] T.Utsuro, T.Harada, H.Nishizaki, S.Nakagawa: "A Confidence Measure Based on Agreement among Multiple LVCSR Models --Correlation between Pair of Acoustic Models and Confidence --"Proc. of ICSLP2002. 701-704 (2002)
-
[Publications] 小玉康広, 渡邊友裕, 宇津呂武仁, 西崎博光, 中川聖一: "機械学習を用いた複数の大語彙連続音声認識モデルの出力の混合"情報処理学会音声言語情報処理学会研究会. SLP45-16. 95-100 (2003)
-
[Publications] 西崎博光, 中川聖一: "音声文書検索の性能推定のモデル化とシュミレーションによる検討"電子情報通信学会音声研究会技術報告. SP-147. 159-164 (2002)
-
[Publications] 宇津呂武仁, 原田哲志, 渡邊友裕, 西崎博光, 中川聖一: "複数の大語彙連続音声認識モデルの出力の共通部分を用いた信頼度--信頼度を利用した複数モデルの出力の混合--"電子情報通信学会音声研究会技術報告. SP-22. 25-30 (2002)
-
[Publications] 西崎博光, 中川聖一: "文音声によるクエリーを用いた音声文書検索システムの試作"情報処理学会音声言語情報処理研究会. SLP-41. 25-30 (2002)