2001 Fiscal Year Annual Research Report
大規模音声データベースの内容要約と音声対話による内容検索システムの研究
Project/Area Number |
13480095
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
宇津呂 武仁 豊橋技術科学大学, 工学部, 講師 (90263433)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
新田 恒雄 豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)
北岡 教英 豊橋技術科学大学, 工学部, 助手 (10333501)
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
|
Keywords | 音声認識 / 音声検索 / ニュース音声 / 音声対話 / 移植性 / キーワード |
Research Abstract |
近年、過去のニュース番組から興味のある記事を見つけたいという欲求が高まっている。必要なニュースを見つける場合、各ニュースに対してインデックスが付けられている場合はそれを使って検索することができる。しかし、インデックスが付与されていないニュース音声データからの検索に対する需要もあり、この場合は放送されたすべてのニュースをあらかじめ文字化し、データベースとして蓄積しておく必要がある。この作業を人手で行うのは不可能に近く、大語彙音声認識システムを用い、自動的に書き起こすことになる。本研究では、自動的に書き起こしたデータベース(誤認識単語を含む、数種類の異なる認識率をもつもの)での検索性能を、テキスト入力のキーワードを用いて実験的に検討した。実験の結果、単語認識率が低いにもかかわらず、高い再現率を得ることができた。次に、検索対象となる単語を音声で入力し、提案した方法を使って実験を行い、その有効性を示した。 データベース検索を音声対話システムで実現するための要素技術である音声認識技術や言語処理技術の研究開発においては、今までのような使い易さ、頑健性などに関するだけでは不十分であり、拡張性や移植性なども十分考慮する必要がある。 本研究では、音声対話システムの移植性、特に意味理解部と検索部の移植性に焦点を当て、システムのドメイン・タスク独立な部分とドメイン・タスク依存な部分を明確に分割することにより、音声対話システム構築の効率をあげる方法を提案した。実際に、観光案内ドメイン・タスクと文献検索ドメイン・タスクの二つのドメインにシステムを適用し、システム構築の効率の評価を行なった。既存のドメイン・タスク依存のシステムの性能を比較した結果、意味理解率を落とすことなく、構築作業量を大幅に削減することができ、効率が向上した。
|
Research Products
(2 results)
-
[Publications] 西崎 博光, 中川 聖一: "音声キーワードによるニュース音声データベース検索手法"情報処理学会論文誌. 42・12. 3173-3184 (2001)
-
[Publications] 小暮 悟, 中川 聖一: "データベース検索用音声対話システムにおける移植性の高い意味理解部・検索部の構築と評価"情報処理学会論文誌. 43・2. 714-733 (2002)