2003 Fiscal Year Annual Research Report
大規模音声データベースの内容要約と音声対話による内容検索システムの研究
Project/Area Number |
13480095
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
北岡 教英 豊橋技術科学大学, 工学部, 講師 (10333501)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
新田 恒雄 豊橋技術科学大学, 大学院・工学研究科, 教授 (70314101)
宇津呂 武仁 京都大学, 大学院・情報学研究科, 講師 (90263433)
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
|
Keywords | 音声認識 / デコーダ / 音声要約 / 音声検索 / 質問応答システム / 対話システム / ディクテーション |
Research Abstract |
音声認識の基本技術として、複数システムの認識結果の混合法による候補単語の選択法を提案し、認識率の向上を得た。単語列探索法として1best近似木構造辞書展開探索法とN best線形辞展開探索法を併用する方法を提案し、探索エラーを大幅に減らすことができた。 ニュース音声と講演音声に対して、韻律情報と表層的な情報を用いた音声要約法を開発した。韻律パターンによって係り受け関係を抽出し、係り部分を省略する方法や手がかり語の前後の文の長いポーズの直前の5文などを用いる手法の有効性を確かめた。 Webの音声入力による検索に対しては、上述の複数システムの混合法によりキーワードの認識精度を向上させることができ、200万ページからのWeb検索で有効性を実証した。また、ニュース音声ドキュメントに対して質問応答するシステムを試作した。これは、ニュース音声を、一旦、音声認識装置で書き起こしておき、「小泉首相はいつ就任したか」などのタイプ入力による質問に答えるものである。テキストを対象とした通常の方法よりも音声認識誤りに頑健な答えを含む文の抽出法を提案しその有効性を確認した。 一般的なデータベースと数十〜数百の対話例を用意するだけで、音声によるデータベース検索ができる汎用性の高いデータベース検索システムを開発した。特に本年度はEDR辞書を用いた汎用性の高い意味理解部の開発を行い、富士山観光案内、文献検索、ホテル検索に適用し有効性を示した。
|
Research Products
(6 results)
-
[Publications] 宇津呂武仁: "複数の大語彙連続音声認識モデルの出力の共通部分を用いた高信頼度部分の推定"電子情報通信学会論文誌. 86-DII, 7. 974-987 (2003)
-
[Publications] 西崎博光: "音声認識誤りと未知語に頑健な音声文書検索手法"電子情報通信学会論文誌. 86-DII, 10. 1369-1381 (2003)
-
[Publications] 北岡教英: "N-best線形辞書検索と1-best近似木構造辞書探索の併用による大語彙連続音声認識"電子情報通信学会論文誌. 87-DII, 3. 799-807 (2004)
-
[Publications] Kiyomori Ohtake: "Newscast speech summarization via sentence shortening based on prosodic features"Proc.Workshop on Spontaneous Speech Processing and Recognition. 167-170 (2003)
-
[Publications] Satoshi Kobayashi: "Extracting summarizing of lectures based on linguistic surface and prosodic information"Proc.Workshop on Spontaneous Speech Processing and recognition. 211-214 (2003)
-
[Publications] Masamitsu Umeda: "Interpreter for highly portable spoken dialogue system"Proc.4-th Sigdial Workshop on discourse and Dialogue. 105-114 (2003)