2014 Fiscal Year Annual Research Report
音声認識にとって未知語となる擬態語を含む音声クエリで動作可能な図柄パタン検索法
Project/Area Number |
24500131
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
相川 清明 東京工科大学, メディア学部, 教授 (00367202)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 音声検索 / 擬態語 / 擬音語 / 未知語 / 感性情報 / パタン検索 / 音響特徴 |
Outline of Annual Research Achievements |
本研究課題では、言語的な表現が確定していない検索対象を音声で検索する方法を開発することを目的とした。初年度においては、主にデータベース収集を行った。パタンとその擬音語・擬態語表現の組を収集分類整理した。 次年度においては、音声認識によって得られる音素列を用いて登録してある擬音語・擬態語との類似性を音素間の類似度を定義することにより求める方式と音声認識において使用していない大局的音響特徴による類似度を使い分けることによるパタン検索法を提案した。この方法を、コミュニケーションシステムのLINEで雰囲気や感情を伝えるために用いられるスタンプの音声検索において検証した。また、音素列検索を用いる擬音語・擬態語音声による検索法を効果音検索に応用したシステムを作成した。このほか、音声検索の研究の一環として、音声指示による演奏スタイルを制御するシンセサイザの研究も行った。 最終年度においては、LINEのスタンプの音声検索を課題として、擬音語・擬態語によるスタンプ検索の研究を行った。音素認識結果による類似度と大局的音響特徴分析による類似度を同時使用することにより、スタンプ選択性能を向上させることができた。同時に、LINEにおいて2ユーザが双方とも音声入力により対話する状況を想定し、音声認識を用いて対話歴を、また、音声検索を用いてスタンプを表示するシステムを作成した。これらの結果は日本音響学会の2014年秋季研究発表会、2015年春季研究発表会、および、情報処理学会の音声言語情報処理研究会で発表した。この他、音の感情空間の分析のため、楽器音の音色と和音の組み合わせによる感情情報表現の研究を行い、日本音響学会の12月聴覚研究会で発表した。また、音とデザインの一致性をコンサートポスター作成の観点から研究を行った。 一連の研究を通じて、個人性の吸収には、複数の並行処理が必要であることが分かった。
|
Research Products
(5 results)