研究課題/領域番号 |
23700221
|
研究機関 | 立命館大学 |
研究代表者 |
森勢 将雅 立命館大学, 情報理工学部, 助教 (60510013)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 音声分析 / 音声合成 / 声質変換 / 聴覚 / バリアフリー |
研究概要 |
平成23年度は,当初の予定通り高品質音声分析合成法の構築,および音声聴取に適した既存の聴覚モデルに関する調査を実施した.また,本研究で重要となる音声聴取能力計測用のデータベースについても仮収録を行い,その有効性について検討した.以下ではそれぞれの成果について述べる.高品質音声分析合成法に関しては,従来の研究成果よりも高い精度で,なおかつ高速化も実現する方法を提案した.この方式を用いることで合成音声の品質を向上させることも可能となった.音声聴取実験では音声を合成することによる品質の低下を最低限にすることが望まれるため,本成果はきわめて重要な価値がある.音声分析合成法に関しては,学術論文4本,国際会議1本,国内学会7回の成果を得た.また,本研究に関連する内容について2件の賞を受賞した.これらの成果は,聴覚バリアフリーを実現するための基盤となる.聴覚モデルの調査に関しては,国内の学会で集中的な議論を行い,平成24年度以降実施すべき内容について研究資料を収集した.また,実環境での会話は無音ではなく騒音環境下で行われることから,騒音環境下での聴取能力を計測するための予備的実験を実施し,2012年3月に開催された日本音響学会2012年春季研究発表会で成果報告を行った.本研究で目指す聴覚バリアフリーに関しては,既存の聴覚モデルをそのまま適用することは難しく,平成24年度では既存のモデルを拡張するための検討を必要とすることが明らかになった. 音声データベースについては,1名の話者に対してレコーディングスタジオで仮収録した.現在は収録された音声の分析を行い,音声聴取実験に必要な単語群の選定を行っている.音声聴取実験では実験時間を短くすることが求められるため,この吟味は最終的な成果を達成するために重要な意味を持つ.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
3年間の研究計画のうち,平成23年度では高品質音声分析合成法の構築,および最先端聴覚モデルに対する徹底調査を挙げた.以下ではそれらについて詳細を説明する.また,平成24年度の実施計画であった内容の一部を前倒しで進めたため,その内容についても述べる.平成23年度に計画した音声を詳細に分析可能な新方式の基盤確立は,ほぼ目標通り達成されている.提案された方法は,従来方式よりも高い品質の音声を少ない計算コストで合成できる利点を有する.また,通常の発話だけではなく,例えば声帯に異常のある人が発話した音声を検出することが可能となった.この成果は,そのような聴取困難な特殊音声から通常の聞き取りやすい音声を復元することが可能にできるポテンシャルを有する.最先端聴覚モデルに対する徹底調査に関しては,既存の聴覚モデルに対する吟味を行った結果,本研究に最も適した動的圧縮型ガンマチャープ聴覚フィルタバンクを本研究用にカスタマイズすることを計画している.既存のモデルの多くは,音声明瞭度ではなく音が聞こえるか否かに対する基準であり,そのまま音声明瞭度の評価に用いることができない.現在は音声聴取用のデータベースを構築し,主観評価により聞き取りやすさに対する知見を蓄えている.蓄えられた主観評価結果のデータと聴覚モデルとが整合するようにモデルを修正することが今後求められることとなる.平成24年度に実施する音声聴取能力評価用の音声収録に関しては,前倒しで検討を進めている.1名の話者に対して仮収録を行い,発話内容や評価に用いる音声に関する検討を実施している.今後は,予備的な聴取実験により収録する音声の絞り込みを行い,平成24年度では複数話者を対象とした本収録を実施する予定である.
|
今後の研究の推進方策 |
平成23年度の研究はほぼ計画通りに進められているため,平成24年度も大きな計画の変更は無く当初の予定通り研究を推進する予定である.平成24年度の前半では,平成23年度に引き続き高品質音声分析合成法を本研究用にカスタマイズするための検討を実施し,効率よく研究を進めるための基盤とする.平成24年度に計画している聴取評価用の音声データベースの仮収録は完了し,現在はデータベース整備の準備を整えている.また,収録したデータベースを用いて音声聴取能力計測を目的とした聴取実験も予備的に進めている.音声聴取能力評価用の音声データベースは複数人の話者が必要となるため,収録音声に関する吟味や話者数の吟味を,収録するレコーディングスタジオと打ち合わせしつつ決定する.それらの検討後,概ね平成24年度の8, 9月を目安に音声収録を行い,データ整備を行う.平成23年度で調査した聴覚モデルに関する知見,および学会での討論により様々な資料を収集しており,本研究に適したモデルを既存のモデルを改良することで新たに構築することを計画している.既存の聴覚モデルは音声聴取を対象としていないため,音声聴取能力と聴覚モデルとを結びつけるための主観評価が求められることとなる.本実験は,最終的な目標となる聴覚バリアフリーを実現するための指針となりうる.平成24年度の後半では,最終的な目標である聴覚バリアフリーの実現を目指した声質変換法について検討する.同時期に収録された音声データベースを用いて様々な声質制御を実施し,高齢者・難聴者に聞き取りやすいと思われる声質を作るための基礎的な検討を行う予定である.それらのついての詳細な評価は最終年度の課題とするが,平成24年度では予備的な主観評価により声質変換の方向性を確定させるための検討を実施する
|
次年度の研究費の使用計画 |
平成24年度は,多人数の主観評価を効率よく実施するため,主観評価用の環境構築を行う.具体的には,評価用に必要となる静音性の高いPC,高品質な音を再生するためのオーディオインタフェース,複数人での主観評価を効率良く実施するためのヘッドホン複数台が該当する.これらの機器を接続するためのオーディオケーブルや音声データや結果を記録するための外付けHDD等の消耗品も必要となる.主観評価における被験者 (現段階では10~20名を予定)と,実験補助者1名に対する謝金を計上する.評価用音声データベースの本構築を実施するために,レコーディングスタジオをレンタルするための費用,および音声提供者への謝金を計上する.また,収録を行う前にスタジオとの打ち合わせを実施するための旅費も必要とする. 国内旅費としては,2012年9月に長野で開催される日本音響学会2012年秋季研究発表会,同学会2013年春季研究発表会で研究成果を発表し研究内容について第一線の研究者と議論する.また,その他にも年2, 3回程度国内の研究会等で聴覚やバリアフリーを専門とする研究者との研究打ち合わせを実施する. 海外旅費としては,2012年8月にアメリカのポートランドで開催されるINTERSPEECH 2012に参加し,高品質音声分析合成システムに関する研究発表,および音声研究に関する議論を行う予定である.また,国際会議発表・参加に係る費用,質の高い英語論文を投稿するため英語校閲の費用も必要となる.また,平成23年度に得られた成果の多くは学会での発表が中心だったため,平成24年度ではそれらの成果を国内・海外の学術論文に投稿し年度内の採録を目指す.
|