研究課題/領域番号 |
19300078
|
研究機関 | 山口大学 |
研究代表者 |
内野 英治 山口大学, 大学院・理工学研究科, 教授 (30168710)
|
研究分担者 |
末竹 規哲 山口大学, 大学院・理工学研究科, 准教授 (80334051)
畔津 忠博 山口県立大学, 情報化推進室, 講師 (70285451)
森田 博彦 (財)ファジィシステム研究所, 研究部, 主席研究員 (60270584)
|
キーワード | 音声変換 / ソフトコンピューティング / 自己組織化マップ / 機械学習 / 人工知能 |
研究概要 |
発音・発声障害者は、発音が不明瞭で言いたいことを相手にうまく伝えることが難しい。特に公共交通機関内や街中では、支援を必要とする機会が多いにも拘わらず、未だ十分な支援環境が整備されていない。発音・発声障害者の音声を聞き取り易い音声に自動変換できれば、これらの障害者の自立に大きく貢献するのは間違いない。本研究の目的は、実用化を念頭に、たえず騒音や雑音が存在する実騒音環境下において、発音・発声障害者の音声を健常者の音声へ自動変換するシステムを、ソフトコンピューティング技術を用いて開発し、発音・発声障害者の音声コミュニケーションの手段を確立することである。 本年度は、本システムの基礎となる音声の特徴量の特定、障害話者と健常話者間の音声特徴量間の関係、およびその変換可能性の基礎研究を行った。具体的には、音声の特徴量として、本年度はメルケプストラム係数を採用した。予備実験として健常話者の音声と、健常話者と同一内容で発声した擬似発音・発声障害者の不明瞭な音声を同時録音し、各録音音声のフレームごとのメルケプストラム係数の時間変化を観察した。その後、メルケプストラム係数間の関係を最初は近似的に線形システムで記述し、擬似発音・発声障害話者の音声ケプストラムを健常話者の音声ケプストラムへ変換した後、音声合成を行った。その結果、数単語の変換に成功した。現在、研究代表者らが既に開発している観測空間と特徴空間の情報を用いたクラス分類法(特許申請中)や、適応部分空間自己組織化マップ等を用いた雑音にロバストでより変換精度の高いシステムを開発中である。
|