研究課題/領域番号 |
19K20751
|
研究機関 | 姫路獨協大学 |
研究代表者 |
八木 直美 姫路獨協大学, 医療保健学部, 准教授 (40731708)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 発話障害 / リハビリテーション / 人工知能 / 簡易診断システム |
研究実績の概要 |
音声の生波形にパワースペクトル解析を適用し、時間領域の特徴量を周波数領域の特徴量に変換し検討を行った。短時間フーリエ変換(FFT)を適用して抽出した周波数波形データに対して2方法:線形予測分析(Linear Predictive Coding: LPC)、ケプストラム分析(周波数データを対数変換したものに対してさらにフーリエ変換を行う)でスペクトル包絡を適用し、スペクトル分析を行った。その時系列データを用いてフィルタの伝達特性を推定することが可能となった。また、線形予測分析で算出した波形については、嚥下音パターンを数種類のモデルに分類するために、多次元特徴量の低次元化を図った。ここでは、特定の周波数毎にフィルタバンクを作成し、平均化して波形を滑らかにすることによって特徴量の傾向を算出した。さらに、人間の聴覚には周波数の低い音に対して敏感で、周波数の高い音に対しては鈍感であるという性質があると言われている。すなわち、人の聴覚特性として、低周波領域では分解能が高く、高周波領域では分解能が低いとされており、通常のフィルタではバンク幅が等間隔であるのに対して、メルフィルタでは、低周波領域ほど間隔が狭く、高周波領域ほど間隔が広くなっているのが特徴である。音響データ識別を行う際に、人間の音の高さにおける感覚量を使用する方が良いとされており、メル尺度を採用した。また、臨床評価にも用いられている音響解析ソフトウエアPraat(アムステルダム大学Paul Boersma、David Weenink開発、無料ダウンロード可、音声合成等も可能)を用いて語の母音、子音、アクセント及びイントネーションを分析する音声解析を行った。簡易に音声を可視化して確認することができ有用性を確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、発話障害を簡易に診断してリハビリテーション可能な臨床応用できるエビデンスベースのシステム開発を目標としている。柔軟でロバストな手法を確立するための基礎研究を進めている。様々な手法で算出した特徴量を用いて、音響解析して得られた詳細結果よりパターンマッチング・ディープラーニング等を適用する準備等を進めている。
|
今後の研究の推進方策 |
音響解析で抽出した周波数領域、動的時間伸縮法の特徴量等の高次元データを用いて、言語的情報を組み合わせながら、機械学習により高精度な出力を実現する。パターンマッチング・ディープラーニング等の人工知能を適用して障害分類できるアルゴリズムを構築し、さらに健常者に可能な限り同等の音声作成のための音声復元等にも取り組む。
|
次年度使用額が生じた理由 |
国内学会、国際学会等にて発表する予定であったが、コロナ禍の状況より現地での発表が困難であったため、計画を変更して基礎研究を重点的に行うこととした。そのため、未使用額が生じた。最終年度に向けて、学会等での発表で情報収集しながら研究成果を公表する予定とし、未使用額はその経費に充てることとしたい。
|