研究課題/領域番号 |
21K11941
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 日本工業大学 |
研究代表者 |
大田 健紘 日本工業大学, 基幹工学部, 助教 (50511911)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 無発声音声認識 / 深層学習 / 三次元計測 / 音素 / 音声認識 / 機械学習 / 生体情報 / センサ技術 |
研究開始時の研究の概要 |
本研究は、音声を用いることなく発話内容を認識するための技術を確立し、それを実用化することを目標としている。そのためには口の形や動きなどを定量化するためのセンサ技術を明らかにし、より実用的な認識技術とするために、ヒトの自然な発話動作や発話中の身体の動作に対しても頑健な特徴量を明らかにする。 本研究の成果は,喉頭がんなどの原因により後天的に発声が困難になった人々に対して発声を補助するデバイスの開発や、雑音・残響がひどい環境での音声認識、会話におけるプライバシー保護、さらには防犯など幅広い分野への応用が期待できる。
|
研究成果の概要 |
研究期間全体を通して本研究では、声帯を除去するなど発声が困難となった人の発話の補助や、既存の音声認識を補助するシステムの検討を目的とした。その結果、音声情報を用いることなく音素単位で文章を認識する深層学習を用いた技術について検討ができた。そして、発声補助方法として、カメラ及び指の皮膚電気抵抗を計測するセンサを用いた感情の推定技術やテキストからの音声合成技術について取り組み精度向上への基礎検討ができた。
|
研究成果の学術的意義や社会的意義 |
本研究は、音声情報を利用しない音声認識について、深層学習を用いた音素単位での文章認識を実現するためのデータ取得手法や深層ニューラルネットワークについて検討したことに学術的な意義がある。また、話者の感情推定や音声合成技術それぞれについて取り組み、発声が困難な方のための発声補助デバイスの開発に向けた基礎的な検討ができたことや課題の抽出ができたことに社会的な意義がある。
|