2015 Fiscal Year Annual Research Report
音声処理技術と言語処理技術を活用した電子ノート作成支援システムの研究
Project/Area Number |
26282049
|
Research Institution | University of Yamanashi |
Principal Investigator |
西崎 博光 山梨大学, 総合研究部, 助教 (40362082)
|
Co-Investigator(Kenkyū-buntansha) |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
北岡 教英 徳島大学, ソシオテクノサイエンス研究部, 教授 (10333501)
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)
宇津呂 武仁 筑波大学, システム情報工学研究科(系), 教授 (90263433)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 電子ノート / 雑音下音声認識 / 不特定話者音声認識 / 音声中のキーワード検出 / ユーザインタフェース / 言語モデル学習支援 |
Outline of Annual Research Achievements |
本研究では,授業で利用するための電子ノート作成支援システムを開発し,これによるノート作成補助および電子ノートコンテンツをeラーニング教材に利用したときの学習効果を実証することを目的としている.具体的な研究項目は, 1.音声・映像(静止画)を包括的に記録できる電子ノート作成支援システムを開発する, 2.授業音声の記録ならびに作成したノートコンテンツを有効利用するための音声処理・言語処理基盤技術を開発する, 3.eラーニング支援として本システムの学習効果を実証実験で明らかにする,の3点である.これらの研究項目のうち,平成27年度は1.および2.について取り組んだ. まず,1.に関連して,平成26年度に作成した電子ノート作成支援システムのプロトタイプの評価結果を踏まえて,改良を行った.平成27年度初頭に実施した評価結果では,利便性が確認されたものの,ユーザインタフェースに使いにくさが残る結果となったため,主にインタフェースの改良を行った.具体的には,ボタンの配置,画像の配置の改良などである. 次に,2.の項目において,音声処理の高度化について取り組んだ.具体的には,まず,雑音下での音声認識技術として,音響的な雑音に影響されない顔画像中の口唇の形状を用いた音声認識を試みた.従来の方法と比較し,口唇形状を捉えた新しい特徴量を導入したことで大幅な認識率の向上を得た.さらに,老若男女の不特定話者の音声認識のための音声認識手法を開発した.話者情報を補助情報として利用することで,音響モデルを改善し,従来手法と比べて優れていることを示した.また,授業を行う教員が自分の授業にあった言語モデルを半自動で構築できる枠組みも開発し,大幅に音声認識性能を改善できることを示した. これらの要素技術は電子ノート作成支援システムのユーザインタフェースや,これを用いた学習効果を高めるために必要不可欠である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
概ね順調に進展している.その理由は,実際に授業と連動して動作する電子ノート作成支援システムを概ね開発できたこと,音声・言語処理技術の基盤技術として,雑音下での,様々な年代・性別の教師に対する音声認識率の改善,授業内容に応じた音声認識モデルの構築などの開発が進んでいることにある.さらに,深層学習技術を用いることで,音声から特定のキーワードを検索する技術の性能の改善も得られたことも,この理由である. これらの技術は実際の授業では効果を測定していないが,評価音声データにおいて個々の技術の有効性を示すことができた.これらの成果については,国内外の学術会議と学術論文誌で発表している.さらに,平成27年度の研究成果を査読付きの国際会議や学術論文誌へ投稿する準備も進めている.
|
Strategy for Future Research Activity |
平成28年度(最終年度)は,1.音声処理基盤技術の開発・改良を引き続き進めていくとともに,2.これらの技術を備えた電子ノート作成支援システムを実際の授業や授業ビデオ閲覧で利用することで学習効果を確認する. 1. においては,平成27年度までに開発した基盤技術(雑音下音声認識,不特定話者の音声認識,授業にあった言語モデル学習支援,音声中の検索語検出(キーワード検出),音声ドキュメント検索)をより高度化していく予定である.高度化していくにあたり,最新の深層学習技術を取り入れる予定である. 2.については,平成27年度までで概ね完成した電子ノート作成支援システムを,まず,被験者実験で評価し,使いやすさなどのユーザインタフェースを中心に評価を実施する.また,これまでに開発してきた最新の音声処理・言語処理基盤技術を電子ノート作成支援システムに取り入れることで,電子ノート作成支援システムをより高度化・使いやすく改良していく予定である.一通りの評価・技術の実装が終わった後に,被験者に授業で実利用してもらったり,e-ラーニング教材の授業ビデオを使って学習をしてもらったりして,本システムを利用することでの学習効果などを検証する予定である.
|
Causes of Carryover |
既存の研究環境(計算機環境や携帯端末などの設備,データ,資料,など)を効率よく利用できたことから,物品費の出費を低く抑えることができた.また,被験者実験が平成28年度に持ち越しとなったため,そのための人件費の出費が少なくなった.さらに,投稿論文に関する費用(掲載費や英文校正費)を平成28年度の予算で支払うことになるため,その他の予算の使用も少なくなっている.
|
Expenditure Plan for Carryover Budget |
次の予算項目に使っていきたい.①被験者実験用のタブレット端末の購入などの設備投資による研究の加速化,②研究成果の発信(国内外の会議や論文投稿),③収集した音声・映像データの整備.
|
Research Products
(17 results)