研究課題/領域番号 |
16H02847
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 情報学研究科, 教授 (00234104)
|
研究分担者 |
秋田 祐哉 京都大学, 経済学研究科, 准教授 (90402742)
|
研究協力者 |
広瀬 洋子
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
16,250千円 (直接経費: 12,500千円、間接経費: 3,750千円)
2018年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2017年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2016年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
|
キーワード | 音声認識 / コンテンツ・アーカイブ / 機械学習 / 字幕付与 / 情報保障 |
研究成果の概要 |
入力音声から単語系列に直接写像するEnd-to-Endの枠組みに基づく音声認識を提案し、従来の音声認識手法と比較して、処理時間を大幅に(1/30以下)に削減しながら、高い認識精度を実現できることを示した。また、講演・講義を対象として字幕を付与するシステム(http://caption.ist.i.kyoto-u.ac.jp/)を構築・試験運用した。さらに、パソコンでも動作する音声認識パッケージを構成し、聴覚障害者の情報保障のためにリアルタイムで字幕を付与するソフトIPtalk(http://www.s-kurita.net/)に統合して一般に公開した。
|
研究成果の学術的意義や社会的意義 |
障害者差別解消法の施行に伴い、講義や講演において聴覚障害者に対する情報保障、すなわち字幕付与が求められているが、現状では量と質の両方において十分でない。これを支援するための音声認識技術の研究開発を行った。新たな深層学習に基づくモデルを導入することで、認識精度と速度の両方で大きな改善が得られた。サーバベースで音声ファイルに字幕を付与するシステム(http://caption.ist.i.kyoto-u.ac.jp/)に加えて、パソコン要約筆記で一般的に用いられているIPtalkにも音声認識の組込みを行い、一般公開した。また、『聴覚障害者のための字幕付与技術』シンポジウムを開催した。
|