2014 Fiscal Year Research-status Report
Project/Area Number |
24500640
|
Research Institution | Yokohama National University |
Principal Investigator |
田村 直良 横浜国立大学, 環境情報研究科(研究院), 教授 (20179906)
|
Co-Investigator(Kenkyū-buntansha) |
後藤 敏行 横浜国立大学, 環境情報研究科(研究院), 教授 (30234991)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 自動朗読 / 音声合成 / 視覚障がい / 自然言語処理 / 福祉情報処理 |
Outline of Annual Research Achievements |
対外的な発表はなく、次の学内の卒業研究2件:「ラジオドラマ生成システムにおける発話者同定に関する研究」および、「ラジオドラマ生成システムにおける効果音の割り当てに関する研究」のみである(本学理工学部情報工学EP平成26年度)。「ラジオドラマ生成システム」とは、当課題における自動朗読システムに相当するが、前者は、人物ごとに声質を変えるために物語中の登場人物を抽出する技術についての研究、後者は、ラジオドラマとしての完成度を高めるため文脈からふさわしい効果音を推定する研究であり、両者とも自動朗読システムおよび朗読コンテンツ作成支援システムにおける基礎的な技術である。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
機械学習による判定器では判定精度に限界があり、完全自動にできる精度が得られなかった。そのため、視覚障がい者の利用を前提とした簡易な朗読システムと、後編集機能を含む朗読コンテンツ作成支援ツールに分割して課題の達成を目指す必要があることが分かった。総合的に判断してMacintosh環境でシステムを開発することになったが、その環境下で動作する音声合成ソフトが市販されていないことが分かった。先に購入した音声合成ライブラリをWindows系サーバに、クライアント系をMacintosh系環境で利用できるように改造中である。 上記状況下で担当学生の休学が影響し、研究期間の延長を申請し許可された。
|
Strategy for Future Research Activity |
「朗読コンテンツの不足」をきっかけに発想した申請当初の目的を再検討し、ある程度の品質を確保しつつ視覚障がい者が簡単に利用できる朗読システムの開発と、コンテンツ不足を補うための朗読コンテンツ作成支援に分割して開発を進める。支援システムとしては自動化が重要であり、依然として話者判定や場面推定の高精度化が重要であることはかわらないが、自動朗読システムでは視覚障がい者が主たるユーザであるのに対し、支援システムでは健常者が主なユーザである。 話者判定と場面推定を当研究室の卒業研究で扱ったが、これを基礎に、システムとしての完成を目指す。また、完成したシステムを利用面から評価する。
|
Causes of Carryover |
機械学習による判定器では判定精度に限界があり、完全自動にできる精度が得られなかった。そのため、視覚障がい者の利用を前提とした簡易な朗読システムと、後編集機能を含む朗読コンテンツ作成支援ツールに分割して課題の達成を目指す必要があることが分かった。総合的に判断してMacintosh環境でシステムを開発することになったが、その環境下で動作する音声合成ソフトが市販されていないことが分かった。先に購入した音声合成ライブラリをWindows系サーバに、クライアント系をMacintosh系環境で利用できるように改造中である。 上記状況下で担当学生の休学が影響し、研究期間の延長を申請し許可された。
|
Expenditure Plan for Carryover Budget |
システム開発のための物品費121,754円(音声合成ライブラリのサーバー化100,000円、その他消耗品21,754円)、成果発表のための費用(旅費100,000円、その他論文発表、掲載費100,000円)、調査やデータ収集のための経費(人件費、謝金等50,000円)に、未使用額を割り当てることにしたい。および消耗品 27,000円
|