研究課題/領域番号 |
18K18170
|
研究機関 | 阿南工業高等専門学校 |
研究代表者 |
太田 健吾 (太田健吾) 阿南工業高等専門学校, 創造技術工学科, 講師 (80712801)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 音声言語処理 / 自然言語処理 / 発表音声 / プレゼンテーションスキル / 話し方評価 |
研究実績の概要 |
本研究課題では、人工知能の一分野である音声言語処理の技術を用いて、発表者にとって模範となる理想的な発表音声を自動生成することにより、発表の効果的な自主練習を支援するシステムの構築を目指している。2019年度は、以下の研究について取り組んだ。 【実施内容1】昨年度に提案した、「えっとー」「あのー」などの間投詞や言い淀みといった冗長表現を発表音声から自動検出するアルゴリズムを改良した。具体的には、すでに組み込んでいる音響的な特徴量に加え、言語的な特徴量として、単語の分散表現を導入した。これにより、従来よりも高精度に冗長表現を検出できるようになった。 【実施内容2】発表者がより適切な語彙を用いて発表を行えるように、発表原稿の推敲を支援するモジュールの研究開発を行った。具体的には、入力された発表原稿の文章に対し、日本語の概念シソーラスを用いて原稿中の内容語の類義語を検索・提案する。ユーザとなる発表者が効率的に推敲作業を行えるように、GUIに基づくインタフェースも提案した。類義語との類似度を定量的に扱うために、単語の分散表現を用いる方法についても検討を開始した。 【実施内容3】発表音声の韻律(ピッチや話速)をより聞き取りやすく自動調整するアルゴリズムについて検討を行った。具体的には、音声分析変換合成の技術を用いて、入力された発表音声のピッチと話速を変換するモジュールを構築した。変換された音声の聞き取りやすさを被験者実験によって評価し、最適なピッチと話速に関する知見を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では、提案するシステムを実現するために、4つの要素技術の研究開発を行うことを計画している。2年目の2019年度では、これらのうち3つの要素技術について研究開発を行った。 1つ目の冗長表現の除去については、昨年度に提案したアルゴリズムを改良し、音響的な特徴量と言語的な特徴量を併用することにより、さらに高精度な検出が行えるようになった。一方で、単語の境界が既知であることや音声認識誤りがないことを前提としているため、より実用的なアルゴリズムを実現するためには、音声認識結果を用いた評価実験が必要である。 2つ目の語彙の最適化については、研究初期においては機械翻訳を用いたアプローチを検討したが、精度上の限界が問題となったため、発表者自身による発表原稿の推敲を効率化するという半自動的なアプローチに変更した。このために、シソーラスを用いた類語検索をGUI上で効率的に行えるインタフェースを提案した。 3つ目の韻律の最適化については、音声分析変換合成の技術を用いて、入力された発表音声のピッチと話速をより聞き取りやすく変換する手法について検討を行った。提案手法によってピッチと話速を変換した音声を被験者実験で評価し、最適なピッチと話速について示唆を得ることができた。一方で、システムの実用性を高めるためには、入力音声の性質に応じて変換のパラメータを自動的に決定するアルゴリズムの検討が必要である。 これらの成果については、国内学会(2019年12月)で計3件の発表を行っている。4つの技術目標のうち3つについて一定の水準まで取り組むことができており、成果を確実に対外発表できていることから、おおむね順調に進展しているものと考えている。
|
今後の研究の推進方策 |
2020年度は、以下の項目を実施する予定である。 【項目1】冗長表現の除去について、音声認識結果を用いた検討を行う。発表音声のような話し言葉は最先端の音声認識技術を用いても誤認識が発生するため、誤りを含む認識結果に対しても頑健に冗長表現を検出できるようにアルゴリズムを改良する。具体的には、音声認識の複数候補や単語信頼度を利用したり、大語彙連続音声認識だけではなく音節タイプライタも併用するような手法について検討する。 【項目2】語彙の最適化について、より効率的に類義語が検索できるように改良を行う。具体的には、言い換えの候補として適切である可能性が高い単語を検索結果の上位に表示できるように、各類義語の妥当性を定量的に評価する手法について検討する。可能であれば、提案手法の有効性を被験者実験によって評価する。 【項目3】韻律の最適化について、ピッチと話速の適切な変換パラメータを自動調整するアルゴリズムについて検討する。具体的には、音声分析合成技術と音声認識技術(音節タイプライタなど)を併用して入力音声の韻律情報を自動抽出し、適切な変換を行う。 【項目4】構文の最適化について検討を行い、倒置などの聞き取りにくい構文構造を最適化するアルゴリズムを提案する。 【項目5】これまでに提案した要素技術を用いて、システムのプロトタイプを構築する。
|
次年度使用額が生じた理由 |
新型コロナウィルスの感染拡大の影響により、参加予定であった学会の現地開催が中止されたため、旅費の使用額に変更があった。次年度の学会参加費および旅費として活用する予定である。
|