研究課題/領域番号 |
16K16134
|
研究機関 | 香川高等専門学校 |
研究代表者 |
篠山 学 香川高等専門学校, 情報工学科, 講師 (60508232)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 聞き間違い / 聞き返し / 対話コーパス / 音素 / 音声間距離 |
研究実績の概要 |
当該年度は,聞き間違えたときの聞き返しを認識するために,聞き間違いを含む対話コーパスを収集した.対話は発話文と聞き返し文のペアとなっており,ウェブサイトから1127対話を収集した.また,対話文を音素へ自動的に変換するためにカタカナ表記と対応する音素を決定した.さらに,発話文中の聞き間違えた箇所を人手で特定し対話コーパスに付与した.コーパスの意義としては,どの音素がどのような音素に聞き間違えられやすいかなどを分析できるようになる.発話文中の聞き間違えた箇所を認識するために,発話文と聞き返し文の文字列の類似度を比較して発話文中の聞き返し箇所を特定する手法を提案した.具体的には,文字列の類似度を計算するためにレーベンシュタイン距離を用いた.このとき通常は文字列の字面を比較するが,聞き間違いにおいては音が重要であるため音素を比較する.あらかじめ音素間の近さ(音声間距離)を数値化しておきレーベンシュタイン距離の操作コストに重みづけを行った.音声間距離は既存の研究を用いたが,音素hと促音が定義されていなかったため,追加して作成した.評価実験を行った結果,誤聴個所がほぼ推定できた割合は81.1%となった.想定より低い精度であったため考察したところ,N-gram単位の誤聴個所候補を出力する際,すべてのN-gramを候補としているために正しい候補を選択できない場合があることがわかった.今後は句の先頭になりえないN-gramなどを判定して除外しておく必要がある.
研究成果としては,情報科学技術フォーラムFIT2016において1件の成果発表をおこなった. 今後は,聞き返し箇所を判定する精度を向上させるために,誤聴個所候補の選択手法を研究するとともに,言い間違いを認識できるようにするために,言い間違いを含む対話コーパスを収集する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画通りに聞き間違いを含む対話コーパスが収集できている.実験に使用するために,誤聴個所の追加と発話ペアの音素への変換も行えた.聞き間違いを判定する手法を提案し,評価実験も行った.対話ロボットの購入は購入予定の製品が再入荷未定となってしまったためできていないが,対話APIなどで代用することを考えている.
|
今後の研究の推進方策 |
聞き間違いの推定精度を向上させたのち,研究会等で発表し本研究への意見を聞く.前回の発表ではロボットとの対話に聞き間違いが発生するのかどうかや人間同士の会話でもどのくらいの頻度で発生するものなのか知りたいという意見があったので,テキスト対話APIと音声合成を用いた実験を行って調査する.言い間違いを認識できるようにするために,言い間違いを含む対話コーパスも収集する.
|
次年度使用額が生じた理由 |
購入予定だった対話ロボットが再入荷未定となってしまったため購入できていない.問い合わせも行ったが未定との回答だった.研究用にプログラムできるロボットで最も安い製品であったため,他のロボットを購入することができない.
|
次年度使用額の使用計画 |
本年度中に再販にならない場合,またプログラム可能なほかの対話ロボットが発売されない場合,テキスト対話APIと音声合成を用いて対話システムを構成することを考えており,構成するのに必要なPCや音声合成ソフトを購入する.
|