2015 Fiscal Year Annual Research Report
機械学習および統計モデルに基づく音声対話システムの応答生成の研究
Project/Area Number |
24500115
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
|
Co-Investigator(Kenkyū-buntansha) |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426) [Withdrawn]
猿渡 洋 東京大学, 情報理工学系研究科, 教授 (30324974)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 音声インタフェイス / 音声対話システム / 情報検索 |
Outline of Annual Research Achievements |
最終年度である本年度は、個人向け雑談ロボットの開発を行った。研究計画では最終年度は構築したシステムを公共施設(コミュニティセンター)に設置し、施設を訪問した一般市民の発話に対する応答性能を評価する予定であったが、研究成果のまとめとして個人が継続的に利用するポータブルなシステムの開発を行うこととした。計画を変更した理由は、これまでの実験ですでにコミュニティセンターの不特定多数のユーザ発話データを使って性能向上を確認しているため、新規に収録した音声で実験する意義が大とはいえず、それよりも個人ユーザが継続的に利用できるポータブルなシステムを開発し、個々のユーザからの評価がどのように変遷するか継続的に観察できる環境を整備することが成果物の活用の点で重要だと判断したためである。最終的に個人向け雑談ロボットのプロトタイプの開発を行った。 研究期間を通した本課題の成果として、実環境音声対話システムへの発話から、その音声認識結果の単語の組(Bag-of-Words)を使ったSupport Vector Machineによる機械学習が発話カテゴリー分類が有効であることが分かった。テキスト分類で用いられた手法であるが、時間長が2,3秒程度と短く、環境雑音が重畳されており、発話者の年齢層も多岐にわたるデータに対しても既存の用例マッチング手法より頑健な手法であることが示された。 また統計に基づく機械翻訳技術を援用し質問発話から応答発話への自動変換技術の研究も進めたが、本課題で用いている音声認識結果を用いた場合、テキスト間のフレーズの対応づけの学習に課題があることが分かった。自由発話は表現の省略が散見されることと認識結果の挿入誤りへの適切な処理と学習データ数の拡大が課題である。
|