研究課題
最終年度は、ミッシングフィーチャ理論および視聴覚情報統合による複数同時発話認識の洗練化に主としてに取り組んだ。具体的には、マイクロフォンアレイによる音源分離GSSとミッシングフィーチャ理論による音声認識との統合システムの詳細な評価を行うとともに、距離や位置に依存したインタラクションシステムのためにさまざまな設定での評価とその洗練化に取り組んだ。主な成果は以下の通りである。(1)音源分離にGeometrical Source Separationとmulti-channel post-filterを使用し、後者から得られるチャネル間リーク情報と背景雑音情報を基にマスクを自動作成した。自動生成されたマスクを使用し,マルチバンド版Juliusを用いて認識を行った。ここで、特徴量をスペクトル歪みに強いMSLSとした。同じベンチマークにより、アプリオリマスクの場合と比較し、約62%の性能を達成した。さらに、さまざまな方向と距離に対して評価し、内部パラメータ13個の最適値にあまり規則性がないことが判明し、遺伝的アルゴリズムにより、最適値探索を行い、その有効性を確認した。(2)人間親密度を空間にマッピングすることにより、複数人とのインタラクションを行うシステムを開発し、被験者による評価実験により有効性を確認した。これによりどの位置に立った人とインタラクションをすべきか、という挙動設計モデルが確立できた。(3)柔軟な対話戦略を有した音声対話システムの開発するために、対話の進行モデルと履歴の構造モデルという2つの文脈的特徴を使用する手法を開発した。レストラン検索システムにどう手法を実装し、一発話から得られる特徴だけを使用した場合と比較して、意味理解精度が83.4%から92.6%まで向上した。さらに、レストラン検索システムデータの学習で得られた決定木がたの検索システムでも有効であることが分かり、ドメイン非依存な文脈手法を確立できた。
すべて 2006 2005
すべて 雑誌論文 (21件) 図書 (2件) 産業財産権 (1件)
EICE Trans.on Fundamentals of Electronics, Communications, and Computer Sciences E89-A・1
ページ: 240-247
IEEE Transactions on Audio, Speech and Language Processing 14・2
ページ: 393-402
日本ロボット学会誌 23・6
ページ: 743-751
自然言語処理 12・3
ページ: 91-110
ヒューマンインタフェース学会論文誌 17・4
ページ: 26-36
Applied Intelligence, 23・3
ページ: 267-275
Journal of Robotics and Mechatropics, 17・6
ページ: 681-688
Lecture Notes in Artificial Intelligence 3533
ページ: 111-120
超音波テクノ 2005・9-10
ページ: 79-84
Proceedings of the 19th Pacific Asia Conference on Language, Information, and Computation (PACLIC 19)
ページ: 192-210
Proceedings of 2nd European Workshop on the Integration of Knowledge, Semantic and Digital Media Technologies (EWIMT
ページ: 205-212
Proceedings of the International Conference on Systems, Man and Cybernetics (SIC-2005)
ページ: 324-329
Proceedings of 6th International Conference on Musical Information Retreival (ISMIR-2005)
ページ: 558-563
ページ: 329-336
Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005)
ページ: 249-252
ページ: 877-880
Proceedings of 4th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems
ページ: 40-45
Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
ページ: 897-892
ページ: 515-520
ページ: 521-526
Proceedings of IEEE RAS International Conference on Robotics and Automation (ICRA-2005)
ページ: 1489-1494