2003 Fiscal Year Annual Research Report
言語・パラ言語の生成・理解能力を有する会話システムに関する研究
Project/Area Number |
15300065
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Waseda University |
Principal Investigator |
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
|
Co-Investigator(Kenkyū-buntansha) |
松坂 要佐 日本学術振興会, 特別研究員(PD)
|
Keywords | 音声対話 / パラ言語 / 韻律 / ジェスチャ認識 / 対話ロボット |
Research Abstract |
a)話し言葉対応の音声認識装置の開発 従来の研究で開発した読み上げ文が認識対象である言語モデル・音響モデルに、発話速度や基本周波数の変化に応じたスペクトルの変化のモデルを組み込み、話し言語に対応した音声認識装置を開発し、認識性能を向上させた。また、重み付き有限状態トランスデューサを用い、単語の早期確定機能を実現した。 b)声表情の認識システムの開発 従来の研究で開発中の韻律情報の分析システムが与える結果と声質と心的状態の関係を考慮し、音声の韻律情報・スペクトル情報から発話者の心的状態を指定する手法を提案し、実装した。 c)対話中の頭部ジェスチャ認識システムの開発 従来の研究で開発した頭部ジェスチャ認識を、対話中のロボット上に設置されたカメラへの適用を行った。対話中に得られる動画像は、ロボットの頭部の動きによる揺れが含まれる。抽出した胴体部のオプティカルフローを算出し、頭部のものから引くことによってこの揺れをキャンセルした。また、認識に用いる確率モデルを適応することにより認識率を向上させた。 d)声表情の表出 従来の研究で検討中の感情付与可能な音声合成装置を拡張して、発話者の心的状態を表現できる音声合成装置を開発した。様々な心的状態のもとで発話し収集した音声データベースを分析し、高品質に心的状態を表現できるために必要となる音声素片とその接続手法について検討を行った。 e)顔表情の表出システムの改良 従来の研究で開発したロボットハードウェアをベースに、表情表出機能を充実を行った。表情に大きく影響を与える眉、口部を設計し直しを行った。 f)対話モデルの開発のための基礎コーパスの作成 対話相手の発話内容・心的状態に応じて、どのように振舞うべきかを示すロボットの行動指針のモデルを作成するために、コーパスを収集し、談話行為や心的状態に関するタグ付与を行なった。
|
Research Products
(10 results)
-
[Publications] 大久保雅史, 望月亮, 蓑輪利光, 小林哲則: "波形重畳型音声合成における心的態度の再現性評価"第2回情報科学技術フォーラムFIT2003 一般講演論文集. vol.2. 265-266 (2003)
-
[Publications] 藤江真也, 八木大三, 菊池英明, 小林哲則: "パラ言語情報を用いた音声対話システム"日本音響学会秋季研究発表会. 39-40 (2003)
-
[Publications] 望月亮, 小林哲則: "PSOLA法における音質改善のための低域スペクトル包絡の補正方法"日本音響学会秋季研究発表会講演論文集. 319-320 (2003)
-
[Publications] 藤江真也, 江尻康, 菊池英明, 小林哲則: "パラ言語の理解能力を有する対話ロボット"情報処理学会研究技術報告. SLP-48. 13-20 (2003)
-
[Publications] 江尻康, 中島慶, 藤江真也, 小林哲則: "対話ロボットの動作中における頭部ジェスチャ認識"電子情報通信学会研究技術報告. Vol.103, No.453. 13-18 (2003)
-
[Publications] 細川健一郎, 藤江真也, 小林哲則: "検索・提案型対話システムのためのユーザとのインタラクションによる適応的意図理解"人工知能学会研究研究会資料. SIG-SLUD-A302-5. 21-28 (2003)
-
[Publications] 小林哲則: "ROBISUKE:次世代の対話ロボット"人工知能学会研究会資料. SIG-CHallenge-0318-1. 1-6 (2003)
-
[Publications] S.Fujie, Y.Ejiri, Y.Matusaka, H.Kikuchi, T.Kobayashi: "Recognition of Para-Linguistic Information and Its Application to Spoken Dialogue System"IEEE ASRU2003 (Automatic Speech Recognition and Understanding Workshop). 231-236 (2003)
-
[Publications] S.Fujie, D.Yagi, Y.Matusaka, T.Kobayashi: "Spoken Dialogue System Using Prosody As Para-Linguistic Information"International Conference Speech Prosody SP2004. (未定). (2004)
-
[Publications] 八木大三, 藤江真也, 菊池英明, 小林哲則: "韻律情報を用いた肯定的/否定的態度の認識"日本音響学会春季研究発表会. (未定). (2004)