2006 Fiscal Year Annual Research Report
人の連想機能を内在復号器とし情報を演繹誘発させる符号器:メディアトランスデューサ
Project/Area Number |
18500141
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
相川 清明 東京工科大学, メディア学部, 教授 (00367202)
|
Keywords | メディア / トランスデューサ / 連想 / センサ / ベクトル空間法 / 音声信号処理 / 感性 / 音声対話 |
Research Abstract |
1、ベクトル空間法に基づく気象情報案内システムの日米バイリンガル化の研究を進めた。このシステムでは、温度、湿度などのセンサ情報から環境を端的に表現できる気象用語を選択することにより、効率良く相手に環境情報を伝達する方法を用いている。この言語生成法は、人の連想機能の逆プロセスとなっている。すなわち、言葉から連想されるセンサ情報を収集し、システムでは、この逆をたどってセンサ情報から言葉を生成する。類似度による確信度表現も言語に依存して実装した。この研究は日米国音響学会合同会議において発表した。 2、ベクトル空間法に基づく言語生成法を、感性表現により効果音を検索する方法に発展させた。すなわち、複数の感性表現を入力してこれをベクトル化し、ベクトル空間中の類似度により効果音を検索する。この研究においては、検索結果を基準として逐次的に検索を行うため、相対ベクトルによる探索方法を提案した。初期検索で74%の満足度が得られ、その後の相対検索により、全体の61%でさらに良好な検索結果が得られることがわかった。この研究は情報処理学会音声言語情報処理研究会で発表した。 3、センサ情報の1つとして、音声中のノンバーバルな音響特徴から強調発話部分を抽出する方法を考案した。音声対話や講演においては、音量や声の高さを変化させて、部分的強調や相手の誤解に対する注意を喚起する行動が見られる。言語情報に付随して伝送されるこれらの情報は、音量、ピッチの上昇などの少ない情報量で、効率よく相手に意図情報を伝送していると考えられる。ピッチの確率分布関数を逐次的に学習する方法を提案し、教師あり学習の場合、再現率80.2%、適合率74.2%の強調発話検出性能を得た。この研究は、基本原理について日本音響学会春季研究発表会において発表し、講演音声の強調発話検索について第1回音声ドキュメント処理ワークショップにおいて発表した。
|
Research Products
(4 results)