音声入出力を含むヒューマンインタフェースに関する基礎的研究

Research Project

Project/Area Number	11780314
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	情報システム学(含情報図書館学)
Research Institution	Chiba Institute of Technology
Principal Investigator	大川茂樹千葉工業大学, 工学部, 助教授 (40306395)
Project Period (FY)	1999 – 2000
Project Status	Completed (Fiscal Year 2000)
Budget Amount *help	¥1,900,000 (Direct Cost: ¥1,900,000) Fiscal Year 2000: ¥900,000 (Direct Cost: ¥900,000) Fiscal Year 1999: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords	音声認識 / ヒューマンインタフェース / 音声対話 / キーワードスポッティング / 韻律 / 実環境音声認識 / ヒューマンインタフェース / キーワードスポッティング
Research Abstract	本研究は,人間と機械(特にコンピュータ)との間の情報伝達において,音声による入出力を積極的に導入し,人間にとって自然で使いやすいインタフェースを構築するための基礎的な知見を得ることを目標とするものである. 今年度は,まず,自然な音声インタフェースのための音声対話の分析として,人間同士の会話を大量に収集し,そのデータを統計的に分析することにより,自然なインタフェースのための音声対話のタイミングについての検討を行なった.具体的なタスクとして,2名1組で対話しながらパズルを解くものを選定した.複数話者の組み合わせにより約1時間程度の対話データを収集した結果を書き起こし,形態素解析と呼ばれる分析方法により細かい単位に区分した.各々の区分に対して音声対話の機能との関係を分析したところ,助詞を中心とする補助単語の出現頻度と対話特有の現象との強い相関が見られた. 次に,実環境での音声認識における問題である周辺雑音への対処に関して,前年度に提案したマルチバンド型モデルに基づく手法をさらに検討し,相互情報量を評価基準とした周波数帯域への重み付けを導入した.日本語音声データを用いた実験の結果,改良したモデルを適用した場合に最大8%程度の音声認識性能の向上を図ることができた. 以上の研究成果より,自然な音声インタフェースを構築するために,(i)音声対話のモデル化,(ii)実環境における効率的な音声認識モデル,の2点に関する基礎的な知見が得られたものと考える.

Report

(2 results)

2000 Annual Research Report
1999 Annual Research Report

Research Products
(7 results)

All Other

All Publications (7 results)

[Publications] 大川茂樹: "アルチバンド型音声認識における相互情報量を考慮した帯域重み付けの検討"千葉工業大学研究報告理工編. 47. 141-147 (2000)
- Related Report
  2000 Annual Research Report
[Publications] 伊達瓦,白井克彦,大川茂樹: "情報理論に基づくモンゴル語口語から文語への変換処理手法"日本音響学会講演論文集. 2-1-19. 211-212 (2000)
- Related Report
  2000 Annual Research Report
[Publications] I.Dawa,S.Okawa,K.Shirai: "Assesment of common acoustic model for dialectal speech recognition"Oirat Studies. 掲載予定(未定). (2000)
- Related Report
  2000 Annual Research Report
[Publications] S.Okawa,T.Nakajima,K.Shirai: "A recombination strategy for multi-band speech recognition"Proc.6th European Conference on Speech Communication & Tech. S4 OR 1.5. 603-606 (1999)
- Related Report
  1999 Annual Research Report
[Publications] 大川茂樹、中島雄大、白井克彦: "マルチバンド型音声認識のための部分帯域特微量の情報量評価"電子情報通信学会技術研究報告. SP99-97. 25-30 (1999)
- Related Report
  1999 Annual Research Report
[Publications] I.Dawa,S.Okawa,K.Shirai: "Design of Mongolian speech database considering dialectal characterist"The Journal of the Acoustical Society of Japan. 20.3. 181-188 (1999)
- Related Report
  1999 Annual Research Report
[Publications] 大川茂樹、白井克彦: "マルチバンド音声認識における部分帯域への重み付けの検討"日本音響学会講演論文集. 3-Q-1. 119-120 (1999)
- Related Report
  1999 Annual Research Report

音声入出力を含むヒューマンインタフェースに関する基礎的研究

Principal Investigator

大川 茂樹 千葉工業大学, 工学部, 助教授 (40306395)

¥1,900,000 (Direct Cost: ¥1,900,000)

Report

Research Products

[Publications] 大川茂樹: "アルチバンド型音声認識における相互情報量を考慮した帯域重み付けの検討"千葉工業大学研究報告理工編. 47. 141-147 (2000)

Related Report

[Publications] 伊達瓦,白井克彦,大川茂樹: "情報理論に基づくモンゴル語口語から文語への変換処理手法"日本音響学会 講演論文集. 2-1-19. 211-212 (2000)

Related Report

[Publications] I.Dawa,S.Okawa,K.Shirai: "Assesment of common acoustic model for dialectal speech recognition"Oirat Studies. 掲載予定(未定). (2000)

Related Report

[Publications] S.Okawa,T.Nakajima,K.Shirai: "A recombination strategy for multi-band speech recognition"Proc.6th European Conference on Speech Communication & Tech. S4 OR 1.5. 603-606 (1999)

Related Report

[Publications] 大川茂樹、中島雄大、白井克彦: "マルチバンド型音声認識のための部分帯域特微量の情報量評価"電子情報通信学会技術研究報告. SP99-97. 25-30 (1999)

Related Report

[Publications] I.Dawa,S.Okawa,K.Shirai: "Design of Mongolian speech database considering dialectal characterist"The Journal of the Acoustical Society of Japan. 20.3. 181-188 (1999)

Related Report

[Publications] 大川茂樹、白井克彦: "マルチバンド音声認識における部分帯域への重み付けの検討"日本音響学会講演論文集. 3-Q-1. 119-120 (1999)

Related Report

大川茂樹千葉工業大学, 工学部, 助教授 (40306395)

[Publications] 伊達瓦,白井克彦,大川茂樹: "情報理論に基づくモンゴル語口語から文語への変換処理手法"日本音響学会講演論文集. 2-1-19. 211-212 (2000)