研究課題/領域番号 |
25330210
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 静岡大学 (2015) 名古屋大学 (2014) 同志社大学 (2013) |
研究代表者 |
西田 昌史 静岡大学, 情報学部, 准教授 (80361442)
|
研究分担者 |
山本 誠一 同志社大学, 理工学部, 教授 (20374100)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2015年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2014年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2013年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 多人数会話 / 話者ダイアライゼーション / 発話形式 / 音韻性 / 話者性 / 話者内分散 / 話者間分散 / 話者クラスタリング / 音韻性と話者性 / 主成分分析 / GMM / 講演音声 / 話者認識 / 話題内容 / 発話動作 |
研究成果の概要 |
本研究では,多様な発話形式に頑健な話者クラスタリングを実現するために,主成分分析による空間分離手法を用いて発話ごとに音韻性と話者性の分離を行い,さらに,発話内分散に応じて最適な話者空間の次元数を設定することで,音韻性を抑制した話者空間を構築する話者クラスタリング手法を提案した.従来のBICを用いた手法とGMMを用いたCLRによる話者クラスタリング手法との比較実験を行った結果,提案手法が最も高いクラスタリング精度を実現した.
|