汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究

研究課題

研究課題/領域番号	15300026
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	メディア情報学・データベース
研究機関	筑波大学
研究代表者	田中和世筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)
研究分担者	伊藤慶明岩手県立大学, ソフトウエア情報学部, 助教授 (90325928) 大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395) 児島宏明独立行政法人産業技術総合研究所, 情報技術研究部門, グループリーダ (80356980)
研究期間 (年度)	2003 – 2005
研究課題ステータス	完了 (2005年度)
配分額 *注記	16,500千円 (直接経費: 16,500千円) 2005年度: 4,700千円 (直接経費: 4,700千円) 2004年度: 5,200千円 (直接経費: 5,200千円) 2003年度: 6,600千円 (直接経費: 6,600千円)
キーワード	音声認識 / 音声検索 / 音声符号 / 国際音声記号 / 高速マッチング / 音響モデル / 多言語音声処理 / 語彙フリー / 汎用音声符号 / 音声音響モデル / 音声要約
研究概要	本研究では、言語系に依存しない汎用音声符号系とその音響モデルの開発を行ない、この汎用音声符号系に基いて、音声認識や音声検索などの応用システムを開発するという目標を掲げた。特に、すべての音声を一旦、この汎用音声符号系に符号化し、その上に応用システムを構築するという本研究独自の柔軟な処理方式を活かした語彙に依存しない「語彙フリー音声検索システム」の開発に注力した。今年度は最終年度であり、システムの構築と性能評価、および本方式の拡張について検討し、ほぼ当初の目標を達成した。まず、語彙フリー音声検索システムを用いて、提案した汎用音声符号系「Sub-Phonetic Segment (SPS)」が他の音声記述単位である音節や音素(triphoneを含む)、さらには半音素・1/3音素など考え得る音響モデルに比べても性能上優位にあることを検証した。本方式では、検索クエリーを音声入力する方法、キーボード入力する方法のどちらも可能であり、また、検索対象ドキュメントもそれが音声である場合、テキストである場合のいずれにも適用可能である。この語彙フリー音声検索システムの応用として、ニュース放送などのビデオ検索システム、災害放送音声検索システムを試作し、人名や地域名など辞書に未登録の語彙外音声による情報検索が可能であることを実証した。ビデオ検索システムは産業技術総合研究所「明日の技術点」などで公開した。また、システムのロバスト性を向上させる目的で、複数マイクロホン入力に対するディジタル信号処理を用いた雑音除去手法を開発した。本プロジェクトで開発した特徴抽出手法、音声記述単位SPS、時系列高速マッチング手法などは広く応用できる手法であり、カーネル主成分分析と組み合わせた音声ドキュメント分割法の開発、また、楽曲境界検出・検索、類似医薬品名の警告提示、環境音の分析・認識などへ適用し有効性を評価した。

報告書

(4件)

研究成果
(87件)

すべて 2006 2005 2004 2003 その他

すべて雑誌論文 (62件) 図書 (3件) 産業財産権 (2件) 文献書誌 (20件)

[雑誌論文] HMM-based noise-robust feature compensation2006
- 著者名/発表者名
  Akira Sasou
- 雑誌名
  
  International Journal of Speech Communication Accepted, In publication
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] 分析区間長を可変としたテキスト分割手法2006
- 著者名/発表者名
  内海慶, 藤井敦, 田中和世
- 雑誌名
  
  言語処理学会12回年次大会(NLP2006)論文集 1
  
  ページ: 4-4
- 関連する報告書
  2005 実績報告書
[雑誌論文] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006
- 著者名/発表者名
  岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
- 雑誌名
  
  日本音響学会2006年春季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] スポッティング区間の再認識に基づく音声検索性能の向上2006
- 著者名/発表者名
  大竹, 岩田, 伊藤, 小嶋, 石亀, 田中, 李
- 雑誌名
  
  日本音響学会2006年春季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] Instantaneous frequencies of signals obtained by the analytic signal method2006
- 著者名/発表者名
  H.Suzuki, F.Ma, H.Izumi, O.Yamazaki, S.Okawa, K.Kido
- 雑誌名
  
  Acoustical Science and Technology 27・3
  
  ページ: 8-8
- 関連する報告書
  2005 実績報告書
[雑誌論文] Multi-mixture based PDT-SSS Algorithm for Extension of an HMnet Structure2006
- 著者名/発表者名
  石洙永, 李時旭, 児島宏明
- 雑誌名
  
  日本音響学会2006年春季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] 電動車いす搭載用平行マイクアレイ実装方式の検討2006
- 著者名/発表者名
  佐宗晃, 児島宏明
- 雑誌名
  
  日本音響学会2006年春季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] Voice activity detection using YIN, a fundamental frequency estimator2006
- 著者名/発表者名
  石洙永, 李時旭, 児島宏明
- 雑誌名
  
  日本音響学会2006年春季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] Combining Multiple subword representations for open-vocabulary spoken document retrieval2005
- 著者名/発表者名
  Lee, S.W.
- 雑誌名
  
  Proc. of International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP2005) 1
  
  ページ: 505-508
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents2005
- 著者名/発表者名
  Itoh, Y.
- 雑誌名
  
  Multimedia Systems,ISSN : 0942-4962 10・5
  
  ページ: 432-443
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005
- 著者名/発表者名
  K.Iwata
- 雑誌名
  
  Proc. of IASTED International Conference on Signal and Image Processing, 1
  
  ページ: 34-39
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005
- 著者名/発表者名
  T.Taniguchi
- 雑誌名
  
  Proceedings of Interspeech2005 1
  
  ページ: 589-592
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Combining Multiple subword representations for open-vocabulary spoken document retrieval,2005
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.,of International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP2005) Vol.1
  
  ページ: 505-508
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents,2005
- 著者名/発表者名
  Itoh, Y., Tanaka, K., Lee, S.W.
- 雑誌名
  
  Multimedia Systems ISSN:0942-4962 Vol.10, No.5
  
  ページ: 432-443
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in Disaster,2005
- 著者名/発表者名
  Kohei Iwata, Yoshiaki Itoh, Kazunori Kojima, Masaaki Ishigame, Kazuyo Tanaka, Shi-wook Lee
- 雑誌名
  
  Proc.of IASTED International Conference on Signal and Image Processing
  
  ページ: 34-39
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals,2005
- 著者名/発表者名
  Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai
- 雑誌名
  
  Proc.of Interspeech2005
  
  ページ: 589-592
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents2005
- 著者名/発表者名
  Itoh, Y., Tanaka, K., Lee, S.W.
- 雑誌名
  
  Multimedia Systems, ISSN:0942-4962 10・5
  
  ページ: 10-10
- 関連する報告書
  2005 実績報告書
[雑誌論文] Evaluation of an HMM-Based Feature-Compensation Method Using the AURORA2J2005
- 著者名/発表者名
  A.Sasou, F.Asano, K.Tanaka, S.Nakamura
- 雑誌名
  
  Proc. of IEEE & EURASIP International Workshop on Nonlinear Signal and Image Processing 1
  
  ページ: 6-6
- 関連する報告書
  2005 実績報告書
[雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005
- 著者名/発表者名
  K.Iwata, Y.Itoh, K.Kojima, M.Ishigame, K.Tanaka, S.Lee
- 雑誌名
  
  IASTED International Conference on Signal and Image Processing 1
  
  ページ: 6-6
- 関連する報告書
  2005 実績報告書
[雑誌論文] 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用2005
- 著者名/発表者名
  岩田, 伊藤, 小嶋, 石亀, 田中, 李
- 雑誌名
  
  電子情報通信学会研究技術報告 SP2005-21
  
  ページ: 6-6
- 関連する報告書
  2005 実績報告書
[雑誌論文] An AR-HMM based speech analysis method and evaluation of singing-voice recognition2005
- 著者名/発表者名
  A.Sasou, M.Goto, S.Hayamizu, K.Tanaka
- 雑誌名
  
  IEICE Technical Report SP2005-42
  
  ページ: 6-6
- NAID
  110003298740
- 関連する報告書
  2005 実績報告書
[雑誌論文] HMMに基く特徴補正を実装した有限状態文法音声認識エンジンの開発および評価2005
- 著者名/発表者名
  佐宗晃, 浅野太, 田中和世
- 雑誌名
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] 信号音のAR-HMMに基く複合環境音認識の検討2005
- 著者名/発表者名
  長谷川智紀, 佐宗晃, 田中和世
- 雑誌名
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] 語彙フリー音声検索におけるサブワードと応用システムの検討2005
- 著者名/発表者名
  岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
- 雑誌名
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] Human-machine Interface Using EMG Signals for Robot Hand Control2005
- 著者名/発表者名
  M.Yoshikawa, T.Tsujimura, M.Mikawa K.Tanaka
- 雑誌名
  
  Proceedings of the Society of Instrument and Control Engineers (SICE) Annual Conference 1
  
  ページ: 6-6
- 関連する報告書
  2005 実績報告書
[雑誌論文] Issues of SSML in Japanese2005
- 著者名/発表者名
  W.Imatake, M.Akabane, K.Tanaka
- 雑誌名
  
  Proc. of the W3C workshop on Internatinalizing the Speech Synthesis Markup Language 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005
- 著者名/発表者名
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- 雑誌名
  
  Proceedings of Interspeech2005 1
  
  ページ: 4-4
- 関連する報告書
  2005 実績報告書
[雑誌論文] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005
- 著者名/発表者名
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会2006年季研究発表会論文集 1
  
  ページ: 2-2
- 関連する報告書
  2005 実績報告書
[雑誌論文] 音素片のカーネル主成分分析を用いたトピックセグメンテーション2005
- 著者名/発表者名
  佐土原健, 児島宏明, 李時旭
- 雑誌名
  
  人工知能学会 1E2-03
  
  ページ: 2-2
- NAID
  130004653919
- 関連する報告書
  2005 実績報告書
[雑誌論文] Combining Multiple subword representations for open-vocabulary spoken document retrieval2005
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.of International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP2005) 1
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] An auto-regressive, nonstationary excited signal parameter estimation method and an evaluation of a singing-voice recognition2005
- 著者名/発表者名
  Sasou, A., Goto, M., Hayamizu, S., Tanaka, K.
- 雑誌名
  
  Proc.of International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP2005) 1
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] 曲内の類似性を用いた曲境界の検出の性能改善2005
- 著者名/発表者名
  岩渕晃, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, Shi-wook Lee
- 雑誌名
  
  日本音響学会講演論文集2005年3月 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別2005
- 著者名/発表者名
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- 雑誌名
  
  電子情報通信学会技術研究報告 SP2004-153
  
  ページ: 6-6
- NAID
  10014425442
- 関連する報告書
  2004 実績報告書
[雑誌論文] Knowledge integration in annotation-based collaborative virtual environments2005
- 著者名/発表者名
  S.Aubry, S.Okawa, D.Lenne, I.Thouvenin
- 雑誌名
  
  インタラクション2005論文集 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] 生活環境音を記録し音響的特徴を用いて要約するインタフェースの提案2005
- 著者名/発表者名
  大塚昭徳, 伊丹徳重, 坂倉美保, 冨塚清史, 大川茂樹
- 雑誌名
  
  情報処理学会全国大会論文集2005 2
  
  ページ: 2-2
- NAID
  170000170314
- 関連する報告書
  2004 実績報告書
[雑誌論文] 音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005
- 著者名/発表者名
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会講演論文集2005年3月 1
  
  ページ: 2-2
- NAID
  10018037648
- 関連する報告書
  2004 実績報告書
[雑誌論文] Open-vocabulary spoken document retrieval based on multiligual subphonetic segment recognition2004
- 著者名/発表者名
  Lee, S.W.
- 雑誌名
  
  Proc. of 18th International Congress on Acoustics(ICA2004) 2
  
  ページ: 1723-1726
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Frequent word section extraction in a presentation speech by an effective dynamic programming algorithm2004
- 著者名/発表者名
  Itoh, Y.
- 雑誌名
  
  Journal of Acoustical Society of America(JASA) 116-2
  
  ページ: 1234-1243
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Robust spoken document retrieval based on multiligual subphonetic segment recognition2004
- 著者名/発表者名
  Lee, S.W.
- 雑誌名
  
  Proc. of 6th International Conference on Enterprise Information Systems CD-ROM
  
  ページ: 1-7
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Open-vocabulary spoken document retrieval based on multiligual subphonetic segment recognition,2004
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.of 18th International Congress on Acoustics (ICA2004) Vol.II
  
  ページ: 1723-1726
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Frequent word section extraction in a presentation speech by an effective dynamic programming algorithm,2004
- 著者名/発表者名
  Itoh, Y, Tanaka, K.
- 雑誌名
  
  Journal of Acoustical Society of America (JASA) Vol.116, No.2
  
  ページ: 1234-1243
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Robust spoken document retrieval based on multiligual subphonetic segment recognition,2004
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.,of 6th International Conference on Enterprise Information Systems (CD-ROM)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Open-vocabulary spoken document retrieval based on multiligual subphonetic segment recognition2004
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.of 18th International Congress on Acoustics (ICA2004) 2
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] An algorithm for extracting similar partial utterances toward flexible spoken document retrieval2004
- 著者名/発表者名
  Itoh, Y., Tanaka, K., Lee, S.W.
- 雑誌名
  
  Proc.of 18th International Congress on Acoustics (ICA2004) 2
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] Robust spoken document retrieval based on multiligual subphonetic segment recognition2004
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.of 6th International Conference on Enterprise Information Systems 1
  
  ページ: 7-7
- 関連する報告書
  2004 実績報告書
[雑誌論文] Frequent word section extraction in a presentation speech by an effective dynamic programming algorithm2004
- 著者名/発表者名
  Itoh, Y., Tanaka, K.
- 雑誌名
  
  Journal of Acoustical Society of America (JASA) 116-2
  
  ページ: 10-10
- 関連する報告書
  2004 実績報告書
[雑誌論文] 音声的距離に基く類似薬品名表示・検索システム2004
- 著者名/発表者名
  田中和世, 中村美保子, 肖丹青, 伊藤慶明
- 雑誌名
  
  日本音響学会講演論文集2004年9月 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] DCTをベースとする音響信号の無歪みデータ圧縮の検討2004
- 著者名/発表者名
  佐藤博喜, 田中和世, 佐藤寧
- 雑誌名
  
  日本音響学会講演論文集2004年9月 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] 逆ハの字型マイクロホン配置による雑音除去の検討2004
- 著者名/発表者名
  太田昌宏, 長谷川智紀, 田中和世, 佐藤寧
- 雑誌名
  
  日本音響学会講演論文集2004年9月 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] Similar section extraction for analyzing stream data structure2004
- 著者名/発表者名
  Itoh, Y., Tanaka, K., Lee, S.W.
- 雑誌名
  
  Proc.of 5th European Conference on Machine Learning (ECML2004) 1
  
  ページ: 10-10
- 関連する報告書
  2004 実績報告書
[雑誌論文] Multi-layer subword units for open-vocabulary spoken document retrieval2004
- 著者名/発表者名
  Lee, S.W., Tanaka, K., Itoh, Y.
- 雑誌名
  
  Proc.of International Conference on Spoken Language Processing (ICSLP2004) 2
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] An Efficient Partial Matching Algorithm toward Speech Retrieval by Speech2004
- 著者名/発表者名
  Itoh, Y., Tanaka, K., Lee, S.W.
- 雑誌名
  
  Proc.of International Conference on Spoken Language Processing (ICSLP2004) 2
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] HMM-Based Feature Compensation Method : An Evaluation Using the AURORA22004
- 著者名/発表者名
  Sasou, A., Asano, F., Tanaka, K., Nakamura, S.
- 雑誌名
  
  Proc.of International Conference on Spoken Language Processing (ICSLP2004) 1
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] 曲内の類似性を用いた曲境界の検出2004
- 著者名/発表者名
  岩渕晃, 伊藤慶明, 小嶋和徳, 石亀昌明
- 雑誌名
  
  日本音響学会講演論文集2004年9月 1
  
  ページ: 2-2
- 関連する報告書
  2004 実績報告書
[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2004
- 著者名/発表者名
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- 雑誌名
  
  Proc.of International Conference on Speech and Language Technology 1
  
  ページ: 4-4
- 関連する報告書
  2004 実績報告書
[雑誌論文] 時系列パターンの任意部分区間の高速マッチング手法Shift CDP法2003
- 著者名/発表者名
  伊藤慶明
- 雑誌名
  
  電子情報通信学会論文誌D-II J85-D-II No.9
  
  ページ: 1267-1277
- NAID
  110003170966
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Mixed-Lingual Spoken Word Recognition by Using VQ Codebook Sequnces of Variable Length Segments2003
- 著者名/発表者名
  Kojima, H.
- 雑誌名
  
  Proc. of the European Conference on Speech Communication and Technology 4
  
  ページ: 2485-2488
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Statistical estimation of phoneme's most stable point based on universal constraints2003
- 著者名/発表者名
  Shigeki Okawa
- 雑誌名
  
  Proc. of 7th European Conference on Speech Communication 2
  
  ページ: 781-784
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] A fast matching algorithm called shift continuous DP between arbitrary parts of two time sequence data sets,2003
- 著者名/発表者名
  Yoshiaki Itoh
- 雑誌名
  
  IEICE Trans.Information and Systems (Japanese Ed.) Vol.J89-D, No.3
  
  ページ: 1267-1277
- NAID
  110003170966
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Mixed-Lingual Spoken Word Recognition by Using VQ Codebook Sequnces of Variable Length Segments,2003
- 著者名/発表者名
  Hiroaki Kojima, Kazuyo Tanaka
- 雑誌名
  
  Proc.of the European Conference on Speech Communication and Technology
  
  ページ: 2485-2488
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Statistical estimation of phoneme's most stable point based on universal constraints,2003
- 著者名/発表者名
  Shigeki Okawa, Katsuhiko Shirai
- 雑誌名
  
  Proceedings of 7th European Conference on Speech Communication and Technology
  
  ページ: 781-784
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] HMM-based noise-robust feature compensation,
- 著者名/発表者名
  Akira Sasou, Futoshi Asano, Satoshi Nakamura, Kazuyo Tanaka
- 雑誌名
  
  International Journal of Speech Communication (Accepted, in publication)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[図書] 音声工学2005
- 著者名/発表者名
  板橋秀一
- 総ページ数
  244
- 出版者
  森北出版
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[図書] Speech Technology, ISBN4-627-828112005
- 著者名/発表者名
  S.Itahashi, K.Tanaka, et al.
- 総ページ数
  244
- 出版者
  Morikita-Shuppan
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[図書] 音声工学2005
- 著者名/発表者名
  板橋秀一, 田中和世, 他
- 総ページ数
  244
- 出版者
  森北出版
- 関連する報告書
  2004 実績報告書
[産業財産権] 視覚的かつ聴覚的類似品名提示装置2004
- 発明者名
  田中和世
- 権利者名
  国立大学法人筑波大学
- 産業財産権番号
  2004-271381
- 出願年月日
  2004-09-17
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[産業財産権] 視覚的かつ聴覚的類似品提示装置2004
- 発明者名
  田中和世
- 権利者名
  国立大学法人筑波大学
- 産業財産権番号
  2004-271381
- 出願年月日
  2004-09-17
- 関連する報告書
  2004 実績報告書
[文献書誌] 田中和世: "音声認識技術とその応用、現状と課題"計測と制御. 42巻6号. 491-496 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 伊藤慶明: "時系列パターンの任意部分区間の高速マッチング手法Shift CDP法"電子情報通信学会論文誌D-II. J85-D-IINo.9. 1267-1277 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Kojima, H., Tanaka, K.: "Mixed-Lingual Spoken Word Recognition by Using VQ Codebook Sequnces of Variable Length Segments"Proc. of the European Conference on Speech Communication and Technology. 4. 2485-2488 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Sasou, A., Asano, F., Tanaka, K., Nakamura, S.: "Adaptation of Acoustic Model Using the Gain-Adapted HMM Decomposition Method"Proc. of the European Conference on Speech Communication and Technology. 1. 29-32 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Lee, S.W., Tanaka, K., Itoh, Y.: "Spoken document retrieval with multilingual subphoneme sets"Proc.of the Autumn Meeting of the Acoust.Soc.Japan. 1. 165-166 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Yoshiaki Itoh, Kazuyo Tanaka: "An efficient algorithm for extracting repeated key sentence in a presentation speech"Proc. of the 7th World Multiconference on Systemics, Cybernetics and Informatics. 10(CD-ROM). 6 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Lee, S.W., Tanaka, K., Itoh, Y.: "Adaptation of multilingual subphonetic segment for spoken document retrieval"電子情報通信学会技術研究報告. SP2003-144. 187-192 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 佐宗晃, 浅野太, 田中和世, 中村哲: "利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討"電子情報通信学会技術報告. 103・26. 19-24 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Yoshiaki Itoh, Kazuyo Tanaka, Shi-wook Lee: "Repeated utterance extraction by a new algorithm for labeling a presentation speech"Proc. of the 5th ACM SIGMM International Workshop on Multimedia Information Retrieval. 1(CD-ROM). 7 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 佐宗晃, 浅野太, 田中和世, 中村哲: "HMM基づいた雑音重畳音声の特徴量補正"日本音響学会2003年秋季研究発表会論文集. 1. 23-24 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 伊藤慶明, 田中和世, 李時旭: "時系列データの任意区間マッチング法の効率化"日本音響学会秋季研究発表会論文集. 1. 163-164 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Stephane Aubry, Shigeki Okawa: "Analysis of rhythm-based method for language identification"Technical Report of Chiba Institute of Technology. 50. 93-99 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Shigeki Okawa, Katsuhiko Shirai: "Statistical estimation of phoneme's most stable point based on universal constraints"Proc. of 7th European Conference on Speech Communication. 2. 781-784 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 谷口徹, 安達了慈, 大川茂樹, 白井克彦: "HMMを用いた音声・音楽識別"電子情報通信学会技術研究報告. SP2003-92. 47-51 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] 椿雅也, 李而立, 谷口徹, 大川茂樹, 誉田雅彰, 白井克彦: "心理的距離尺度に基づく実音色から有限音色空間への写像"日本音響学会講演論文集. 2. 673-675 (2003)
- 関連する報告書
  2003 実績報告書
[文献書誌] Shi-wook Lee, Tanaka, K., Itoh, Y.: "Application of multilayer subword units for spoken document retrieval,"Proc. of the Spring Meeting of the Acoust. Soc. Japan. 1. 81-82 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] Yoshiaki Itoh, Kazuyo Tanaka, S.W.Lee: "An algorithm for extracting similar partial utterances toward spoken document retrieval"Proc. of International Congress on Acoustics 2004. (採択済)(印刷中). 4 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] Lee, S.W., Tanaka, K., Itoh, Y.: "Open-vocabulary spoken document retrieval based on multiligual subphonetic segment recognition"Proc. of International Congress on Acoustics 2004. (採択済)(印刷中). 4 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] Yoshiaki Itoh, Kazuyo Tanaka: "Frequent word section extraction in a presentation speech by an effective dynamic programming algorithm"Journal of Acoustical Society of America. (採択済)(印刷中). 10 (2004)
- 関連する報告書
  2003 実績報告書
[文献書誌] Lee, S.W., Tanaka, K., Itoh, Y.: "Robust spoken document retrieval based on multiligual subphonetic segment recognition"Proc. of 6th International Conference on Enterprise Information Systems. (採択済)(印刷中). 7 (2004)
- 関連する報告書
  2003 実績報告書

汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究

研究代表者

田中 和世 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)

16,500千円 (直接経費: 16,500千円)

報告書

研究成果

[雑誌論文] HMM-based noise-robust feature compensation2006

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] 分析区間長を可変としたテキスト分割手法2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] スポッティング区間の再認識に基づく音声検索性能の向上2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Instantaneous frequencies of signals obtained by the analytic signal method2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Multi-mixture based PDT-SSS Algorithm for Extension of an HMnet Structure2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 電動車いす搭載用平行マイクアレイ実装方式の検討2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Voice activity detection using YIN, a fundamental frequency estimator2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Combining Multiple subword representations for open-vocabulary spoken document retrieval2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Combining Multiple subword representations for open-vocabulary spoken document retrieval,2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents,2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in Disaster,2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals,2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents2005

田中和世筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)