• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

フィールドワークに適した遠隔操作音声収録・分析装置の開発研究

Research Project

Project/Area Number 16320052
Research Category

Grant-in-Aid for Scientific Research (B)

Research InstitutionKyoto University

Principal Investigator

壇辻 正剛  京都大学, 学術情報メディアセンター, 教授 (10188469)

Co-Investigator(Kenkyū-buntansha) 大木 充  京都大学, 人間・環境学研究科, 教授 (60129947)
河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)
木南 敦  京都大学, 法学研究科, 教授 (30144314)
家本 太郎  京都大学, 留学生センター, 助教授 (60222832)
河崎 靖  京都大学, 人間・環境学研究科, 助教授 (40186086)
Keywords音声分析 / フィールドワーク / マルチメディア言語データベース / 音声コーパス / 調音機構 / 音響分析
Research Abstract

本年度は研究の初年度に当たるので、まず、フィールドワークに適した音声収録・分析の基礎的な研究として、各種諸言語の音声や方言の音声データの録音・収集・編集を行なった。音声データの一部は、マルチメディア音声データベースとして、コーパス利用が可能なように、インフォーマントの発話時の音声と同時に顔面正面画像と顔面左横画像の映像収録も行なった。発話時の口唇形状の動態変化の観察を可能にするための処理である。口唇形状の分析に関しては、円唇性対非円唇性の対立の判断基準として、発話時の静止画像や動画映像に基準点や基準線を付加する作業を行なった。インフォーマントの発話時の調音器官の分析に関しては、無線を利用した遠隔操作のCCDカメラを利用して、モニター上で声道上の一部調音器官の動態変化を観察する実験を行なった。入力音声の分析と認識の研究においては、フィールドワークでインフォーマントが発話した場合を想定して、発話音声の音響分析を施すと共に、音声認識技術を活用して、音声認識の処置を施し、音声デーダベース中の標準発音とのズレを確率統計的な手法で分析して、提示するシステムの基礎的な開発研究を行なった.。また、インフォーマントの発話音声の分析システムへの取り込みや音声データベースからのターゲット音声の切り出しと再生を、システムの他の機能とスムーズに連動して行なえるようなインターフェースの構築の研究を推進した。また、言語の音声ファイル化、音声ラベリング化の処理等が敏速に実行できるような環境の構築を試みた。これらの研究を通じて、今後はより精緻な音声分析が可能になるものと期待される。

  • Research Products

    (6 results)

All 2005 2004

All Journal Article (6 results)

  • [Journal Article] 日本人用英語発音学習システムにおける発音誤り誤検出の要因分析2005

    • Author(s)
      坪田康, 壇辻正剛, 河原達也
    • Journal Title

      日本音響学会講演論文集 2-2-16

      Pages: 353-354

  • [Journal Article] Practical Use of English Pronunciation System for Japanese Students in the CALL Classroom2004

    • Author(s)
      Yasushi Tsubota, Tatsuya Kawahara, Masatake Dantsuji
    • Journal Title

      Proceedings of ICSLP2004

      Pages: 1689-1692

  • [Journal Article] 発話データ分析に基づく日本人用英語発音学習システムの改良2004

    • Author(s)
      坪田康, 河原達也, 壇辻正剛
    • Journal Title

      日本音響学会研究発表会講演論文集 1-5-2

      Pages: 423-424

  • [Journal Article] Automatic indexing of lecture presentations using unsupervised learning of presumed discourse markers2004

    • Author(s)
      T.Kawahara, M.Hasegawa, K.Shitaoka, T.Kitade, H.Nanjo
    • Journal Title

      IEEE Trans.Speech & Audio Process Vol.12, No.4

      Pages: 409-419

  • [Journal Article] ニュラルネットワークによる顔の向きにロバストな特徴点検出法2004

    • Author(s)
      保黒政大, 菅井満, 梅崎太造, 佐藤省三
    • Journal Title

      日本福祉工学誌 Vol.6, No1

      Pages: 26-31

  • [Journal Article] 声帯振動開始時間(Voice Onset Time)に関わる研究動向2004

    • Author(s)
      清水克正
    • Journal Title

      名古屋学院大学論集 言語文化篇 16-1

      Pages: 69-75

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi