研究課題/領域番号 |
16320052
|
研究種目 |
基盤研究(B)
|
研究機関 | 京都大学 |
研究代表者 |
壇辻 正剛 京都大学, 学術情報メディアセンター, 教授 (10188469)
|
研究分担者 |
大木 充 京都大学, 人間・環境学研究科, 教授 (60129947)
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
木南 敦 京都大学, 法学研究科, 教授 (30144314)
家本 太郎 京都大学, 留学生センター, 助教授 (60222832)
河崎 靖 京都大学, 人間・環境学研究科, 助教授 (40186086)
|
キーワード | 音声分析 / フィールドワーク / マルチメディア言語データベース / 音声コーパス / 調音機構 / 音響分析 |
研究概要 |
本年度は研究の初年度に当たるので、まず、フィールドワークに適した音声収録・分析の基礎的な研究として、各種諸言語の音声や方言の音声データの録音・収集・編集を行なった。音声データの一部は、マルチメディア音声データベースとして、コーパス利用が可能なように、インフォーマントの発話時の音声と同時に顔面正面画像と顔面左横画像の映像収録も行なった。発話時の口唇形状の動態変化の観察を可能にするための処理である。口唇形状の分析に関しては、円唇性対非円唇性の対立の判断基準として、発話時の静止画像や動画映像に基準点や基準線を付加する作業を行なった。インフォーマントの発話時の調音器官の分析に関しては、無線を利用した遠隔操作のCCDカメラを利用して、モニター上で声道上の一部調音器官の動態変化を観察する実験を行なった。入力音声の分析と認識の研究においては、フィールドワークでインフォーマントが発話した場合を想定して、発話音声の音響分析を施すと共に、音声認識技術を活用して、音声認識の処置を施し、音声デーダベース中の標準発音とのズレを確率統計的な手法で分析して、提示するシステムの基礎的な開発研究を行なった.。また、インフォーマントの発話音声の分析システムへの取り込みや音声データベースからのターゲット音声の切り出しと再生を、システムの他の機能とスムーズに連動して行なえるようなインターフェースの構築の研究を推進した。また、言語の音声ファイル化、音声ラベリング化の処理等が敏速に実行できるような環境の構築を試みた。これらの研究を通じて、今後はより精緻な音声分析が可能になるものと期待される。
|