• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文節境界を考慮した統計的言語モデルの高度化と音声認識への利用

Research Project

Project/Area Number 16650034
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionThe University of Tokyo

Principal Investigator

広瀬 啓吉  東京大学, 大学院・情報理工学系研究科, 教授 (50111472)

Co-Investigator(Kenkyū-buntansha) 峯松 信明  東京大学, 大学院・新領域創成科学研究科, 助教授 (90273333)
Project Period (FY) 2004 – 2005
Project Status Completed (Fiscal Year 2005)
Budget Amount *help
¥3,300,000 (Direct Cost: ¥3,300,000)
Fiscal Year 2005: ¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 2004: ¥1,600,000 (Direct Cost: ¥1,600,000)
Keywords言語モデル / 文節境界 / 音声認識 / 韻律的特徴 / Tri-gram / Filler / 自発発話音声 / 生成過程モデル / Perplexity / 言語コーパス / アクセント句境界 / 形態素解析
Research Abstract

日本語の言語構造・発話構造を考慮した新しい統計的言語モデルを開発した上で、それを音声認識システムに組み込む有効な方策を開発することを目的として以下の成果を達成した。
1.文節境界をまたぐ場合とまたがない場合のtri-gramモデルを学習し、従来のtri-gramモデルと比較し、8%程度以上のperplexityの減少が可能なことを示した。さらに、連続音声認識用openソフトウエアJuliusの第2パスに作成したtri-gramモデルを実装し、JNAS音声コーパスの音声サンプルについて認識実験を行った。新聞記事1年分で学習した言語モデルを用いた場合、提案した言語モデルを用いることにより、従来と比較して8%程度の認識率の改善が得られた。新聞記事3年分で学習した言語モデルを用いた場合には、顕著な改善効果は得られなかった。この観点から、提案したモデルは特に十分な学習コーパスが得られないときに有効であることが推察される。
2.上記は朗読音声に対する成果である。これを自発発話音声に発展させるため、自発発話で多く見られるFillerが深い文節境界で生起する確率が高いことに着目し、Fillerを検出するための韻律モジュールを開発した。当該形態素の韻律的特徴等を入力パラメータとする4層パーセプトロンで韻律モジュールを構築し、74%程度のフィラー検出率を達成した。この韻律モジュールをJuliusに組み込むことにより、90%を超えるRecall率を達成した。今後は、これをもとにFillerを考慮した言語モデルを作成し、自由発話音声の認識に用いる手法の開発を進める。
3.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。

Report

(2 results)
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (14 results)

All 2006 2005 2004

All Journal Article (14 results)

  • [Journal Article] 韻律を用いた連続音声認識2006

    • Author(s)
      広瀬啓吉
    • Journal Title

      韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-(丸善) 5章2節

      Pages: 163-173

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 韻律と音声認識2006

    • Author(s)
      広瀬啓吉
    • Journal Title

      電子情報通信学会誌 (発表予定)

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Detection of fillers using prosodic features in spontaneous speech recognition of Japanese2006

    • Author(s)
      Keikichi Hirose
    • Journal Title

      Proc.International Conference on Speech Prosody (発表予定)

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 韻律情報を用いた話し言葉音声認識におけるフィラー検出の改良2006

    • Author(s)
      阿部悠
    • Journal Title

      情報処理学会(音声言語情報処理研究会)研究報告 2006-SLP-60-9

      Pages: 43-48

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 音声認識時の韻律利用によるフィラー検出2006

    • Author(s)
      阿部悠
    • Journal Title

      日本音響学会講演論文集 CD-ROM

      Pages: 1213-1214

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006

    • Author(s)
      河村美由紀
    • Journal Title

      日本音響学会講演論文集 CD-ROM

      Pages: 387-388

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Filled pauses as cues to the complexity of following phrases2005

    • Author(s)
      Michiko Watanabe
    • Journal Title

      Proc.9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM

      Pages: 37-40

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Corpus-based extraction of F0 contour generation process model parameters2005

    • Author(s)
      Keikichi Hirose
    • Journal Title

      Proc.9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM

      Pages: 3257-3260

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 句境界のフィラーが聞き手の予測に及ぼす影響2005

    • Author(s)
      渡辺美知子
    • Journal Title

      第19回日本音声学会全国大会予稿集

      Pages: 37-42

    • Related Report
      2005 Annual Research Report
  • [Journal Article] フィラーの出現確率予測における節の種類と後続節長2005

    • Author(s)
      渡辺美知子
    • Journal Title

      日本音響学会講演論文集 CD-ROM

      Pages: 319-320

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 韻律を利用した音声認識時のフィラー検出の高精度化2005

    • Author(s)
      阿部悠
    • Journal Title

      日本音響学会講演論文集 CD-ROM

      Pages: 123-124

    • Related Report
      2005 Annual Research Report
  • [Journal Article] F_0モデルパラメータの自動抽出における統計的手法の利用2005

    • Author(s)
      古山悠介
    • Journal Title

      日本音響学会講演論文集 1

      Pages: 171-172

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Use of prosodic features for speech recognition2004

    • Author(s)
      Keikichi Hiorse
    • Journal Title

      Proc.8^<th> International Conference on Spoken Language Processing 2

      Pages: 1445-1448

    • Related Report
      2004 Annual Research Report
  • [Journal Article] N-gram language modeling of Japanese using bunsetsu boundaries2004

    • Author(s)
      Sungyup Chung
    • Journal Title

      Proc.8^<th> International Conference on Spoken Language Processing 2

      Pages: 993-996

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi