研究課題/領域番号 |
09480064
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
研究分担者 |
安藤 彰男 日本放送協会, 放送技術研究所, 主任研究員
甲斐 充彦 豊橋技術科学大学, 工学部, 助手 (60283496)
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
|
キーワード | 音声認識 / 大語彙連続音声認識 / ニュース文 / ディクテーション / 言語モデル / 要約 / 字幕化 |
研究概要 |
ニュース音声の認識と要約のために、大語彙連続音声認識システムと要約手法を検討した。 連続音声認識の研究では、1パス目でbigram言語を用いたビーム探索法に基づいてN-best候補を出力し、trigram言語モデルを2パス目に適用する大語彙連続音声認識システムについて検討した。まず、1パス目の探索処理において、探索空間を削減して処理を効率化する方法と、言語モデルの組み込み時のスコア評価法の改良について提案し、評価実験により有効性を調べた。語頭の共通な音節をまとめたtree構造の単語辞書情報を用いて探索処理の効率化を図った上で、音節単位相当の先読み照合を組み込み、時間遅れの少ないフレーム同期探索方法での効率化を検討した。統計的な言語モデルを音声認識に適用する場合、一般的な言語モデルを構築するのは困難である。そこで、タスクやトピック別に言語モデルを適応化する方法や、タクトやトピックに依存した定型表現を用いる方法を検討した。 ニュース文の要約の研究では、文ごとに一律の要約率を達成するのが望ましいため、一文ごとの要約を目指している。一文ごとの要約は自然言語処理において従来ほとんど研究されておらず、構文構造を破壊せずに要約するため、さまざまなアプローチを試みた。試行錯誤の末、ニュース文に特化した簡易構文解析手法を提案するに至り、高い再現率での要約を実現した。ニュース文は、冗長な表現が多いが、字幕文では体言止め、漢字熟語が使用できる。そこで、語句の言い換えによるニュース文の要約法を検討した。評価実験では、重要部認定による手法と言い換えによる手法とを併用し、ニュース文の一文ごとに平均約60%の要約率を実現した。
|