1998 Fiscal Year Annual Research Report
ニュース音声の認識と自動字幕化・要約化に関する研究
Project/Area Number |
09480064
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
安藤 彰男 日本放送協会, 放送技術研究所, 副部長
甲斐 充彦 豊橋技術科学大学, 工学部, 助手 (60283496)
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
|
Keywords | 音声認識 / 大語彙連続音声認識 / ニュース文 / ディクテーション / 言語モデル / 要約 / 字幕化 |
Research Abstract |
ニュース音声の認識と要約のために、大語彙連続音声認識システムと要約手法を検討した。 連続音声認識の研究では、1パス目でbigram言語を用いたビーム探索法に基づいてN-best候補を出力し、trigram言語モデルを2パス目に適用する大語彙連続音声認識システムについて検討した。まず、1パス目の探索処理において、探索空間を削除して処理を効率化する方法と、言語モデルの組み込み時のスコア評価法の改良について提案し、評価実験により有効性を調べた。語頭の共通な音節をまとめたtree構造の単語辞書情報を用いて探索処理の効率化を図った上で、音節単位相当の先読み照合や言語尤度のファクタリングを組み込み、時間遅れの少ないフレーム同期探索法での効率化を検討した。言語モデルの高精化に関しては、タスクやトピック別に言語モデルを適応化する方法と、タスクやトピックに依存した定型表現を用いる方法、固有名詞の扱い方を検討した。 ニュース文の要約の研究では、文ごとに一律の要約率を達成するのが望ましいため、一文ごとの要約を目指している。一文ごとの要約は自然言語処理において従来ほとんど研究されておらず、構文構造を破壊せずに要約するため、ニュース文に特化した簡易構文解析手法を提案するに至り、高い再現率での要約を実現した。ニュース文は、冗長な表現が多いが、字幕文では体言止め、漢字熟語が使用できる。そこで、語句の言い替えによるニュース文の要約法を検討した。評価実験では、重要部認定による手法と言い替えによる手法とを併用し、ニュース文の一文ごとに平均約60%の要約率を実現した。また、実際に、ニュース音声の認識結果に対しても要約実験を行なった。
|
-
[Publications] 甲斐充彦: "N-gram言語モデルと効率的探索法を用いた大語彙連続音声認識システムの検討" 電子情報通信学会・音声技術報告. SP97-99. 31-38 (1998)
-
[Publications] 山崎邦子: "聴覚障害者用字幕生成のための言い替えによるニュース文要約" 第4回言語処理学会論文集. 646-649 (1998)
-
[Publications] 三上 真: "文中の重要部抽出と言い替えを併用した聴覚障害者用字幕生成のためのニュース要約" 第4回言語処理学会併設ワークショップ. (1998)
-
[Publications] 赤松裕隆: "新聞・ニュースをタスクとした大語彙連続音声認識システムの評価" 情報処理学会、第57回全国大会. 6C-10. 2-35-2-36 (1998)
-
[Publications] 中川聖一: "音声認識用言語モデルのためのタスク適応化と定型表現の利用" 自然言語処理. 6・2. 97-115 (1999)
-
[Publications] 三上 真: "ニュース音声の認識結果を用いた要約による字幕生成" 情報処理学会、第58回全国大会. 3W-5. (1999)