ニュース音声の認識と自動字幕化・要約化に関する研究

研究課題

研究課題/領域番号	09480064
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	豊橋技術科学大学
研究代表者	中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)
研究分担者	甲斐充彦静岡大学, 工学部, 講師 (60283496) 峯松信明豊橋技術科学大学, 工学部, 助手 (90273333) 増山繁豊橋技術科学大学, 工学部, 教授 (60173762) 安藤彰男社団法人日本放送協会, 放送技術研究所, 副部長
研究期間 (年度)	1997 – 1999
研究課題ステータス	完了 (1999年度)
配分額 *注記	13,100千円 (直接経費: 13,100千円) 1999年度: 4,800千円 (直接経費: 4,800千円) 1998年度: 3,100千円 (直接経費: 3,100千円) 1997年度: 5,200千円 (直接経費: 5,200千円)
キーワード	音声認識 / 音響モデル / 字幕化 / ディクテーション / 言語モデル / 要約化 / ニュース音声 / 大語彙連続音声認識 / ニュース文 / 要約
研究概要	本研究では、ニュース音声の認識と字幕化に関して(1)音響モデル、(2)言語モデル、(3)要約化の研究を行なった。要約化に関しては、ニュース音声の認識結果を用いた場合と書き起こしテキストを用いた場合について研究を行なった。 (1)音響モデルは前後の音素の影響を考慮したトライフォン単位のHMMが世界的標準となっており、日本語に於いてもその有効性が確かめられている。そこで、音節単位とトライフォン単位の詳細な比較実験を行ない、連続音声認識ではやや音節単位が良く、日本語に対しては音節単位が有効であることがわかった。また、朗読音声と比べて自然発話の方が音声認識が困難なことを定量的に明らかにした。 (2)言語モデルの評価尺度としてパープレキシティをが用いられてきたが、この尺度の欠点を指摘し、新たにSMR-パープレキシティを提案し、シミュレーション実験により、その妥当性を明らかにした。また、未知語を含む文のパープレキシティの新しい算出法を提案した。次に、新聞テキストではあるが、タスク(記事面)別の適応化や最寄りの記事による適応化の有効性、固有名詞の登録、定型表現の利用の有効性を明らかにした。 (3)ニュース文の要約技術の特徴として逐次オンライン処理の必要性がある。そこで、一文毎に要約を行なう方法を種々検討した。それらは、修飾語の削除、例示などを含む文節(冗長部)の削除、重複部の削除、などである。これらには形態素解析と簡易な構文解析方による係り受け解析を用いた。また、言い換えによる表現の短縮化技術も開発した。

報告書

(4件)

研究成果
(34件)

すべてその他

すべて文献書誌 (34件)

[文献書誌] K. Hanai, K. Yamamoto, N. Minematsu and S. Nakagawa: "Continuous speech recognition using segmental unit input HMMS with mixture of probability density functions and context dependency"Proc. 5th Int. Conf. Spoken Language Processing. 2935-2938 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 中川聖一、赤松裕隆、西崎博光: "音声認識用言語モデルのためのタスク適応化と定型表現の利用"自然言語処理. 6・2. 97-115 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 甲斐充彦、廣瀬良文、中川聖一: "単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理"情報処理学会論文誌. 40・4. 1385-1394 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 三上真、増山繁、中川聖一: "ニュース番組における字幕生成のための文内短縮による要約"自然言語処理. 6・6. 65-81 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] H. Nishizaki and S. Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc. Int. Workshop on Text, Speech and Dialogue, in Lecture Notes in Artificial Intelligence. 286-289 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 中川聖一: "音声認識研究の動向"電子情報通信学会論文誌. J83-DII・2. 433-457 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 中川聖一: "岩波書店"5章音声認識「音声」(田窪,前川,本多,白井,中川). 177〜229 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 中川聖一: "丸善"パターン情報処理. 310 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] K.Hanai, K.Yamamoto, N.Minematsu and S.Nakagawa: "Continuous Speech Recognition Using Segmental Unit Input HMMs with a Mixture of Probability Density Functions and Context Dependency"Proc. 5th Int. Conf. Spoken Language Processing. 2935-2938 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] S.Nakagawa, H.Akamatsu and H.Nishizaki: "A Task Adaptation Method and Use of Idiomatic Expression of Stochastic Language Model for Speech recognition"Journal of Natural Language Processing. Vol.6, No.6 (in Japanese). 89-107 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] A.Kai, Y.Hirose and S.Nakagawa: "Dealing with Out-of-vocabulary Words and Filled Pauses in Word N-gram based Speech Recognition System"Trans. IPSJ. Vol.40, No.4 (in Japanese). 1385-1394 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] M.Minami, S.Masuyama and S.Nakagawa: "A Summarization Method by Reducing Redundancy of Each Sentence for Making Captions of Newscasting"Journal of Natural Language Processing. Vol.6, No.6 (in Japanese). 65-81 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] H.Nishizaki and S.Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc. Int. Workshop on Text, Speech and Dialogue, in Lecture Notes in Artificial Intelligence, V.Matousek, P.Mautner, J.Ocelikova and P.Sojka, Springer. 286-289 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] S.Nakagawa: "A Survey on Automatic Speech Recognition"IEICE Trans. Vol.83-D II No.2 (in Japanese). 433-457 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Seiichi Nakagawa: "Speech Recognition, Speech"Iwanami-Shoten (in Japanese). (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Seiichi Nakagawa: "Pattern Information Processing"Maruzen (in Japanese). (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] K.Hanai,K.Yamamoto,N.Minematsu and S.Nakagawa: "Continuous speech recognition using segmental unit input HMMs with mixture of probability density functions and context dependency"Proc.5th Int,Conf,Spoken Language Processing. 2935-2938 (1998)
- 関連する報告書
  1999 実績報告書
[文献書誌] 中川聖一、赤松裕隆、西沢博光: "音声認識用言語モデルのためのタスク適応化と定型表現の利用"自然言語処理. 6・2. 97-115 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 甲斐充彦、廣瀬良文、中川聖一: "単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理"情報処理学会論文誌. 40・4. 1385-1394 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 三上真、増山繁、中川聖一: "ニュース番組における字幕生成のための文内短縮による要約"自然言語処理. 6・6. 65-81 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] H.Nishizaki and S.Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc.Int Workshop on Text,Speech and Dialogue,in Lecture Notes in Artificial Intelligence. 286-289 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 中川聖一: "音声認識研究の動向"電子情報通信学会論文誌. J83-DII・2. 433-457 (2000)
- 関連する報告書
  1999 実績報告書
[文献書誌] 中川聖一: "岩波書店"5章音声認識『音声』(田窪、前川、本多、白井、中川). 177-229 (1998)
- 関連する報告書
  1999 実績報告書
[文献書誌] 中川聖一: "丸善"パターン情報処理. 310 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 甲斐充彦: "N-gram言語モデルと効率的探索法を用いた大語彙連続音声認識システムの検討" 電子情報通信学会・音声技術報告. SP97-99. 31-38 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 山崎邦子: "聴覚障害者用字幕生成のための言い替えによるニュース文要約" 第4回言語処理学会論文集. 646-649 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 三上真: "文中の重要部抽出と言い替えを併用した聴覚障害者用字幕生成のためのニュース要約" 第4回言語処理学会併設ワークショップ. (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 赤松裕隆: "新聞・ニュースをタスクとした大語彙連続音声認識システムの評価" 情報処理学会、第57回全国大会. 6C-10. 2-35-2-36 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 中川聖一: "音声認識用言語モデルのためのタスク適応化と定型表現の利用" 自然言語処理. 6・2. 97-115 (1999)
- 関連する報告書
  1998 実績報告書
[文献書誌] 三上真: "ニュース音声の認識結果を用いた要約による字幕生成" 情報処理学会、第58回全国大会. 3W-5. (1999)
- 関連する報告書
  1998 実績報告書
[文献書誌] 甲斐充彦: "N-gram言語モデルと効率的探索法を用いた大語彙連続音声認識システムの検討" 電子情報通信学会・音声技術報告. sp97-99. 31-38 (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] 西崎博光: "音声認識のための定型表現を用いた言語モデルの検討" 第4回言語処理学会論文集. (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] 山崎邦子: "聴覚障害者用字幕生成のための言い替えによるニュース文要約" 第4回言語処理学会論文集. (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] 三上真: "文中の重要部抽出と言い換えを併用した聴覚障害者用字幕生成のためのニュース文要約" 第4回言語処理学会併用ワークショップ. (1998)
- 関連する報告書
  1997 実績報告書

ニュース音声の認識と自動字幕化・要約化に関する研究

研究代表者

中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)

13,100千円 (直接経費: 13,100千円)

報告書

研究成果

[文献書誌] K. Hanai, K. Yamamoto, N. Minematsu and S. Nakagawa: "Continuous speech recognition using segmental unit input HMMS with mixture of probability density functions and context dependency"Proc. 5th Int. Conf. Spoken Language Processing. 2935-2938 (1998)

説明

関連する報告書

[文献書誌] 中川聖一、赤松裕隆、西崎博光: "音声認識用言語モデルのためのタスク適応化と定型表現の利用"自然言語処理. 6・2. 97-115 (1999)

説明

関連する報告書

[文献書誌] 甲斐充彦、廣瀬良文、中川聖一: "単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理"情報処理学会論文誌. 40・4. 1385-1394 (1999)

説明

関連する報告書

[文献書誌] 三上真、増山繁、中川聖一: "ニュース番組における字幕生成のための文内短縮による要約"自然言語処理. 6・6. 65-81 (1999)

説明

関連する報告書

[文献書誌] H. Nishizaki and S. Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc. Int. Workshop on Text, Speech and Dialogue, in Lecture Notes in Artificial Intelligence. 286-289 (1999)

説明

関連する報告書

[文献書誌] 中川聖一: "音声認識研究の動向"電子情報通信学会論文誌. J83-DII・2. 433-457 (2000)

説明

関連する報告書

[文献書誌] 中川聖一: "岩波書店"5章音声認識「音声」(田窪,前川,本多,白井,中川). 177〜229 (1998)

説明

関連する報告書

[文献書誌] 中川聖一: "丸善"パターン情報処理. 310 (1999)

説明

関連する報告書

[文献書誌] K.Hanai, K.Yamamoto, N.Minematsu and S.Nakagawa: "Continuous Speech Recognition Using Segmental Unit Input HMMs with a Mixture of Probability Density Functions and Context Dependency"Proc. 5th Int. Conf. Spoken Language Processing. 2935-2938 (1998)

説明

関連する報告書

[文献書誌] S.Nakagawa, H.Akamatsu and H.Nishizaki: "A Task Adaptation Method and Use of Idiomatic Expression of Stochastic Language Model for Speech recognition"Journal of Natural Language Processing. Vol.6, No.6 (in Japanese). 89-107 (1999)

説明

関連する報告書

[文献書誌] A.Kai, Y.Hirose and S.Nakagawa: "Dealing with Out-of-vocabulary Words and Filled Pauses in Word N-gram based Speech Recognition System"Trans. IPSJ. Vol.40, No.4 (in Japanese). 1385-1394 (1999)

説明

関連する報告書

[文献書誌] M.Minami, S.Masuyama and S.Nakagawa: "A Summarization Method by Reducing Redundancy of Each Sentence for Making Captions of Newscasting"Journal of Natural Language Processing. Vol.6, No.6 (in Japanese). 65-81 (1999)

説明

関連する報告書

[文献書誌] H.Nishizaki and S.Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc. Int. Workshop on Text, Speech and Dialogue, in Lecture Notes in Artificial Intelligence, V.Matousek, P.Mautner, J.Ocelikova and P.Sojka, Springer. 286-289 (1999)

説明

関連する報告書

[文献書誌] S.Nakagawa: "A Survey on Automatic Speech Recognition"IEICE Trans. Vol.83-D II No.2 (in Japanese). 433-457 (2000)

説明

関連する報告書

[文献書誌] Seiichi Nakagawa: "Speech Recognition, Speech"Iwanami-Shoten (in Japanese). (1998)

説明

関連する報告書

[文献書誌] Seiichi Nakagawa: "Pattern Information Processing"Maruzen (in Japanese). (1999)

説明

関連する報告書

[文献書誌] K.Hanai,K.Yamamoto,N.Minematsu and S.Nakagawa: "Continuous speech recognition using segmental unit input HMMs with mixture of probability density functions and context dependency"Proc.5th Int,Conf,Spoken Language Processing. 2935-2938 (1998)

関連する報告書

[文献書誌] 中川聖一、赤松裕隆、西沢博光: "音声認識用言語モデルのためのタスク適応化と定型表現の利用"自然言語処理. 6・2. 97-115 (1999)

関連する報告書

[文献書誌] 甲斐充彦、廣瀬良文、中川聖一: "単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理"情報処理学会論文誌. 40・4. 1385-1394 (1999)

関連する報告書

[文献書誌] 三上真、増山繁、中川聖一: "ニュース番組における字幕生成のための文内短縮による要約"自然言語処理. 6・6. 65-81 (1999)

関連する報告書

[文献書誌] H.Nishizaki and S.Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc.Int Workshop on Text,Speech and Dialogue,in Lecture Notes in Artificial Intelligence. 286-289 (1999)

関連する報告書

[文献書誌] 中川聖一: "音声認識研究の動向"電子情報通信学会論文誌. J83-DII・2. 433-457 (2000)

関連する報告書

[文献書誌] 中川聖一: "岩波書店"5章音声認識『音声』(田窪、前川、本多、白井、中川). 177-229 (1998)

関連する報告書

[文献書誌] 中川聖一: "丸善"パターン情報処理. 310 (1999)

関連する報告書

[文献書誌] 甲斐充彦: "N-gram言語モデルと効率的探索法を用いた大語彙連続音声認識システムの検討" 電子情報通信学会・音声技術報告. SP97-99. 31-38 (1998)

関連する報告書

[文献書誌] 山崎邦子: "聴覚障害者用字幕生成のための言い替えによるニュース文要約" 第4回言語処理学会論文集. 646-649 (1998)

関連する報告書

[文献書誌] 三上 真: "文中の重要部抽出と言い替えを併用した聴覚障害者用字幕生成のためのニュース要約" 第4回言語処理学会併設ワークショップ. (1998)

関連する報告書

[文献書誌] 赤松裕隆: "新聞・ニュースをタスクとした大語彙連続音声認識システムの評価" 情報処理学会、第57回全国大会. 6C-10. 2-35-2-36 (1998)

関連する報告書

[文献書誌] 中川聖一: "音声認識用言語モデルのためのタスク適応化と定型表現の利用" 自然言語処理. 6・2. 97-115 (1999)

関連する報告書

中川聖一豊橋技術科学大学, 工学部, 教授 (20115893)

[文献書誌] 三上真: "文中の重要部抽出と言い替えを併用した聴覚障害者用字幕生成のためのニュース要約" 第4回言語処理学会併設ワークショップ. (1998)

[文献書誌] 三上真: "ニュース音声の認識結果を用いた要約による字幕生成" 情報処理学会、第58回全国大会. 3W-5. (1999)