1999 Fiscal Year Annual Research Report
ニュース音声の認識と自動字幕化・要約化に関する研究
Project/Area Number |
09480064
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
甲斐 充彦 静岡大学, 工学部, 講師 (60283496)
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
増山 繁 豊橋技術科学大学, 工学部, 教授 (60173762)
安藤 彰男 社団法人 日本放送協会, 放送技術研究所, 副部長
|
Keywords | 音声認識 / 音響モデル / 字幕化 / ディクテーション / 言語モデル / 要約化 / ニュース音声 |
Research Abstract |
本研究では、ニュース音声の認識と字幕化に関して(1)音響モデル、(2)言語モデル、(3)要約化の研究を行なった。要約化に関しては、ニュース音声の認識結果を用いた場合と書き起こしテキストを用いた場合について研究を行った。 (1)音響モデルは前後の音素の影響を考慮したトライフォン単位のHMMが世界的標準となっており、日本語に於いてもその有効性が確かめられている。そこで、音節単位とトライフォン単位の詳細な比較実験を行ない、連続音声認識ではやや音節単位が良く、日本語に対しては音節単位が有効であることがわかった。また、朗読音声と比べて自然発話の方が音声認識が困難なことを定量的に明らかにした。 (2)言語モデルの評価尺度としてパープレキシティが用いられてきたが、この尺度の欠点を指摘し、新たにSMR-パープレキシティを提案し、シミュレーション実験により、その妥当性を明らかにした。また、未知語を含む文のパープレキシティの新しい算出法を提案した。次に、新聞テキストではあるが、タスク(記事面)別の適応化や最寄りの記事による適応化の有効性、固有名詞の登録、定型表現の利用の有効性を明らかにした。 (3)ニュース文の要約技術の特徴として逐次オンライン処理の必要性がある。そこで、一文毎に要約を行なう方法を種々検討した。それらは、修飾語の削除、例示などを含む文節(冗長部)の削除、重複部の削除、などである。これらには形態素解析と簡易な構文解析法による係り受け解析を用いた。また、言い換えによる表現の短縮化技術も開発した。
|
-
[Publications] K.Hanai,K.Yamamoto,N.Minematsu and S.Nakagawa: "Continuous speech recognition using segmental unit input HMMs with mixture of probability density functions and context dependency"Proc.5th Int,Conf,Spoken Language Processing. 2935-2938 (1998)
-
[Publications] 中川聖一、赤松裕隆、西沢博光: "音声認識用言語モデルのためのタスク適応化と定型表現の利用"自然言語処理. 6・2. 97-115 (1999)
-
[Publications] 甲斐充彦、廣瀬良文、中川聖一: "単語N-gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理"情報処理学会論文誌. 40・4. 1385-1394 (1999)
-
[Publications] 三上真、増山繁、中川聖一: "ニュース番組における字幕生成のための文内短縮による要約"自然言語処理. 6・6. 65-81 (1999)
-
[Publications] H.Nishizaki and S.Nakagawa: "A Retrieval System of Broadcast News Speech Documents Through Key Word and Voice"Proc.Int Workshop on Text,Speech and Dialogue,in Lecture Notes in Artificial Intelligence. 286-289 (1999)
-
[Publications] 中川聖一: "音声認識研究の動向"電子情報通信学会論文誌. J83-DII・2. 433-457 (2000)
-
[Publications] 中川聖一: "岩波書店"5章音声認識『音声』(田窪、前川、本多、白井、中川). 177-229 (1998)
-
[Publications] 中川聖一: "丸善"パターン情報処理. 310 (1999)