2002 Fiscal Year Annual Research Report
ネットワークコンテンツからの知識獲得とその音声言語への変換に関する研究
Project/Area Number |
14780306
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
大野 澄雄 東京工科大学, 工学部, 助教授 (80256677)
|
Keywords | ネットワークコンテンツ / 知識獲得 / 音声言語 / 音声合成 / 韻律 / 語選択 |
Research Abstract |
本研究は、テキストにより表現されたネットワーク上のコンテンツを、いかにユーザに分かりやすい音声言語に変換するかについて、2ヶ年にわたり実施するものである。初年度の平成14年度には、特にテキストの表層的な特徴により得られる情報をもとに文字言語の音声言語化への指針を得ることを目的として検討を行ない、下記の研究成果を得た。 1.メール及びWeb版新聞記事テキストの収集 文字言語により表現されたネットワークコンテンツとして、メーリングリストのアーカイブ及び大手新聞社のWeb上の新聞記事を対象としてテキストデータを収集した。前者は会話に近い文体を持つ独特のテキストとして、また後者はある程度整った文体のテキストとして採用した。 2.新聞記事テキストの分析 文字情報として閲覧するための新聞記事を音声化する際に問題となる表現について分析を行った。その結果、括弧などの特殊な記号の使われ方、文字言語特有の略語、記事特有の文章表現、等を列挙し、整理した。また、それらの文字言語表現に対する音声言語表現への変換規則について検討した。本年度は新聞記事を対象としたが、政治面、スポーツ面などに音声言語としては、適当でない表現形式(主に略語やカタカナ用語に対する邦訳)が多く、また見出しを中心に使われる体言止めの表現なども、文末に適切な処理を必要とすることが明らかにした。
|