1989 Fiscal Year Annual Research Report
日本語音声における韻律的特徴ー音声データべースの作成・保存と利用に関する研究
Project/Area Number |
01642003
|
Research Institution | University of Tsukuba |
Principal Investigator |
板橋 秀一 筑波大学, 電子・情報工学系, 教授 (70151454)
|
Co-Investigator(Kenkyū-buntansha) |
桑原 尚夫 NHK放送技術研究所, 主幹研究員
田中 和世 工業技術院電子技術総合研究所, 主任研究官
堀口 純子 筑波大学, 文芸・言語学系, 助教授 (00052283)
牧野 正三 東北大学, 応用情報学研究センター, 教授 (00089806)
|
Keywords | 日本語 / 音声 / 韻律 / 音声データベース |
Research Abstract |
音声データについては本重点領域研究A班の全面協力の下に全国100地点で計500名以上の共通語および方言音声を高品質録音としてディジタルオーディオテープ(DAT)に収録することができた。音声データベースの作成に際しては、原データの不要部分の削除、発声順序の入れ替え、発声間隔の調整等の編集作業が不可欠である。大まかな1次編集はDATを用いて行うが、より詳細な編集を行うためにはコンピュータを利用することとし、そのための基本的プログラムを開発し、そのテストを行った。 音声データベースをさらに使い易いものとするためには、音声の内容や話者の属性等を示すラベルを付与する必要がある。このための各種の手法の調査を行い、ラベルづけ用ソフトウェア開発の準備を行った。 ラベルづけの音声学的単位を検討するための基礎資料として話しことばにおける種々の縮約形の調査を行った。その実態をとらえるために、約6時間余の対談を録音し、それを文字化してデータベースとした。これによって縮約形の検索を効率的に行うことができることを示した。 音声データベースを有効に利用するためには、音声の基本周波数やホルマント周波数などの基本的な特徴量を抽出することが必要となる。そこでデータベースの特性を生かした、必ずしも即時性にとらわれない分析方法を提案し、その有効性を検証した。 本年度収録した音声データの中から、「桃太郎」と「天気予報」をとり上げ、全国20地点+NHKアナウンサーの発声によるものをデータベースとしてコンパクトディスクおよびDATに収録した。話者は合計21名で、「桃太郎」は共通語と方言、「天気予報」は共通語で読んだものが、61サンプル(約60分)収録された。これは方言音声を本格的にデータべース化した日本初の試みであろう。
|
Research Products
(9 results)
-
[Publications] S.ITAHASHI,K.TAKAGI: "Proc.European Conference on Speech Communication and Technology(Eurospeech 89)" Automatic formant frequency extraction by moment calculation of speech spectrum. 2. 207-210 (1989)
-
[Publications] 崔景旭,板橋秀一: "中国語音声データベースについて" 日本音響学会平成2年度春季研究発表会講演論文集. 3ー5ー9. (1990)
-
[Publications] 城風、牧野、城戸: "ホルマントを用いた単語音声認識" 電子情報通信学会技術報告. SP89ー49. 25-32 (1989)
-
[Publications] 松尾、牧野、城戸: "音素の持続時間モデルを用いた単語音声認識" 電子情報信学会技術報告. SP89ー80. 33-40 (1989)
-
[Publications] 堀口純子: "コミュニケーションにおける聞き手による予測の型" 筑波大学 文芸言語学系紀要「文芸言語研究言語編」. 17号. 1-18 (1990)
-
[Publications] 速水悟、田中和世、太田耕三: "音声の音響的変動記述の一般化について" 電子情報通信学会論文誌DーII. J72. 1215-1220 (1989)
-
[Publications] 田中和世、速水悟、大田耕三: "音韻バランス単語セットのラベリング結果と類推を用いた音響音声的変動のグループ化" 日本音響学会平成2年春季講演論文集. 177-178 (1990)
-
[Publications] 阿部匡伸、匂坂芳典、桑原尚夫: "言語・音韻情報を持つ連続音声の基本周波数データベース" 音響学会講演論文集. 10月,1989. 267-268 (1989)
-
[Publications] H.Kuwabara,K.Takeda,K.Shikano,A.Kurematsu: "ATR Speech database as a tool of speech recognition and synthesis" Proceedings of the Workshop of Speech I/0 Assessment and Speech Database. 2,3,1-2,3,4 (1989)