音韻のゆらぎの解析に基づく表現豊かな音声合成に関する研究
Project/Area Number |
13780269
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | The University of Tokyo |
Principal Investigator |
田中 久美子 (石井 久美子) 東京大学, 大学院・情報学環, 講師 (10323528)
|
Project Period (FY) |
2001 – 2002
|
Project Status |
Completed (Fiscal Year 2002)
|
Budget Amount *help |
¥2,700,000 (Direct Cost: ¥2,700,000)
Fiscal Year 2002: ¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2001: ¥1,400,000 (Direct Cost: ¥1,400,000)
|
Keywords | 音声合成 / 自然言語処理 |
Research Abstract |
今年度は、去年度解析した間と韻律の規則を用いて、実際に音声合成を行った。内容はサッカーの自動実況であり、結果として自由な文章の生成には程遠いものにとどまっている。しかし、韻律に変化を与えた方が、より状況を豊かに表現することができ、観客に与える印象も異なることがわかった。 具体的には、まずはサッカーの実況のためのデータを用意する。これはテンプレートによる生成と、文法による生成の中間的な方式によるもので、組み合わせにより多くの内容を生成することができる。テンプレートには、強勢の可能性のあるところにマークを付けておく。その上でサッカーの状況に合わせてこのマークを用いて、間と韻律を制御する。 本研究の結果、1997年から行っているサッカーの実況に関して、表現豊かな合成ができるようになった。かつては、常に同じ合成を用いており、ボールが中央にある状況とゴール時の実況はまったく同じであった。したがって観客の実況システムへの関心には限界があった。ところが、本成果を用いると、ゴールが入った瞬間などは韻律が上がり、間も変化する。これにより、観客も実況と共に感情を状況に移入することができるようになった。本システムのように読み上げの韻律や間を多少制御するだけで、大きく実況の印象が異なる。一方で、たとえば、40対0の状況下に、さらに1点得点した場合でも、同じように表現豊かに実況してしまう。このような「機械的な表現の豊かさ」は避けなければならない。結局、表現の豊かさは意味と深く関係しており、表層的な処理には限界がある。また、音声合成上は、現状では強勢の制御を行っていないため、英語での生成などには問題がある。また、現状では、サッカーの実況および物語以外の内容に用いるには限界がある。今後はこれまでの成果をベースにこれらの点をさらに改良していきたい。
|
Report
(2 results)
Research Products
(13 results)