研究課題/領域番号 |
16200011
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
|
研究分担者 |
美濃 導彦 京都大学, 学術情報メディアセンター, 教授 (70166099)
古井 貞煕 東京工業大学, 情報理工学研究科, 教授 (90293076)
秋田 祐哉 京都大学, 学術情報メディアセンター, 助手 (90402742)
|
研究期間 (年度) |
2004 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
45,110千円 (直接経費: 34,700千円、間接経費: 10,410千円)
2006年度: 12,220千円 (直接経費: 9,400千円、間接経費: 2,820千円)
2005年度: 14,170千円 (直接経費: 10,900千円、間接経費: 3,270千円)
2004年度: 18,720千円 (直接経費: 14,400千円、間接経費: 4,320千円)
|
キーワード | 音声情報処理 / 音声認識 / 音声アーカイブ / 話し言葉処理 / 自動タグ付与 / 講演 / 講義 / 討論 |
研究概要 |
学会講演や大学の講義、放送番組や議会の討論などの音声アーカイブを対象として、自動音声認識及び書き起こしの自動整形に関する研究を行った。 このような自然な話し言葉音声では、発音の変動が大きく、口語的な表現が多用されるため、これらの精緻なモデル化と統計的な学習が必要である。また、語彙や話題も多様であるため、個々の講演・講義・討論に対して適応を行う必要がある。そのため、以下のようなテーマに取り組んだ。 ・『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習 ・統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換 ・話題と話者に関するPLSAに基づく言語モデルの適応 ・講義音声認識のためのスライド情報を利用した言語モデルの適応 ・会議音声の話題分割による単語辞書と言語モデルの適応 また、話し言葉の書き起こし(音声認識結果)は、そのままではアーカイブとして保存するには適切でなく、言い淀みの整形、口語的表現の修正、文などのセグメンテーションを行う必要がある。これらのテーマにも取り組んだ。 ・話し言葉の係り受け解析と文境界推定の相互作用による高精度化 ・係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング ・引用節・挿入節の自動認定及び係り受け解析と引用符の自動付与 ・自己修復部の検出及び修正による文編集 さらに、重要文を抽出したり、使用したスライドと対応付けることにより、有用なインデックスを生成できると考えて、以下のテーマにも取り組んだ。 ・講演の重要文抽出によるインデキシング ・スライドと発話の対応付けによる講義のインデキシング
|