研究課題/領域番号 |
17500663
|
研究機関 | 大谷女子大学 |
研究代表者 |
大倉 孝昭 大谷女子大学, 教育福祉学部, 教授 (50223772)
|
研究分担者 |
高畑 由起夫 大谷女子大学, 総合政策学部, 教授 (90183061)
中條 道雄 大谷女子大学, 総合政策学部, 教授 (70278779)
|
キーワード | PC要約筆記 / 音声認識ツール / 同時同期字幕 / 誤認識 / 誤変換 / アクティブ字幕 |
研究概要 |
平成17年度は下記2点を中心に研究を進めた。 (ア)音声認識ツールのデータを、字幕として組み込むことは可能か、またカスタマイズにより対応することができるか (イ)IPtalkを利用した場合と(ア)の方式の的確度、冗長度、汎用性、可搬性、ランニングコストを比較する 音声認識ツールとして、Dragon Speechを購入し大谷女子大学の授業で利用実験を行った。Dragon Speech自体には音声認識時に時刻を記録する機能がない。そこでIPTalkの入力用ツールとしてこれを利用することができるかの検討を行った。その結果、IPTalkに対する仮名漢字変換プロセッサと同等の働きをすることが判明した。 時刻を記録するためには、IPTalkでEnterキーを押下して当該入力行をネットワーク上へ確定・送出する必要がある。そこで、話者自身が話しながらキーを押すか、別の支援者がキーを押して確定する必要が出てきた。 実験では、報告者のゼミナールに所属する学生の協力を得て、"入力行の確定"を行った。音声認識ツールでは誤変換や誤認識が起こる。また、話し言葉は書き言葉に較べて冗長になるため、要約する必要がある。つまり、話者一人で完全な字幕データを入力していくのはきわめて困難であり、必ず修正が必要であるから、その修正者がEnterキーを押すことを条件にすれば、かなり質のよい字幕が作成できることが判明した。しかし、その修正者にもある程度の「修正スキル」が必要となる。現在、協力者である学生をトレーニングしている。 遠隔地の復唱者が要約発話を行い、それを音声認識ツールによって字幕化する方式での誤認識・誤変換について、研究に協力してくれた聾学生から統計・分析結果を入手した。聴覚障害者が困る誤認識・誤変換を応用言語学の立場から検討したものである。その知見を活かし、全国の大学に分散している聴覚障害者に字幕の評価をしてもらうため、同一の授業について音声認識ツールを用いた字幕とPC要約筆記による字幕をWebページ上で比較・評価・データ収集できるシステムを設計し、製作中である。Webページ上で授業の動画に同期表示される字幕をクリックする(アクティブ字幕)ことで、字幕のどの部分に問題があるのかを評価したデータが、サーバー上のデータベースに蓄積できるようになっている。
|