2006 Fiscal Year Annual Research Report
情報保障用字幕付き授業アーカイブ作成時の音声認識ツールとPC要約筆記の性能比較
Project/Area Number |
17500663
|
Research Institution | Department of Education and Social Welfare, Osaka Ohtani University |
Principal Investigator |
大倉 孝昭 大阪大谷大学, 教育福祉学部, 教授 (50223772)
|
Co-Investigator(Kenkyū-buntansha) |
中條 道雄 関西学院大学, 総合政策学部, 教授 (70278779)
高畑 由紀夫 関西学院大学, 総合政策学部, 教授 (90183061)
|
Keywords | PC要約筆記 / 音声認識ツール / 同時同期字幕 / 誤認識 / 誤変換 / 復唱者 |
Research Abstract |
平成18年度は下記2点を中心に研究を進めた。 (ア)収録済みのビデオコンテンツに字幕付与を行い、字幕無しのコンテンツと並置して、オンデマンド・コンテンツの利用者に選択学習させた。健聴学習者の字幕付コンテンツに対する利便性の認知、聴覚障害学への意識、字幕付与のコストをアンケートにより調査した。 (イ)聴覚障害学生に対する情報保障が恒常的に実施されているG大学に実験授業を依頼して、一つの授業に対して同時並行的に用いられた、音声認識ツール(復唱・修正方式)とPC要約筆記(IPTalk)によって得られた字幕データについて、その特徴を比較した。 18年4月に大倉は、他組織(PEPNet-Japan)からの招待で、PEN-International(本部:ロチェスター工科大学NTID内)の視察とPEPNet全米大会2006への参加の機会を得た。そこで、本科研のテーマに沿った聞き取り調査.支援現場のビデオ収録・調査団メンバーとの10日間に渡る議論を行った。その結果、日本より10年先行しているといわれる米国でも、音声認識ツールを教員(授業者)が直接利用する=音声認識の結果をそのまま学生に見せることはほとんど行われていないことが判明した。国内でも教員が自ら授業中に音声認識ツールを利用するという情報保障の形態はほとんど事例がないため、PC要約筆記と音声認識ツールの出力結果をそのまま比較する(この場合も、ある程度トレーニングを積んだ復唱者が音声入力する)ことに加え、修正者が修正した結果を比較することにした。1月初めに音声認識ツールのビジネス利用とPC要約筆記のビジネス化の現地調査を目的に再渡米した際に、さらにその確信を深めたので、それをもとに(イ)の実験を行った。 G大学での実験に参加した聴覚障害学生には、正確さより情報量の多いものを好むという傾向が見られた。また、音声認識ツールの出力結果を修正する場合、修正者(1名)は遅延音声を聞きながら画面の修正可能領域(100字前後)で作業をする。現実には、単位時間あたりの文字数がかなり多い(全発話を文字化しようとする)ため、修正箇所を探すのに時間がかかり(複数個所のことが多い)、未修正で残ってしまう。未修正率は、この修正システムのインタフェースや文字化の考え方・修正者のスキルにも大きく依存するため、未修正語句の定量的分析は事例報告と位置付けた。
|
Research Products
(3 results)