2010 Fiscal Year Annual Research Report
日本語の理解レベルに合わせた字幕付きVOD講義システムの開発
Project/Area Number |
22500950
|
Research Institution | Okayama University of Science |
Principal Investigator |
椎名 広光 岡山理科大学, 総合情報学部, 講師 (40299178)
|
Keywords | 教育工学 / 情報システム / ディレクトリ・情報検索 / 言語処理 |
Research Abstract |
課題テーマ「日本語の理解レベルに合わせた字幕付きVOD講義システムの開発」に対して、 本年度は、次の2点についてアルゴリズムを考案し試作を行った。 1日本語字幕付きVOD講義の字幕部分の短縮表示 2字幕に対する検索単語の頻度分布から映像区間の推定 1については、(1)日本語字幕付きVOD講義の字幕部分に対するTF-IDFによる重要語抽出(2)重要語と字幕の日本語文の係受け構造から不要な係るもとの節の削除による文短縮法(3)格フレーム構造間の係受け関係から重要度の低い係るもとの格フレームの削除による文短縮法の3つの順序で研究を進めた。字幕文を20%の削減をすることができ、削減した文自体も7割程度の文が問題なく意味が取れるという評価を得た。しかしながら、3割程度の文は文法から逸脱するため、今後は短縮した文を成形しなおす手法が必要と考えている。また、外国人からみての日本語のやさしい表現の構築が必要と考えられる。単語の使用レベル構築、助詞の置き換えを、次年度以降作成する予定である。 2については、(1)単語頻度分布に対して混合正規分布を当てはめ映像区間数の推定(2)推定した映像区間の評価と順位付けを混合正規分布とカーネル密度推定法から得られた分布を比較して評価する方法の2つ順序で研究を進めた。現在のところ検索単語は1単語を想定しているため、より高い効果得るために類義語による映像区間推定法の構築を予定しており、字幕に当てはめる混合正規分布を拡張した手法を試行する。
|