2011 Fiscal Year Annual Research Report
日本語の理解レベルに合わせた字幕付きVOD講義システムの開発
Project/Area Number |
22500950
|
Research Institution | Okayama University of Science |
Principal Investigator |
椎名 広光 岡山理科大学, 総合情報学部, 講師 (40299178)
|
Keywords | 教育工学 / 情報システム / ディレクトリ・検索 / 言語処理 |
Research Abstract |
本年度は、6つの項目に分けて研究を行った。 (1)日本語の単語難易度推定:留学生の日本語レベルに合わせるために、日本語能力にあわせた日本語の難易度を調べる必要があり、単語の難易度の推定にサポートベクタマシンを利用して分類して推定を行っている。これにより字幕の簡易化に利用可能で、講義の語彙的な難易度についても把握可能である。 (2)日本語のやさしい表現への換言:講義で使われている日本語を少しでもやさしくするために、動詞をベースに日本語能力試験でより簡単なレベルで利用される単語に変換する仕組みを作成した。 (3)日本語単語の難易度を利用したVOD講義の難易度:単語の難易度推定を利用して、講義の資料や講義での発話からその難易度や難易度分布を調査した。講義の改善の資料に利用できると考えている。 (4)字幕付きVOD講義の話題区間の検索と関連区間の推定:VOD講義のなかから話題の抽出について研究を行った。話題の抽出には統計的な手法である混合正規分布を単語頻度分布に近似させる手法を用い、正規分布の成分に分解することで、一つの話題の区間や関連する区間を取り出すことができた。 (5)字幕付きVOD講義の話題変化検出:変化点の検出には、字幕の単語間の共起語グラフを作成し、共起語グラフの時系列変化から概念的な変化をとらえられるようにする手法を用いた。 (6)日本語VOD講義の多言語音声検索:VOD講義を検索に音声認識を利用するシステムをTablet型PC上に作成した。音声認識には日本語だけでなく、中国語での利用もできるように日本語の講義の発話のキーワードを中国語に変換しておく方法で多言語への対応もおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
日本語の単語の難易度について推定に関する研究を行っているが、動詞と助詞を連接するような場合の語彙的な難易度についても把握が必要である。
|
Strategy for Future Research Activity |
日本語の難易度については、サポートベクタマシンによる分類を行っているが、学習パラメータに頻度分布を利用しているため、難易度の級の種類数の次元が必要となっている。頻度分布で正規化することができるので次元縮約と混合正規分布を利用した分類が精度の向上が見込まれ、現在その適用手法を調査中である。また、動詞と助詞の連接に関しては、海外で利用されている日本語学習のテキストを入手し、学習順の調査、難易度推定を実施を行う予定である。
|