研究課題/領域番号 |
20650143
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 補助金 |
研究分野 |
教育工学
|
研究機関 | 徳島大学 |
研究代表者 |
北 研二 徳島大学, 大学院・ソシオテクノサイエンス研究部, 教授 (10243734)
|
研究期間 (年度) |
2008 – 2010
|
研究課題ステータス |
完了 (2010年度)
|
配分額 *注記 |
3,100千円 (直接経費: 3,100千円)
2010年度: 800千円 (直接経費: 800千円)
2009年度: 1,300千円 (直接経費: 1,300千円)
2008年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 教育工学 / 外国語学習 / サフィックス・アレイ |
研究概要 |
本研究では、大規模な言語データから強力かつ柔軟な言語生成モデルを機械学習することのできるデータ構造である拡張サフィックス・アレイの提案、および、拡張サフィックス・アレイを作文支援システムに適用することを目的としている。本年度は、20年度、21年度での研究成果を実装した文字列予測システムの開発および評価を行った。 1.拡張サフィックス・アレイに基づく文字列予測システムの研究開発 拡張サフィックス・アレイを用いて、自然言語の文章データから、後続する可能性のある文字列を予測する機能をプログラムとして実装した。また、日本語のように、単語境界の曖昧な言語に対して、辞書等の教師データを用いずに単語境界を判定し、最適な文字列を生成する手法として、隣接文字間の統計情報に基づくエントロピーを利用した手法の実装も行った。 2.文字列予測システムの評価 新聞記事データを用いて、開発した文字列予測システムの評価を行った。評価実験では、新聞記事中の文字列から、予測文字列を上位20個まで出力し、出力文字列の中から言語的に適切だと思われる個数を計測したところ、98%の精度を得た。また、文字列予測システムを作文支援として用いる際に、ユーザの入力をどれだけ軽減できるかという測定実験を行い、作文支援システムの有効性についても調べた。
|