研究課題/領域番号 |
24520596
|
研究機関 | 熊本学園大学 |
研究代表者 |
堤 豊 熊本学園大学, 商学部, 教授 (80227446)
|
研究分担者 |
松野 了二 熊本県立大学, 総合管理学部, 教授 (60044351)
|
キーワード | 国際情報交換 |
研究概要 |
日本語教師用例文検索システムの構築の2年度目に当たり、本年度は、サーバーソフトウェアのプロトタイプシステムの完成と、クライアントソフトの作成が目標であった。サーバーソフトウェアの作成のために、まずはデータベース構築を行った。データベースに格納する対象例文をまずは著作権の問題がない「青空文庫」に限ることにした。対象例文として、インターネット上のサーバから青空文庫の例文を自動的に取り出し、XML言語で書かれた文書ファイルから小説の本文を取り出し、文書の所在を示すキー文字列とともに保存するプログラムを完成させた。このキー文字列は、類似文検索された結果としてクライアントソフト上で表示され、原典文書を探し出す事が可能となるように付加されている。さらに、その本文をmecab形態素解析技術を用いて、各形態素に分解し、形態素名と出現文書を検索キーとしてローカルサーバーに保存するところまで本年度は完成した。現在、類似例文の検索・照合アルゴリズムを実装中である。これらのプログラムはすべてmacサーバー上でruby 言語およびHpricotライブラリを用いて実装している。現在の問題点としては、macサーバーに格納された形態素解析後の単語リストの類似照合にかかる時間が長いため、実用速度で検索する事は難しい。従って、次年度は、主記憶容量が大きいサーバーを購入し、メモリー上で照合を行うように計画中である。クライアントソフトについても、サーバーソフトのプロトタイプ完成後に着手し、完成年度である次年度に同時に完成させる事とした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初2年目の目標としていた、プロトタイプシステムの開発について、一定のメドが付いた。ただし、実用的な速度は出ていないので、その点は改善が必要である。また、クライアントで動くソフトに付いては、まだ完成していない。
|
今後の研究の推進方策 |
今年度は、研究の最終年度として、サーバー側のプログラムを改善し、またクライアントで動くVSTOアドインソフトの開発に取り組む。また、研究成果を論文にまとめる。
|
次年度の研究費の使用計画 |
2年度目は、サーバーソフト作成において当初予想したよりも実行速度が遅く、実用化のためには強力なサーバーが必要となった。そのために、クライアント用のパソコンの購入を控え、次年度へ予算を回す事が必要と考えられた。 サーバー用のソフト開発のために、主記憶容量の大きいサーバーパソコンを1台、またクライアントソフト開発のためにノートパソコンを1台購入予定である。
|