2013 Fiscal Year Research-status Report
日本語文章校正ツール「推敲」技術を用いた日本語教師用例文検索システムの開発
Project/Area Number |
24520596
|
Research Institution | Kumamoto Gakuen University |
Principal Investigator |
堤 豊 熊本学園大学, 商学部, 教授 (80227446)
|
Co-Investigator(Kenkyū-buntansha) |
松野 了二 熊本県立大学, 総合管理学部, 教授 (60044351)
|
Keywords | 国際情報交換 |
Research Abstract |
日本語教師用例文検索システムの構築の2年度目に当たり、本年度は、サーバーソフトウェアのプロトタイプシステムの完成と、クライアントソフトの作成が目標であった。サーバーソフトウェアの作成のために、まずはデータベース構築を行った。データベースに格納する対象例文をまずは著作権の問題がない「青空文庫」に限ることにした。対象例文として、インターネット上のサーバから青空文庫の例文を自動的に取り出し、XML言語で書かれた文書ファイルから小説の本文を取り出し、文書の所在を示すキー文字列とともに保存するプログラムを完成させた。このキー文字列は、類似文検索された結果としてクライアントソフト上で表示され、原典文書を探し出す事が可能となるように付加されている。さらに、その本文をmecab形態素解析技術を用いて、各形態素に分解し、形態素名と出現文書を検索キーとしてローカルサーバーに保存するところまで本年度は完成した。現在、類似例文の検索・照合アルゴリズムを実装中である。これらのプログラムはすべてmacサーバー上でruby 言語およびHpricotライブラリを用いて実装している。現在の問題点としては、macサーバーに格納された形態素解析後の単語リストの類似照合にかかる時間が長いため、実用速度で検索する事は難しい。従って、次年度は、主記憶容量が大きいサーバーを購入し、メモリー上で照合を行うように計画中である。クライアントソフトについても、サーバーソフトのプロトタイプ完成後に着手し、完成年度である次年度に同時に完成させる事とした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初2年目の目標としていた、プロトタイプシステムの開発について、一定のメドが付いた。ただし、実用的な速度は出ていないので、その点は改善が必要である。また、クライアントで動くソフトに付いては、まだ完成していない。
|
Strategy for Future Research Activity |
今年度は、研究の最終年度として、サーバー側のプログラムを改善し、またクライアントで動くVSTOアドインソフトの開発に取り組む。また、研究成果を論文にまとめる。
|
Expenditure Plans for the Next FY Research Funding |
2年度目は、サーバーソフト作成において当初予想したよりも実行速度が遅く、実用化のためには強力なサーバーが必要となった。そのために、クライアント用のパソコンの購入を控え、次年度へ予算を回す事が必要と考えられた。 サーバー用のソフト開発のために、主記憶容量の大きいサーバーパソコンを1台、またクライアントソフト開発のためにノートパソコンを1台購入予定である。
|