研究課題
自然言語(テキスト・音声)の大規模処理は日々需要が高まっており、それに応えるには再利用性の高い資源(ツール・データ)の整備と機械学習の利用が必須である。これまで既存資源を「使う」ための自然言語処理プラットフォームを構築してきたが、自然言語処理ではドメイン依存性が高く、データに応じたツールの再学習が必要であることが多い。そこで機械学習統合の、資源を「作る」ための全自動システムを構築する。同時に、機械学習の学習素性テンプレートを網羅的に実装・配信できるようにするのが目的である。そのために、主にプラットフォームの機械学習対応機能について、プロトタイプ作成を進めた。具体的には、教師付き機械学習手法を用いた訓練と、その結果の評価について、汎用性・互換性・可搬性を保ちつつ、容易に利用できるように、かつこれまでのプラットフォーム実装を極力生かし統合的なシステムとして利用可能になるように設計を検討し、プロトタイプとして実装した。本年度は、このプロトタイプのテストを兼ね、いくつか実際的なアプリケーションにプラットフォームやコンポーネントを応用する実験を行った。具体的には、大学入試の自動解答、医療言語情報処理、法律文書の処理などである。
3: やや遅れている
初年度のプロトタイプのテスト遅れの影響による。
今後はさらに応用事例を増やしつつ、システムの洗練化を進める。
実装進捗状況の遅延による。
本来予定にかかわる部分を次年度に遂行する。
すべて 2016 2015
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件) (うち国際学会 1件)
自然言語処理,
巻: 23(1) ページ: 119-159