研究課題
自然言語(テキスト・音声)の大規模処理は日々需要が高まっており、それ応えるには再利用性の高い資源(ツール・データ)の整備と機械学習の利用が必須である。これまで既存資源を「使う」ための自然言語処理プラットフォームを構築してきたが、自然言語処理ではドメイン依存性が高く、データに応じたツールの再学習が必要であることが多い。そこで能動学習を含めた機械学習統合の資源を「作る」ための全自動システムを構築する。同時に、機械学習の学習素性テンプレートを網羅的に実装・配信できるようにするのが目的である。本年度はそのために、主にプラットフォームの機械学習対応機能について、プロトタイプ作成を進めた。具体的には、教師つき機械学習手法を用いた訓練と、その結果の評価について、汎用性・互換性・可搬性を保ちつつ、容易に利用できるように、かつこれまでのプラットフォーム実装を極力生かし統合的なシステムとして利用可能になるように設計を検討し、プロトタイプとして実装した。また、実装した機能を現実的なタスクでテストするためのデータおよびコンポーネントの整備を進めた。
3: やや遅れている
当初予定よりも、プロトタイプのテスト進行が遅れている。
実装したプロトタイプを用いた学習および評価のワークフローを作成、テストを行い、プロトタイプの機能改良を進める。テストにおいては第三者による利用テストを通じ、非専門ユーザからのフィードバック取り込みを図る。同時に実行可能なコンポーネント・ワークフローの増加をはかり、汎用性の確認を行う。
当初計画からの遅れによる。
遂行予定に記載の本年度研究計画におけるシステム構築に使用する。
すべて 2015 2014
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (5件) (うち招待講演 1件)
大学入試研究ジャーナル
巻: 25 ページ: 129-135