2014 Fiscal Year Annual Research Report
全自動言語処理システムを用いたツール作成学習テンプレートの網羅的整備と共有
Project/Area Number |
26700019
|
Research Institution | Shizuoka University |
Principal Investigator |
狩野 芳伸 静岡大学, 情報学研究科, 准教授 (20506729)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 自然言語処理 / 機械学習 |
Outline of Annual Research Achievements |
自然言語(テキスト・音声)の大規模処理は日々需要が高まっており、それ応えるには再利用性の高い資源(ツール・データ)の整備と機械学習の利用が必須である。これまで既存資源を「使う」ための自然言語処理プラットフォームを構築してきたが、自然言語処理ではドメイン依存性が高く、データに応じたツールの再学習が必要であることが多い。そこで能動学習を含めた機械学習統合の資源を「作る」ための全自動システムを構築する。同時に、機械学習の学習素性テンプレートを網羅的に実装・配信できるようにするのが目的である。
本年度はそのために、主にプラットフォームの機械学習対応機能について、プロトタイプ作成を進めた。具体的には、教師つき機械学習手法を用いた訓練と、その結果の評価について、汎用性・互換性・可搬性を保ちつつ、容易に利用できるように、かつこれまでのプラットフォーム実装を極力生かし統合的なシステムとして利用可能になるように設計を検討し、プロトタイプとして実装した。また、実装した機能を現実的なタスクでテストするためのデータおよびコンポーネントの整備を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初予定よりも、プロトタイプのテスト進行が遅れている。
|
Strategy for Future Research Activity |
実装したプロトタイプを用いた学習および評価のワークフローを作成、テストを行い、プロトタイプの機能改良を進める。テストにおいては第三者による利用テストを通じ、非専門ユーザからのフィードバック取り込みを図る。同時に実行可能なコンポーネント・ワークフローの増加をはかり、汎用性の確認を行う。
|
Causes of Carryover |
当初計画からの遅れによる。
|
Expenditure Plan for Carryover Budget |
遂行予定に記載の本年度研究計画におけるシステム構築に使用する。
|
-
-
[Presentation] 『ロボットは東大に入れるか』プロジェクト 代ゼミセンター模試タスクにおけるエラーの分析2015
Author(s)
松崎拓也, 横野光, 宮尾祐介, 川添愛, 狩野芳伸, 加納隼人, 佐藤理史, 東中竜一郎, 杉山弘晃, 磯崎秀樹, 菊井玄一郎, 堂坂浩二, 平博順,南泰浩
Organizer
ワークショップ 自然言語処理におけるエラー分析(兼:Project Next NLP報告会), 言語処理学会第21回年次大会
Place of Presentation
京都大学, 京都, 京都府
Year and Date
2015-03-21
-
-
-
-