本研究の目的は、自然言語処理の研究開発において頻用される、教師つき機械学習手法をより容易に利用可能にすることである。そのために、ユーザの作業を省力化する自動化機能と、結果の解析を効率的・効果的にする補助機能のプロトタイプ的な設計と実装を行ってきた。ユーザフィードバックからの調査では、実装した各種機能への期待と需要が高い一方で、現行の設計では機能を使いこなすためのハードルが未だ高く、ユーザの期待する多様な応用領域のデータにも必ずしも対応しきれていないことがわかった。そこで本研究ではパイロットタスク的な試みとして、まずは一通りの設計と実装を行い、同時に将来研究でのさらなる発展を念頭に不足点の洗い出しを行ってきた。 システムの実行の流れとしてはおおまかに、入力データの読み込み、学習素性の生成、学習素性の抽出、機械学習、結果の解析、となる。これらの各要素を、コーパスリーダーや言語処理ツールといったコンポーネントに分割かつ標準化・互換化し、現実的なタスクにおける応用を行った。応用の対象は主に、英語で記述された生物学論文からのテキストマイニングであった。応用における具体的な事例について、データ型階層やコンポーネント化の体系化を行い、システムの応用を含めた成果をまとめ、雑誌論文や学会等において発表した。 また、これらの研究の経験から、新規の設計および実装による汎用自動化プラットフォームを構築する、別途の発展的な研究課題につなげることができた。
|