• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

重要な特徴を自動的に発見する系列ラベリング学習の研究

Research Project

Project/Area Number 22500121
Research InstitutionEhime University

Principal Investigator

二宮 崇  愛媛大学, 大学院・理工学研究科, 准教授 (20444094)

Keywords自然言語処理 / 機械学習 / オンライン学習
Research Abstract

平成23年度は、研究計画に従って、オンライン・グラフティングにおける学習アルゴリズムの改良を行い、数十万次元に及ぶ高次元言語データに対する性能評価を行った。平成22年度の研究により、従来の手法に比ベオンライン・グラフティングは精度性能が高いことが判明したが、一方計算コストも非常に高いことが判明した。従前は共役勾配法により最適化が行われていたが、このモジュールをオンライン学習に置き換えることにより大規模実験が行えるようにした。
平成22年度までは次元数の小さい比較的実験的なデータを用いていたが、平成23年度は本研究課題の目的である言語データを扱うため、文書分類のための識別学習を実験対象とした。言語データにおける特徴数は数十万におよび、非常に次元数の高いデータとなるため、ベクトル表現を配列から連想配列に変更し、実装を行った。しかし、オンライン・グラフティングにおいては特徴を一つ選択する毎に共役勾配法を用いてパラメータの最適化を行う必要があるため、言語データのような非常に特徴数の多いデータに対しては現実的な時間で計算を行うことができなかった。本研究では、(1)共役勾配法ではなく、より効率的な確率的勾配法を用いることにより学習を効率化し、(2)特徴一つ選択する毎にパラメータ最適化を行うのではなく、ある一定数の特徴を選択する毎にパラメータ最適化を行う手法を考案し適用した。(1)に関しては、大きな効率化が得られたものの精度がやや低下することが判明した。(2)に関しては、近似的な特徴選択手法となっているが、最適な特徴選択を与えた場合とほぼ同等の精度を実現し、また、この手法によって大きな効率化が得られることを実験により確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

昨年度までに、研究計画の予定通り、オンライン・グラフティングのアンサンブル学習、および、高次元言語データに対するオンライン・グラフティングの適応を実現した。

Strategy for Future Research Activity

今後研究計画に沿って、さらに次元数の大きな超高次元特徴空間から重要な特徴を選択すること、および、系列データへの適応を行う。確率的勾配法による精度低下を解消するため、既製ライブランによるロジスティック回帰やSVMを用いるなどの対策を試みる。

  • Research Products

    (4 results)

All 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (1 results) Book (2 results)

  • [Journal Article] Deterministic shift-reduce parsing for unification-based grammars2011

    • Author(s)
      Takashi Ninomiya
    • Journal Title

      Natural Language Engineering

      Volume: 17 Pages: 331-365

    • DOI

      10.1017/S1351324910000240

    • Peer Reviewed
  • [Presentation] オンライングラフティングのパラメータ平均化による集合型学習2011

    • Author(s)
      大井健吾
    • Organizer
      平成23年度電気関係学会四国支部連合大会
    • Place of Presentation
      阿南工業高等専門学校(徳島県)
    • Year and Date
      2011-09-23
  • [Book] 月刊愛媛ジャーナルvol.25 no.7(シーズ(研究成果)探訪vol.81,データの自動分類とテキストの構文解析-高速化と高精度化-自動的に特徴を学習するオンライン学習と言語学的文法に基づく構文解析,p.80-82)2011

    • Author(s)
      二宮崇
    • Total Pages
      3
    • Publisher
      株式会社愛媛ジャーナル
  • [Book] AAMTジャーナルNo.50(シンポジウム報告MT Summit XIII参加報告,p.2-3)2011

    • Author(s)
      二宮崇
    • Total Pages
      2
    • Publisher
      アジア太平洋機械翻訳協会(AAMT)

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi