• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

あらゆる句の正規化:事実の抽出と発見のための大規模テキスト解析

Research Project

Project/Area Number 13F03041
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section外国
Research Field Intelligent informatics
Research InstitutionThe University of Tokyo

Principal Investigator

鶴岡 慶雅  東京大学 (50566362)

Co-Investigator(Kenkyū-buntansha) SAITO STENETORP  
SAITO STENETORP Pontus Lars Erik  東京大学, 工学(系)研究科(研究院), 外国人特別研究員
STENETORP Pontus  東京大学, 大学院工学系研究科, 外国人特別研究員
Project Period (FY) 2013-04-01 – 2016-03-31
Project Status Declined (Fiscal Year 2015)
Budget Amount *help
¥2,300,000 (Direct Cost: ¥2,300,000)
Fiscal Year 2015: ¥400,000 (Direct Cost: ¥400,000)
Fiscal Year 2014: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2013: ¥900,000 (Direct Cost: ¥900,000)
Keywords自然言語処理 / 機械学習 / ニューラルネットワーク / 深層学習 / 句の表現 / ジョイントモデリング / 意味解析 / 構文解析 / ベクトル空間モデル
Outline of Annual Research Achievements

本研究プロジェクトの目的はあらゆる句を正規化であるが、それを行うためには、様々な言語表現によって記述される名詞句や動詞句間の類似性を数値的に表現できる必要がある。
近年、そのような手法として、word2vecをはじめとする単語の分散表現の自動学習手法が注目を集めているが、我々はそれをさらに発展させ、「形容詞+名詞句」や「主語+動詞+目的語」といった句の分散表現を、構文解析済みの大量のテキストから自動学習する手法を開発した。具体的には、述語・項構造と呼ばれる、「深い」構文構造上にニューラルネットワーク言語モデルを構成し、述語・項構造中の単語予測の精度を最大化することによって、単語や句のベクトル表現を学習した。この種のベクトル表現の評価には、人間があらかじめ句の類似性を数値的にアノテートしたデータセットがしばしば用いられる。すなわち、得られたベクトル表現から計算される句同士の類似度が、人間の判断する類似度と高いほど高精度ということになるが、我々の手法によって得られたベクトル表現は、「形容詞+名詞」や「名詞+名詞」などにおいては、従来の世界最高レベルと同程度、「主語+動詞+目的語」のようなさらに複雑な構造をもつ句に対しては、従来の世界最高精度を上回る精度を達成した。このことは、我々の手法によって得られた句の分散表現が、従来手法よりも句の意味的な類似度をより正確にとらえていることを示している。

Research Progress Status

翌年度、交付申請を辞退するため、記入しない。

Strategy for Future Research Activity

翌年度、交付申請を辞退するため、記入しない。

Report

(2 results)
  • 2014 Annual Research Report
  • 2013 Annual Research Report
  • Research Products

    (2 results)

All 2014 2013

All Presentation (2 results)

  • [Presentation] Jointly Learning Word Representations and Composition Functions Using Predicate-Argument Structures2014

    • Author(s)
      Kazuma Hashimoto, Pontus Stenetorp, Makoto Miwa, and Yoshimasa Tsuruoka
    • Organizer
      Conference on Empirical Methods in Natural Language Processing
    • Place of Presentation
      Doha, Qatar
    • Year and Date
      2014-10-25 – 2014-10-29
    • Related Report
      2014 Annual Research Report
  • [Presentation] Transition-based Dependency Parsing Using Recursive Neural Networks2013

    • Author(s)
      Pontus Stenetorp
    • Organizer
      Deep Learning Workshop at the 2013 Conference on Neural Information Processing Systems (NIPS)
    • Place of Presentation
      Lake Tahoe, Nevada, USA
    • Year and Date
      2013-12-09
    • Related Report
      2013 Annual Research Report

URL: 

Published: 2014-01-29   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi