• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

分散表現と構成的意味計算に基づくテキストと知識ベースの頑健なグランディング

Research Project

Project/Area Number 15H05318
Research InstitutionTohoku University

Principal Investigator

岡崎 直観  東北大学, 情報科学研究科, 准教授 (50601118)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywords自然言語処理 / 言語資源 / 知識ベース
Outline of Annual Research Achievements

コンピュータが自然言語を理解・推論するには,与えられたテキストを計算機が蓄積している知識にグラウンディング(対応付ける)仕組みが不可欠である.今年度は,実体・概念や関係をグランディングするためのコーパスを構築し(研究項目③),そのコーパスを使った予備実験を行った(研究項目②).
実体・概念を知識ベースにグランディングするコーパスとして,BCCWJの新聞記事コーパスに含まれる固有表現をWikipedia記事に対応付けた正解データを構築した.このコーパスでは,340件の新聞記事に出現する約26,000件の実体・概念への言及の中で,対応するWikipedia記事が存在する約22,000件に対し,そのWikipedia記事IDを付与した.このコーパスを使った予備実験として,Wikipedia内リンク確率を用いた曖昧性解消器を開発したところ,約8割の正解率でグラウンディングできることを確認した.英語では同様のコーパスがすでに存在するが,日本語に対するコーパスを構築したのは本研究が初めてである.本コーパスが日本語の実体・概念の曖昧性解消器の開発に役立つのは勿論であるが,本タスクにおける言語や文化による差異の検証が深まると期待される.
関係を知識ベースにグランディングするためのコーパスとして,「increase the risk of」―「cause」など,関係パタンのペアの類似度に関するデータを作成した.このコーパスでは,5,555ペアの関係パタンに対して,人間が7段階の類似性スコアを付与した.なお,このコーパスの構築にはクラウドソーシングを活用し,比較的安価に質の高いデータを構築した.このコーパスに含まれる関係パタンは,関係パタンの意味を語の意味の合成として計算できる可能性が高いため,深層ニューラルネットワークによる意味合成モデルのベンチマークデータとしても有用である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

交付申請書では,本年度の研究実施計画として,③グランディングのためのコーパス構築,②関係パタンの曖昧性解消を挙げていた.研究項目③では,実体・概念と関係の両方に対してコーパスを構築して,予備実験を進めることができた.研究成果は言語処理分野で国内最大の言語処理学会で発表し,国際会議への投稿に向けて準備を進めている.研究項目③では,先ほど述べた言語処理学会に加えて,国際会議での発表や,国際ジャーナルの採択決定などの成果を生み出している.また,研究に関連して,3件の招待講演,3件の解説記事,4件の受賞があった.

Strategy for Future Research Activity

昨年度に作成したコーパスを活用し,グラウンディングのための計算モデルの研究を加速させる.体外発表を活発的に行うとともに,作成したコーパスや解析器の改良を続けながら,これらの成果をウェブサイト上で公開し,研究者や社会に還元する.

  • Research Products

    (17 results)

All 2016 2015

All Journal Article (4 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (13 results) (of which Int'l Joint Research: 2 results,  Invited: 2 results)

  • [Journal Article] Modeling semantic compositionality of relational patterns2016

    • Author(s)
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • Journal Title

      Engineering Applications of Artificial Intelligence

      Volume: 50 Pages: 256-264

    • DOI

      10.1016/j.engappai.2016.01.027

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] 言語処理における分散表現学習のフロンティア2016

    • Author(s)
      岡崎 直観
    • Journal Title

      人工知能

      Volume: 31(2) Pages: 189-201

  • [Journal Article] 単語の意味をコンピュータに教える2016

    • Author(s)
      岡崎 直観
    • Journal Title

      岩波データサイエンス

      Volume: 2 Pages: 47-61

  • [Journal Article] Web応用タスクにおけるエラー分析 -Twitterを用いた疾患サーベイランスを題材に-2016

    • Author(s)
      荒牧 英治, 岡崎 直観
    • Journal Title

      情報処理

      Volume: 57(1) Pages: 32-33

  • [Presentation] 利用物に関する知識のコーパスアノテーション2016

    • Author(s)
      上村 明衣, 折田 奈甫, 岡崎 直観, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 画像説明文生成に向けた物体間の関係の認識2016

    • Author(s)
      村岡 雅康, Sumit Maharjan, 齋藤 真樹, 山口 光太, 岡崎 直観, 岡谷 貴之, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 日本語Wikificationコーパスの構築に向けて2016

    • Author(s)
      Davaajav Jargalsaikhan, 岡崎 直観, 松田 耕史, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] Wikipedia記事に対する拡張固有表現ラベルの多重付与2016

    • Author(s)
      鈴木 正敏, 松田 耕史, 関根 聡, 岡崎 直観, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 分散表現による文脈情報を用いた選択選好モデル2016

    • Author(s)
      大野 雅之, 井之上 直也, 松林 優一郎, 岡崎 直観, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 感情状態に基づく因果関係推論の一般化2016

    • Author(s)
      井之上 直也, 岡崎 直観, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 談話内における局所文脈の動的分散表現2016

    • Author(s)
      小林 颯介, 田 然, 岡崎 直観, 乾 健太郎
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 研究室における研究・実装ノウハウの共有2016

    • Author(s)
      岡崎 直観
    • Organizer
      言語処理学会第22回年次大会ワークショップ「論文に書かない(書けない)自然言語処理」
    • Place of Presentation
      仙台市
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 分散表現に基づく選択選好モデルの文脈化2016

    • Author(s)
      大野 雅之, 井之上 直也, 松林 優一郎, 岡崎 直観, 乾 健太郎
    • Organizer
      情報処理学会研究報告 自然言語処理(NL)
    • Place of Presentation
      株式会社ミクシィ
    • Year and Date
      2016-01-22
  • [Presentation] 単語・句の分散表現の学習2015

    • Author(s)
      岡崎 直観
    • Organizer
      WebDB Forum 2015 特別セッション3: Deep Learningと自然言語処理
    • Place of Presentation
      芝浦工業大学
    • Year and Date
      2015-11-24 – 2015-11-25
    • Invited
  • [Presentation] Reducing Lexical Features in Parsing by Word Embeddings2015

    • Author(s)
      Hiroya Komatsu, Ran Tian, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation (PACLIC 29)
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2015-10-28 – 2015-10-30
    • Int'l Joint Research
  • [Presentation] Fast and Large-scale Unsupervised Relation Extraction2015

    • Author(s)
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation (PACLIC 29)
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2015-10-28 – 2015-10-30
    • Int'l Joint Research
  • [Presentation] 単語の分散表現と構成性の計算モデルの発展2015

    • Author(s)
      岡崎 直観
    • Organizer
      2015年度人工知能学会全国大会(第29回), OS-1 意味と理解のコンピューティング (2)
    • Place of Presentation
      はこだて未来大学
    • Year and Date
      2015-05-30 – 2015-06-02
    • Invited

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi