• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Research-status Report

語彙データベースと大規模コーパスに基づく意味クラス推定器の開発

Research Project

Project/Area Number 23700159
Research InstitutionTohoku University

Principal Investigator

岡崎 直観  東北大学, 情報科学研究科, 准教授 (50601118)

Keywords固有表現抽出 / 情報抽出 / 自然言語処理 / 機械学習
Research Abstract

平成24年度は「意味クラス推定器の性能の評価」のを進めた.評価対象のドメインとして,日本栄養士会が東日本大震災時に支援活動を行った際の報告書(自由記述)を採用し,そのテキストに意味クラスを手作業で付与した.意味クラスとしては,①他団体との連携,②管理栄養士・栄養士の本務としてのサービス(栄養相談など)提供,③栄養指導・支援,④事務処理,⑤支援物資・提供者,⑥活動場所(避難所,自宅,仮設住宅など)を採用した.本研究プロジェクトで開発した手法を用い,意味クラス推定器を構築したところ,推定精度は約7割であった.低コストで意味クラス推定器が構築できたことから,新しいドメインのテキストや新しい実体・概念に対して,本プロジェクトで研究を進めた手法が有効的であることが実証できた.
さらに,意味クラス推定器の性能向上に関しても研究を進めた.意味クラス推定器の性能が向上させるには,認識したい意味クラスの表現事例を大量に集めた辞書を構築し,現在解析している表現がその辞書に含まれるかどうかを考慮することが効果的であると知られている.この特徴は,本研究で構築されている意味クラス推定器にも採用されているが,本研究で構築した意味クラス推定器のエラーを解析していたところ,単語の文脈の情報を増強することで提案手法の性能を改善できる可能性が判明した.意味クラス推定器の研究は20年近くの歴史があり,研究コミュニティでは性能の改善が頭打ちになってきている状況であったため,新しいアイディアを発見した意義は大きかった.そこで,研究計画を変更し,平成24年度の後半に新しいアイディアに基づく手法の開発を行い,実験結果の解析を行うことにした.その手法を論文にまとめ,PAKDD 2013というデータマイニングと知識処理に関する国際会議に投稿したところ,受理された.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本研究の目的は,テキストから特定の意味クラスに属する概念・実体の表現(例えば製品名や病名など)を抽出するプログラム(意味クラス推定器)を,低コストで開発することである.この目的の達成のため,①意味クラスが付与された訓練データの自動獲得,②自動獲得された訓練データからの意味クラス推定器の構築,③意味クラス推定器の性能評価,の3つの研究項目を設定していた.
平成24年度は,3つの研究項目のうち,項目③の研究を進めた.日本栄養士会が東日本大震災時に支援活動を行った際の報告書(自由記述)に対し,本研究プロジェクトで開発した手法を用いたところ,低コストで意味クラス推定器が構築できることを実証できた.また,意味クラス推定器の性能改善に関する研究も進め,新しい手法を開発し,その手法をまとめた論文が国際会議に受理された.国際会議の開催時期の関係で,研究期間を1年間延長することにしたが,昨年度は当初の計画以上に研究が進行したと考えている.

Strategy for Future Research Activity

平成24年度までに本プロジェクトの成果は出揃ったが,論文を投稿した国際会議の開催時期(平成25年4月)を考慮し,研究期間を1年間延長した.平成25年度は,これまでに出た研究成果をジャーナル論文としてまとめる.さらに,構築した意味クラス推定器をオープンソースソフトウェアやデモンストレーション・システムの開発を進め、研究成果を他の研究者がすぐに利用できる形で還元する.

Expenditure Plans for the Next FY Research Funding

平成25年度に繰り越した予算は,研究成果を国際会議で発表するための費用(旅費など),ジャーナル論文としてまとめる際の費用(論文校正費用など),成果物をソフトウェアにまとめるための費用(人件費・物品費)として使用する予定である.

  • Research Products

    (15 results)

All 2013 2012 Other

All Journal Article (4 results) (of which Peer Reviewed: 3 results) Presentation (11 results)

  • [Journal Article] Learning Abbreviations from Chinese and English Terms by Modeling Non-local Information2013

    • Author(s)
      Xu Sun, Naoaki Okazaki, Junichi Tsujii, Houfeng Wang
    • Journal Title

      ACM Transactions on Asian Language Information Processing

      Volume: Vol.12, No.2 Pages: 5:1-5:17

    • DOI

      10.1145/2461316.2461317

    • Peer Reviewed
  • [Journal Article] A preference learning approach to sentence ordering for multi-document summarization2012

    • Author(s)
      Danushka Bollegala, Naoaki Okazaki, Mitsuru Ishizuka
    • Journal Title

      Information Sciences

      Volume: 217 Pages: 78-95

    • DOI

      10.1016/j.ins.2012.06.015

    • Peer Reviewed
  • [Journal Article] Leveraging Diverse Lexical Resources for Textual Entailment Recognition2012

    • Author(s)
      Yotaro Watanabe, Junta Mizuno, Eric Nichols, Katsuma Narisawa, Keita Nabeshima, Naoaki Okazaki, Kentaro Inui
    • Journal Title

      ACM Transactions on Asian Language Information Processing

      Volume: 11 Pages: 18:1-18:22

    • DOI

      10.1145/2382593.2382600

    • Peer Reviewed
  • [Journal Article] 言語処理による分析 ― 日本栄養士会活動報告の分析2012

    • Author(s)
      岡崎直観, 鍋島啓太, 乾健太郎
    • Journal Title

      日本栄養士会雑誌

      Volume: 55 Pages: 6-8

  • [Presentation] Inducing Context Gazetteers from Encyclopedic Database for Named Entity Recognition

    • Author(s)
      Han-Cheol Cho, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013)
    • Place of Presentation
      Gold Coast, Australia
  • [Presentation] Evidence in Automatic Error Correction Improves Learners’ English Skill

    • Author(s)
      Jiro Umezawa, Junta Mizuno, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013)
    • Place of Presentation
      Samos, Greece
  • [Presentation] Discriminative Learning of First-order Weighted Abduction from Partial Discourse Explanations

    • Author(s)
      Kazeto Yamamoto, Naoya Inoue, Yotaro Watanabe, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013)
    • Place of Presentation
      Samos, Greece
  • [Presentation] Acquiring and Generalizing Causal Inference Rules from Deverbal Noun Constructions

    • Author(s)
      Shohei Tanaka, Naoaki Okazaki, Mitsuru Ishizuka. Acquiring and Generalizing Causal Inference Rules from Deverbal Noun Constructions
    • Organizer
      Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012)
    • Place of Presentation
      Mumbai, India
  • [Presentation] A Latent Discriminative Model for Compositional Entailment Relation Recognition Using Natural Logic

    • Author(s)
      Yotaro Watanabe, Junta Mizuno, Eric Nichols, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012)
    • Place of Presentation
      Mumbai, India
  • [Presentation] Set Expansion using Sibling Relations between Semantic Categories

    • Author(s)
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • Organizer
      Proceedings of the 26th Pacific Asia Conference on Language,Information and Computation (PACLIC 26)
    • Place of Presentation
      Bali, Indonesia
  • [Presentation] Exploiting Dependency Context Gazetteers for Named Entity Recognition

    • Author(s)
      Han-Cheol Cho, Naoaki Okazaki, Kentaro Inui
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋
  • [Presentation] ソーシャルメディア上の発言とユーザー間の関係を利用した批判的ユーザーの抽出

    • Author(s)
      高瀬翔, 村上明子, 榎美紀, 岡崎直観, 乾健太郎
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋
  • [Presentation] 数量の大小の自動判定:「彼は身長が2mある」は高いか低いか

    • Author(s)
      成澤克麻, 渡邉陽太郎, 水野淳太, 岡崎直観, 乾健太郎
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋
  • [Presentation] マイクロブログユーザからの現地被災者抽出の技術的支援

    • Author(s)
      水野淳太, 岡崎直観, 乾健太郎
    • Organizer
      情報処理学会第75回全国大会
    • Place of Presentation
      仙台
  • [Presentation] Online Large-margin Weight Learning for First-order Logic-based Abduction

    • Author(s)
      Naoya Inoue, Kazeto Yamamoto, Yotaro Watanabe, Naoaki Okazaki, Kentaro Inui
    • Organizer
      第15回情報論的学習理論ワークショップ (IBISML)
    • Place of Presentation
      筑波大学東京キャンパス文京校舎

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi