• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

語彙データベースと大規模コーパスに基づく意味クラス推定器の開発

研究課題

研究課題/領域番号 23700159
研究機関東北大学

研究代表者

岡崎 直観  東北大学, 情報科学研究科, 准教授 (50601118)

キーワード固有表現抽出 / 情報抽出 / 自然言語処理 / 機械学習
研究概要

平成24年度は「意味クラス推定器の性能の評価」のを進めた.評価対象のドメインとして,日本栄養士会が東日本大震災時に支援活動を行った際の報告書(自由記述)を採用し,そのテキストに意味クラスを手作業で付与した.意味クラスとしては,①他団体との連携,②管理栄養士・栄養士の本務としてのサービス(栄養相談など)提供,③栄養指導・支援,④事務処理,⑤支援物資・提供者,⑥活動場所(避難所,自宅,仮設住宅など)を採用した.本研究プロジェクトで開発した手法を用い,意味クラス推定器を構築したところ,推定精度は約7割であった.低コストで意味クラス推定器が構築できたことから,新しいドメインのテキストや新しい実体・概念に対して,本プロジェクトで研究を進めた手法が有効的であることが実証できた.
さらに,意味クラス推定器の性能向上に関しても研究を進めた.意味クラス推定器の性能が向上させるには,認識したい意味クラスの表現事例を大量に集めた辞書を構築し,現在解析している表現がその辞書に含まれるかどうかを考慮することが効果的であると知られている.この特徴は,本研究で構築されている意味クラス推定器にも採用されているが,本研究で構築した意味クラス推定器のエラーを解析していたところ,単語の文脈の情報を増強することで提案手法の性能を改善できる可能性が判明した.意味クラス推定器の研究は20年近くの歴史があり,研究コミュニティでは性能の改善が頭打ちになってきている状況であったため,新しいアイディアを発見した意義は大きかった.そこで,研究計画を変更し,平成24年度の後半に新しいアイディアに基づく手法の開発を行い,実験結果の解析を行うことにした.その手法を論文にまとめ,PAKDD 2013というデータマイニングと知識処理に関する国際会議に投稿したところ,受理された.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究の目的は,テキストから特定の意味クラスに属する概念・実体の表現(例えば製品名や病名など)を抽出するプログラム(意味クラス推定器)を,低コストで開発することである.この目的の達成のため,①意味クラスが付与された訓練データの自動獲得,②自動獲得された訓練データからの意味クラス推定器の構築,③意味クラス推定器の性能評価,の3つの研究項目を設定していた.
平成24年度は,3つの研究項目のうち,項目③の研究を進めた.日本栄養士会が東日本大震災時に支援活動を行った際の報告書(自由記述)に対し,本研究プロジェクトで開発した手法を用いたところ,低コストで意味クラス推定器が構築できることを実証できた.また,意味クラス推定器の性能改善に関する研究も進め,新しい手法を開発し,その手法をまとめた論文が国際会議に受理された.国際会議の開催時期の関係で,研究期間を1年間延長することにしたが,昨年度は当初の計画以上に研究が進行したと考えている.

今後の研究の推進方策

平成24年度までに本プロジェクトの成果は出揃ったが,論文を投稿した国際会議の開催時期(平成25年4月)を考慮し,研究期間を1年間延長した.平成25年度は,これまでに出た研究成果をジャーナル論文としてまとめる.さらに,構築した意味クラス推定器をオープンソースソフトウェアやデモンストレーション・システムの開発を進め、研究成果を他の研究者がすぐに利用できる形で還元する.

次年度の研究費の使用計画

平成25年度に繰り越した予算は,研究成果を国際会議で発表するための費用(旅費など),ジャーナル論文としてまとめる際の費用(論文校正費用など),成果物をソフトウェアにまとめるための費用(人件費・物品費)として使用する予定である.

  • 研究成果

    (15件)

すべて 2013 2012 その他

すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (11件)

  • [雑誌論文] Learning Abbreviations from Chinese and English Terms by Modeling Non-local Information2013

    • 著者名/発表者名
      Xu Sun, Naoaki Okazaki, Junichi Tsujii, Houfeng Wang
    • 雑誌名

      ACM Transactions on Asian Language Information Processing

      巻: Vol.12, No.2 ページ: 5:1-5:17

    • DOI

      10.1145/2461316.2461317

    • 査読あり
  • [雑誌論文] A preference learning approach to sentence ordering for multi-document summarization2012

    • 著者名/発表者名
      Danushka Bollegala, Naoaki Okazaki, Mitsuru Ishizuka
    • 雑誌名

      Information Sciences

      巻: 217 ページ: 78-95

    • DOI

      10.1016/j.ins.2012.06.015

    • 査読あり
  • [雑誌論文] Leveraging Diverse Lexical Resources for Textual Entailment Recognition2012

    • 著者名/発表者名
      Yotaro Watanabe, Junta Mizuno, Eric Nichols, Katsuma Narisawa, Keita Nabeshima, Naoaki Okazaki, Kentaro Inui
    • 雑誌名

      ACM Transactions on Asian Language Information Processing

      巻: 11 ページ: 18:1-18:22

    • DOI

      10.1145/2382593.2382600

    • 査読あり
  • [雑誌論文] 言語処理による分析 ― 日本栄養士会活動報告の分析2012

    • 著者名/発表者名
      岡崎直観, 鍋島啓太, 乾健太郎
    • 雑誌名

      日本栄養士会雑誌

      巻: 55 ページ: 6-8

  • [学会発表] Inducing Context Gazetteers from Encyclopedic Database for Named Entity Recognition

    • 著者名/発表者名
      Han-Cheol Cho, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013)
    • 発表場所
      Gold Coast, Australia
  • [学会発表] Evidence in Automatic Error Correction Improves Learners’ English Skill

    • 著者名/発表者名
      Jiro Umezawa, Junta Mizuno, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013)
    • 発表場所
      Samos, Greece
  • [学会発表] Discriminative Learning of First-order Weighted Abduction from Partial Discourse Explanations

    • 著者名/発表者名
      Kazeto Yamamoto, Naoya Inoue, Yotaro Watanabe, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013)
    • 発表場所
      Samos, Greece
  • [学会発表] Acquiring and Generalizing Causal Inference Rules from Deverbal Noun Constructions

    • 著者名/発表者名
      Shohei Tanaka, Naoaki Okazaki, Mitsuru Ishizuka. Acquiring and Generalizing Causal Inference Rules from Deverbal Noun Constructions
    • 学会等名
      Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012)
    • 発表場所
      Mumbai, India
  • [学会発表] A Latent Discriminative Model for Compositional Entailment Relation Recognition Using Natural Logic

    • 著者名/発表者名
      Yotaro Watanabe, Junta Mizuno, Eric Nichols, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012)
    • 発表場所
      Mumbai, India
  • [学会発表] Set Expansion using Sibling Relations between Semantic Categories

    • 著者名/発表者名
      Sho Takase, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      Proceedings of the 26th Pacific Asia Conference on Language,Information and Computation (PACLIC 26)
    • 発表場所
      Bali, Indonesia
  • [学会発表] Exploiting Dependency Context Gazetteers for Named Entity Recognition

    • 著者名/発表者名
      Han-Cheol Cho, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      言語処理学会第19回年次大会
    • 発表場所
      名古屋
  • [学会発表] ソーシャルメディア上の発言とユーザー間の関係を利用した批判的ユーザーの抽出

    • 著者名/発表者名
      高瀬翔, 村上明子, 榎美紀, 岡崎直観, 乾健太郎
    • 学会等名
      言語処理学会第19回年次大会
    • 発表場所
      名古屋
  • [学会発表] 数量の大小の自動判定:「彼は身長が2mある」は高いか低いか

    • 著者名/発表者名
      成澤克麻, 渡邉陽太郎, 水野淳太, 岡崎直観, 乾健太郎
    • 学会等名
      言語処理学会第19回年次大会
    • 発表場所
      名古屋
  • [学会発表] マイクロブログユーザからの現地被災者抽出の技術的支援

    • 著者名/発表者名
      水野淳太, 岡崎直観, 乾健太郎
    • 学会等名
      情報処理学会第75回全国大会
    • 発表場所
      仙台
  • [学会発表] Online Large-margin Weight Learning for First-order Logic-based Abduction

    • 著者名/発表者名
      Naoya Inoue, Kazeto Yamamoto, Yotaro Watanabe, Naoaki Okazaki, Kentaro Inui
    • 学会等名
      第15回情報論的学習理論ワークショップ (IBISML)
    • 発表場所
      筑波大学東京キャンパス文京校舎

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi