• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

数式を含む文書の検索・利用基盤の構築に関する研究

Research Project

Project/Area Number 21650023
Research Category

Grant-in-Aid for Challenging Exploratory Research

Allocation TypeSingle-year Grants
Research Field Media informatics/Database
Research InstitutionNational Institute of Informatics

Principal Investigator

相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)

Project Period (FY) 2009 – 2011
Project Status Completed (Fiscal Year 2010)
Budget Amount *help
¥3,100,000 (Direct Cost: ¥3,100,000)
Fiscal Year 2010: ¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 2009: ¥1,500,000 (Direct Cost: ¥1,500,000)
Keywords数式検索 / XML / 情報検索 / 関係抽出 / 情報抽出
Research Abstract

本研究では、科学や教育のための数学知識共有基盤の構築を目的としている。具体的には、数式の構造を解析し、さらに数式と説明テキストを対応づけることにより、現在の検索エンジンでは限定的な扱いしかできない数式の高度な検索機能の実現を目指すものである。
研究期間では、(1)MathMLやlatexなどの標準形式で表現された数式の検索、(2)数式の近くにある説明文の解析、(3)両者の活用による数式意味のコンピュータによる理解、の3つの要素技術を中心に、数式の異なる利用環境にあわせて、以下の2通りのアプローチによる研究開発を行った。
第1は、数式を含む文書の理解支援環境の構築である。論文誌に掲載された科学技術論文を解析して、数式で使われている変数や関数の名前を抽出する手法を提案するとともに、数式の木構造に基づく類似数式検索を実現した。これに基づき、数式ごとに変数や関数の名前一覧を提示したり、他論文や外部の数式データベース上の類似数式を提示したりするシステムを開発した。情報処理分野の104論文を対象に変数・関数名抽出および数式検索の性能評価を行い、実際に支援環境を構築して理解支援における有用性を調べた。
第2は、拡張キーワードを用いた数式検索機能の強化である。索引対象となる数式と同一段落にある説明文から、その数式を参照する名前や記述を抽出することで、通常の検索エンジンによる数式の検索機能を高める手法を提案し、wikipediaの数学カテゴリ文書に含まれるlatex形式の数式を用いて実験による評価を行った。
以上に基づき本研究では、数式と周辺の説明テキストを組み合わせてアクセス支援に用いる枠組みを新たに提案し、有用性を示した。実験で作成したアノテーションや評価用データについては、今後整備して公開する予定である。

Report

(2 results)
  • 2010 Annual Research Report
  • 2009 Annual Research Report
  • Research Products

    (11 results)

All 2011 2010 2009

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (9 results)

  • [Journal Article] An Approach to Similarity Search for Mathematical Expressions using MathML2009

    • Author(s)
      Keisuke Yokoi, Akiko Aizawa
    • Journal Title

      2nd workshop Towards a Digital Mathematics Library(DML 2009)

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Enhancing mathematical search with names of formulas2009

    • Author(s)
      Minh Nghiem, Keisuke Yokoi, Akiko Aizawa
    • Journal Title

      The Workshop on E-Inclusion in Mathematics and Sciennce 2009(WEIMS'09)

      Pages: 22-25

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Presentation] 数式検索のための数式周辺テキストの言語解析手法2011

    • Author(s)
      横井啓介, Minh-Quoc Nghiem, 松林優一郎, 相澤彰子
    • Organizer
      言語処理学会第17回年次大会
    • Place of Presentation
      豊橋技術科学大学(愛知)
    • Year and Date
      2011-03-09
    • Related Report
      2010 Annual Research Report
  • [Presentation] 数式構造と周辺テキストの両面を考慮した数式情報抽出2011

    • Author(s)
      横井啓介, Minh-Quoc Nghiem, 松林優一郎, 相澤彰子
    • Organizer
      情報処理学会第51回全国大会
    • Place of Presentation
      東工大(東京)
    • Year and Date
      2011-03-03
    • Related Report
      2010 Annual Research Report
  • [Presentation] 意味と構造を考慮した数式検索手法の提案2011

    • Author(s)
      横井啓介, Minh-Quoc Nghiem, 松林優一郎, 相澤彰子
    • Organizer
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011)
    • Place of Presentation
      修善寺(静岡)
    • Year and Date
      2011-02-27
    • Related Report
      2010 Annual Research Report
  • [Presentation] Contextual Analysis of Mathematical Expressions for Advanced Mathematical Search2011

    • Author(s)
      Keisuke Yokoi, Minh-Quoc Nghiem, Yuichiroh Matsubayashi, Akiko Aizawa
    • Organizer
      12th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing2011)
    • Place of Presentation
      早稲田大学(東京)
    • Year and Date
      2011-02-21
    • Related Report
      2010 Annual Research Report
  • [Presentation] 数式とその周辺情報を利用した数式概念検索の実現2010

    • Author(s)
      横井啓介, Minh-Quoc Nghiem, 松林優一郎, 相澤彰子
    • Organizer
      第9回情報科学技術フォーラム(FIT2010)
    • Place of Presentation
      九州大学(福岡)
    • Year and Date
      2010-09-07
    • Related Report
      2010 Annual Research Report
  • [Presentation] Mining Coreference Relations between Formulas and Text using Wikipedia2010

    • Author(s)
      Minh Nghiem, 横井啓介, 松林優一郎, 相澤彰子
    • Organizer
      The Second International Workshop on NLP Challenges in the Information Explosion Era (NLPIX 2010)
    • Place of Presentation
      北京(中国)
    • Year and Date
      2010-08-22
    • Related Report
      2010 Annual Research Report
  • [Presentation] 数学概念検索のための情報抽出手法に関する検討2010

    • Author(s)
      横井啓介, NGHIEM Minh, 相澤彰子
    • Organizer
      情報処理学会創立50周年記念全国大会
    • Place of Presentation
      東京大学(東京)
    • Year and Date
      2010-03-08
    • Related Report
      2009 Annual Research Report
  • [Presentation] デジタルライブラリーにおける類似数式検索2009

    • Author(s)
      横井啓介, 相澤彰子
    • Organizer
      RIMS研究集会「数学におけるデジタルライブラリー構築へむけて」
    • Place of Presentation
      京都大学(日本)
    • Year and Date
      2009-09-09
    • Related Report
      2009 Annual Research Report
  • [Presentation] MathML木構造を考慮した類似数式検索手法の提案2009

    • Author(s)
      横井啓介, 相澤彰子
    • Organizer
      第8回情報科学技術フォーラム(FIT2009)
    • Place of Presentation
      東北大学(仙台)
    • Year and Date
      2009-09-03
    • Related Report
      2009 Annual Research Report

URL: 

Published: 2009-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi