• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

数式を含む文書の検索・利用基盤の構築に関する研究

研究課題

研究課題/領域番号 21650023
研究機関国立情報学研究所

研究代表者

相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)

キーワード数式検索 / XML / 情報検索 / 関係抽出 / 情報抽出
研究概要

本研究では、科学や教育のための数学知識共有基盤の構築手法を検討する。具体的には、数式の構造を解析し、さらに数式と説明テキストを対応づけることにより、現在の検索エンジンでは限定的な扱いしかできない数式の高度な検索機能の実現を目指す。
数式を中心とした知識基盤の構築に関する研究は過去にあまり行われていないことから、初年度は、研究基盤となるデータの収集と整備を中心に検討を進めた。ここで、数式の検索法としては、XML形式で表現された数式木構造の類似度を計算する方法と、数式をキーワードに対応付けて類似度を計算する方法の2通りが考えられる。各々について独立に検討を進めるため、以下の2つのデータセットについて研究を進めた。
第1は、論文誌に掲載された科学技術論文(情報処理学会論文誌)であり、サンプリングした104論文について、PDF形式で表現された文書を専用ソフトおよび人手により変換し、MathML/Content Markupと呼ばれる形式にしたがって、数式の意味構造を記述した。また、木構造マッチングに基づく数式の類似度の計算法を提案し、数式検索システムのプロトタイプを試作した。
第2は、wikipediaの数学カテゴリ文書である。各数式に対して付与されたlatex形式の記述を抽出し、数学記号をキーワードに変換する対応表を適用してキーワードベクトルを生成することで、既存の検索方式の適用を可能にして課題を整理した。
以上により、各方式を用いた数式の検索法の提案とベースラインとなる検索システムの試作を行った。現在、数式周辺の自然言語テキストから関連情報を抽出する手法、および評価用データの作成法について検討しており、次年度も継続して研究を進める予定である。

  • 研究成果

    (5件)

すべて 2010 2009

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件)

  • [雑誌論文] An Approach to Similarity Search for Mathematical Expressions using MathML2009

    • 著者名/発表者名
      Keisuke Yokoi, Akiko Aizawa
    • 雑誌名

      2nd workshop Towards a Digital Mathematics Library(DML 2009)

    • 査読あり
  • [雑誌論文] Enhancing mathematical search with names of formulas2009

    • 著者名/発表者名
      Minh Nghiem, Keisuke Yokoi, Akiko Aizawa
    • 雑誌名

      The Workshop on E-Inclusion in Mathematics and Sciennce 2009(WEIMS'09)

      ページ: 22-25

    • 査読あり
  • [学会発表] 数学概念検索のための情報抽出手法に関する検討2010

    • 著者名/発表者名
      横井啓介, NGHIEM Minh, 相澤彰子
    • 学会等名
      情報処理学会創立50周年記念全国大会
    • 発表場所
      東京大学(東京)
    • 年月日
      2010-03-08
  • [学会発表] デジタルライブラリーにおける類似数式検索2009

    • 著者名/発表者名
      横井啓介, 相澤彰子
    • 学会等名
      RIMS研究集会「数学におけるデジタルライブラリー構築へむけて」
    • 発表場所
      京都大学(日本)
    • 年月日
      2009-09-09
  • [学会発表] MathML木構造を考慮した類似数式検索手法の提案2009

    • 著者名/発表者名
      横井啓介, 相澤彰子
    • 学会等名
      第8回情報科学技術フォーラム(FIT2009)
    • 発表場所
      東北大学(仙台)
    • 年月日
      2009-09-03

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi