• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

大規模日本語・英語文書データに対する概念検索と検索結果の可視化手法の研究

Research Project

Project/Area Number 16500057
Research InstitutionToyohashi University of Technology

Principal Investigator

青野 雅樹  豊橋技術科学大学, 工学部, 教授 (00372540)

Keywords概念検索 / クラスタリング / オントロジー / 次元削減 / ベクトル空間モデル / 情報可視化
Research Abstract

昨年度では、大規模データとして、特許データ(350万件)のほかに、Web上のニュース記事を概念検索の対象に含めたが、最終年度である今年度は研究課題にもある英語のデータとして、共有する概念の体系化として普及が期待されているOWL(Web Ontology Language)を使った英語での文書データ処理、概念処理を行った。また、日本語特許データに関しては、引き続き、NTCIR-6タスクに参加し、平成18年未にしめきられたフォーマル・ランに大学としては唯一参加し続けている。NTCIR-6プロジェクト(国立情報学研究所主催)に関しては、平成19年5月に学会発表(英語)の予定である。以下、本期間に行った細目に関して代表的なものを列挙する。
(1)特許データの概念検索:NTCIト6特許タスクの中で、真に大規模なデータ(350万件の特許文書)で動作する実用的な概念検索技術として「スケーラブルLSI(Latent Semantic Indexing)」手法を開発し、システム実装を行った。本手法の結果は、NTCIR-6(平成19年5月国立情報学研究所で開催予定)で発表予定であり、既に英語での論文を提出している。
(2)オントロジー・アラインメントの研究:概念データの間に関係をWWWコンソーシアムで標準化されているOWL(WebOntology Language)で記述し、2つの類似するオントロジーがOWLで与えられたとき、その間のアラインメント(整合)を自動解決するアルゴリズムを開発し、それを論じた論文が国際会議で採択され発表した。このアルゴリズムを改良し、大規模な実用的な概念オントロジーで動作するアルゴリズムも新たに開発した。このアライインメントが大規模データでも動作することで、概念的に類似するデータがOWLで与えられた場合も検索という応用に利用できるという意味で、大きな成果を得た。
(3)テキストデータの可視化、検索結果の可視化研究:大規模テキストデータを効果的に可視化するために、多次元空間の3次元空間への写像による可視化表現を開発し、更にこれをクラスターの探索に利用する技術を言及したものを国際論文誌に投稿していたが、採択され掲載された。また、テキスト中に現れる地名、数値データを効果的に可視化する手法を開発した。数値データの可視化は、国立情報学研究所(NII)で開始されたパイロットタスクである「動向情報の要約と可視化ワークショッブ」で発表した。更に、検索キーワード(クエリ)を入力して得られた大量の検索結果に、階層的なクラスタリングを施して、効果的にグループ化して表示する手法を開発した。これらは現在、研究室のWebページで公開申であり、論文投稿の準備中である。

  • Research Products

    (6 results)

All 2007 2006

All Journal Article (6 results)

  • [Journal Article] Web上のニュース記事視覚化のための地名抽出手法2007

    • Author(s)
      石田大和, 青野雅樹
    • Journal Title

      電子情報通信学会・東海支部・Web公開 http://www.takagi.i.is.nagoya-u.ac.jp/ieice

      Pages: 1

  • [Journal Article] Time Series Data Mining for Multimodal Bio-Signal Data2006

    • Author(s)
      Masaki Aono, Y.Sekiguchi, et al.
    • Journal Title

      International Journal of Computer Science and Network Security Vol6, No. 10

      Pages: 1-9

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] A Method of Rating the Credibility of News Documents on the Web2006

    • Author(s)
      Ryosuke Nagura, Y.Seki, Masaki Aono
    • Journal Title

      Proc. ACM SIGIR (Special Interest Group on Information Retrieval) Vol. 29

      Pages: 683-684

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 多重フーリエスペクトル表現に基づく3次元モデルの形状類似検索2006

    • Author(s)
      立間淳司, 関洋平, 青野雅樹
    • Journal Title

      電子情報通信学会、Webインテリジェンスとインタラクション、IEICE SIG Notes, WI2-2006-83

      Pages: 89-94

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Automatic Alignment of Ontology Eliminating the Probable Misalignments2006

    • Author(s)
      Hanif Seddiqui, Y.Seki, Masaki Aono
    • Journal Title

      The Semantic Web - ASWC 2006 (in a book 'Lecture Notes in Computer Science 4185' from Springer-Verlag

      Pages: 212-218

  • [Journal Article] Exploring Overlapping Clusters using Dynamic Rescaling and Sampling2006

    • Author(s)
      Mei Kobayashi, Masaki Aono
    • Journal Title

      Knowledge and Information Systems (Springer-Verlag) Vol. 10, No. 3

      Pages: 295-313

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi