• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模日本語・英語文書データに対する概念検索と検索結果の可視化手法の研究

研究課題

研究課題/領域番号 16500057
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 メディア情報学・データベース
研究機関豊橋技術科学大学

研究代表者

青野 雅樹  豊橋技術科学大学, 工学部, 教授 (00372540)

研究期間 (年度) 2004 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
3,600千円 (直接経費: 3,600千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
2004年度: 1,400千円 (直接経費: 1,400千円)
キーワード概念検索 / クラスタリング / オントロジー / 次元削減 / ベクトル空間モデル / 情報可視化 / 検索質問拡張
研究概要

本研究期間内の3年間で、大規模データに対する概念検索とその視覚化の研究を中心に行ってきた。大規模データとしては、350万件の特許データのほかに、LATimesニュース記事データ(英語)、毎日新聞、およびWeb上のニュース記事等を収集し、本研究の対象データとして扱った。研究の中心は、パターンが完全一致するデータの検索ではなく、概念的・意味的に類似したデータを検索できる基礎・応用技術の研究を行ってきた。
本研究のコア技術として、単語と文書の共起度の高いものをクラスタリングで前処理する「共クラスタリング」と、「サンプリング粒度を段階的に変え、階層的なクラスターを作成する手法」とを統合した技術を開発・実装し、結果を国際・国内学会で発表した。クラスタリングの結果の可視化に関しても論文誌に投稿・採録された。この要素技術ではサンプリングを用いたため、マイナーなクラスターを見逃す問題点がある。研究期間の最終年度では、サンプリングを用いることなく、マイナーなクラスターを逃さない手法を開発した。具体的には、大規模データ全体を文書のオーバーラップを許して精緻にカテゴライズし、「潜在的意味インデキシング」(LSI法)と呼ばれる次元削減手法を各カテゴリに反復的に適用し階層型インデックスを作る技術を開発・実装した。検索の精度的には、最初に開発した「階層粒度クラスター」に基づく概念検索よりも2倍程度高い結果を得ることが出来た。
本研究テーマでは、大規模データのモデルとして、「ベクトル空間モデル」を採用したため、特徴量をベクトル化できるものであれば、日本語・英語の区別を意識することなく、また、文書データ以外のメディアデータにも適用できる。実際3次元形状のデータ・コレクションで概念検索(類似検索)が行えることを示し、世界最高レベルの検索性能を達成した。この検索エンジンは研究室のWebで一般に公開している。

報告書

(4件)
  • 2006 実績報告書   研究成果報告書概要
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (38件)

すべて 2007 2006 2005 2004

すべて 雑誌論文 (37件) 図書 (1件)

  • [雑誌論文] SBMサービスのユーザとタグの情報に着目したWebページ推薦システム2007

    • 著者名/発表者名
      杉山典之, 関洋平, 青野雅樹
    • 雑誌名

      情報処理学会第69回全国大会(早稲田大学) 4T-4

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Web書評を対象としたカテゴリー分析と読み手が受けた印象や感情の自動抽出2007

    • 著者名/発表者名
      佐々木若菜, 関洋平, 青野雅樹
    • 雑誌名

      言語処理学会第13回年次大会

      ページ: 408-411

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Web上のニユース記事視覚化のための地名抽出手法2007

    • 著者名/発表者名
      石田大和, 青野雅樹
    • 雑誌名

      電子情報通信学会・東海支部・Web公開http://www.takagi.i.is.nagoya-u.ac.jp/ieice/

      ページ: 1-1

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Web上のニュース記事視覚化のための地名抽出手法2007

    • 著者名/発表者名
      石田大和, 青野雅樹
    • 雑誌名

      電子情報通信学会・東海支部・Web公開 http://www.takagi.i.is.nagoya-u.ac.jp/ieice

      ページ: 1-1

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Time Series Data Mining for Multimodal Bio-Signal Data2006

    • 著者名/発表者名
      Masaki Aono, Y.Sekiguchi, et al.
    • 雑誌名

      International Journal of Computer Science and Network Security Vol6, No. 10

      ページ: 1-9

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 実績報告書 2006 研究成果報告書概要
  • [雑誌論文] Automatic Alignment of Ontology Eliminating the Probable Misalignments2006

    • 著者名/発表者名
      Hanif Seddiqui, Y.Seki, Masaki Aono
    • 雑誌名

      The Semantic Web-ASWC 2006 (in a book 'Lecture Notes in Computer Science 4185' from Springer-Verlag)

      ページ: 212-218

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] A Method of Rating the Credibility of News Documents on the Web2006

    • 著者名/発表者名
      Ryosuke Nagura, Y.Seki, Masaki Aono
    • 雑誌名

      Proc. ACM SIGIR (Special Interest Group on Information Retrieval) Vol. 29

      ページ: 683-684

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 実績報告書 2006 研究成果報告書概要
  • [雑誌論文] Exploring Overlapping Clusters using Dynamic Rescaling and Sampling2006

    • 著者名/発表者名
      Mei Kobayashi, Masaki Aono
    • 雑誌名

      Knowledge and Information Systems (Springer-Verlag) Vol.10, No.3

      ページ: 295-313

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 独立成分分析を用いた3次元モデルの類似検索2006

    • 著者名/発表者名
      立問淳司, 青野雅樹, 関洋平, 大渕竜太郎
    • 雑誌名

      情報処理学会第68回全国大会(工学院大学) 3M-5

    • NAID

      170000171427

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Alignment of Ontology Constructing Similarity Matrices and Resolving the Amount of the Matrices2006

    • 著者名/発表者名
      Hanif Seddiqui, Y.Seki, Masaki Aono
    • 雑誌名

      情報処理学会第68回全国大会(工学院大学) 4N-6

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Web上のニュース記事を対象とした信頼度の提案2006

    • 著者名/発表者名
      奈倉良介, 関洋平, 青野雅樹
    • 雑誌名

      情報処理学会第68回全国大会(工学院大学) 3P-5

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 生体情報の時系列マイニングの試み2006

    • 著者名/発表者名
      坂倉奨, 青野雅樹, 関洋平
    • 雑誌名

      情報処理学会第68回全国大会(工学院大学) 7P-2

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 多重フーリエスペクトル表現に基づく3次元モデルの形状類似検索2006

    • 著者名/発表者名
      立間淳司, 関洋平, 青野雅樹
    • 雑誌名

      電子情報通信学会、Webインテリジェンスとインタラクション、IEICE SIG Notes, WI2-2006-83

      ページ: 89-94

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 実績報告書 2006 研究成果報告書概要
  • [雑誌論文] Time Series Data Mining for Multimodal Bio-Signal Data2006

    • 著者名/発表者名
      Masaki Aono, Y.Sekiguchi, Y.Yasuda, N.Suzuki, Y.Seki
    • 雑誌名

      International Journal of Computer Science and Network Security Vol. 16,No.10

      ページ: 1-9

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Exploring overlapping clusters using dynamic re-scaling and sampling2006

    • 著者名/発表者名
      Mei Kobayashi, Masaki Aono
    • 雑誌名

      Knowledge and Information Systems Vol.10, No.3

      ページ: 295-313

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Automatic Alignment of Ontology Eliminating the Probable Misalignments2006

    • 著者名/発表者名
      Hanif Md.Seddiqui, Yohei Seki, Masaki Aono
    • 雑誌名

      The Semantic Web - ASWC 2006, Lecture Notes in Computer Science 4185(R. Mizoguchi et al. eds)(Springer)

      ページ: 212-218

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] A Method for Query Expansion Using a Hierarchy of Clusters2006

    • 著者名/発表者名
      Masaki Aono, Hironori Doi
    • 雑誌名

      Information Retrieval Technology, Lecture Notes in Computer Science 3689(Gary G. Lee, et al. eds.)(Springer)

      ページ: 479-483

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] Automatic Alignment of Ontology Eliminating the Probable Misalignments2006

    • 著者名/発表者名
      Hanif Seddiqui, Y.Seki, Masaki Aono
    • 雑誌名

      The Semantic Web - ASWC 2006 (in a book 'Lecture Notes in Computer Science 4185' from Springer-Verlag

      ページ: 212-218

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Exploring Overlapping Clusters using Dynamic Rescaling and Sampling2006

    • 著者名/発表者名
      Mei Kobayashi, Masaki Aono
    • 雑誌名

      Knowledge and Information Systems (Springer-Verlag) Vol. 10, No. 3

      ページ: 295-313

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 文書-単語双クラスタリングを用いた特許データの概念検索向上手法2005

    • 著者名/発表者名
      青野 雅樹, 土肥 広典
    • 雑誌名

      DEWS2005,第16回データ工学ワークショップ

      ページ: 8-8

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要 2004 実績報告書
  • [雑誌論文] RSSに基づく内容型情報推薦システムの提案2005

    • 著者名/発表者名
      向井誠, 青野雅樹
    • 雑誌名

      情報処理学会第67回全国大会(電通大学) 2U-8

    • NAID

      170000170447

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 個人の音楽嗜好データのOWLによる表現とその応用2005

    • 著者名/発表者名
      武内祐一, 青野雅樹
    • 雑誌名

      情報処理学会第67回全国大会(電通大学) 3U-8

    • NAID

      170000170455

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] DTDマッチングによる大学シラバスの相互変換2005

    • 著者名/発表者名
      平野健太郎, 青野雅樹
    • 雑誌名

      情報処理学会第67回全国大会(電通大学) 4W-5

    • NAID

      170000170477

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 双クラスタリングを用いた検索質問拡張手法2005

    • 著者名/発表者名
      土肥 広典, 青野 雅樹
    • 雑誌名

      電子情報通信学会、Webインテリジェンスとインタラクション、IEICE SIG Notes, WI2-2005-18

      ページ: 43-48

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] クラスタ粒度階層構造を用いたアウトライヤー文書の検出方法2005

    • 著者名/発表者名
      青野雅樹
    • 雑誌名

      信学技報 IEICE Technical Report DE2005-30 (2005-7)

      ページ: 1-6

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要 2005 実績報告書
  • [雑誌論文] OWLを用いた音楽嗜好データ表現と音楽情報推薦ヘの応用2005

    • 著者名/発表者名
      武内裕一, 青野雅樹
    • 雑誌名

      信学技報 IEICE Technical Report DE2005-66 (2005-7)

      ページ: 7-11

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] 情報系科目を用いたHTMLシラバスのXML変換と内容分析2005

    • 著者名/発表者名
      平野健太郎, 青野雅樹
    • 雑誌名

      電子情報通信学会、Webインテリジェンスとインタラクション、IEICE SIG Notes, WI2-2005-42

      ページ: 83-88

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] RSSに基づく個人向け内容型情報推薦プロトタイプシステム2005

    • 著者名/発表者名
      向井誠, 青野雅樹
    • 雑誌名

      自然言語処理・情報学基礎合同研究会会報、2005-NL-169

      ページ: 27-32

    • NAID

      110002952137

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要 2005 実績報告書
  • [雑誌論文] A Method for Query Expansion Using a Hierarchy of Clusters2005

    • 著者名/発表者名
      Nasaki Aono, Hironori Doi
    • 雑誌名

      AIRS 2005 (Asia Information Retrieval Symposium), in a book "Information Retrieval Technology", Lecture Notes in Computer Science 3689 (Gary G. Lee, et al. eds.) (Springer Verlag)

      ページ: 479-484

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] A Patent Retrieval Method Using a Hierarchy of Clusters at TUT2005

    • 著者名/発表者名
      Hironori Doi, Yohei Seki, Masaki Aono
    • 雑誌名

      Proceedings of the Fifth NTCIR Workshop

      ページ: 287-291

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要 2005 実績報告書
  • [雑誌論文] Webコミュニティマイニング2005

    • 著者名/発表者名
      青野 雅樹, 小林 メイ
    • 雑誌名

      応用数理(岩波書店) Vol. 15, No. 1

      ページ: 53-57

    • NAID

      110001888937

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [雑誌論文] OWLを用いた音楽嗜好データ表現と音楽情報推薦への応用2005

    • 著者名/発表者名
      武内裕一, 青野雅樹
    • 雑誌名

      信学技報 IEICE Technical Report DE2005-66 (2005-7)

      ページ: 7-11

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 情報系科目を用いたHTMLシラバスのXML変換と内容分析2005

    • 著者名/発表者名
      平野健太郎, 青野雅樹
    • 雑誌名

      第3回 WebインテリジェンスとインタラクションWI2-2005-42

      ページ: 83-88

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Method for Query Expansion Using a Hierarchy of Clusters2005

    • 著者名/発表者名
      Masaki Aono, Hironori Doi
    • 雑誌名

      AIRS 2005 (Asia Information Retrieval Symposium), in a book : Information Retrieval Technology, Lecture Notes in Computer Science 3689 (Gary G.Lee, et al. eds.)(Springer Verlag)

      ページ: 479-484

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 双クラスタリングを用いた検索質問拡張手法2005

    • 著者名/発表者名
      土肥 広典, 青野 雅樹
    • 雑誌名

      第2回 Webインテリジェンス研究会(電子情報通信学会)

      ページ: 43-48

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Webコミュニティマイニング2005

    • 著者名/発表者名
      青野 雅樹, 小林 メイ
    • 雑誌名

      応用数理 Vol.15, No.1

      ページ: 53-57

    • NAID

      110001888937

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Vector Space Models for Search and Cluster Mining2004

    • 著者名/発表者名
      Mei Kobayashi, Masaki Aono
    • 雑誌名

      Survey of Text Mining(Michael W. Berry ed.)(Springer)

      ページ: 103-122

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2006 研究成果報告書概要
  • [図書] Survey of Text Mining (Chapter 5)2004

    • 著者名/発表者名
      Mei Kobayashi, Masaki Aono
    • 出版者
      Springer-Verlag
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2006 研究成果報告書概要

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi