• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習手法による半構造データマイニングと情報抽出

研究課題

研究課題/領域番号 16016275
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関広島市立大学

研究代表者

宮原 哲浩  広島市立大学, 情報科学部, 助教授 (90209932)

研究分担者 内田 智之  広島市立大学, 情報科学部, 助教授 (70264934)
平田 耕一  九州工業大学, 情報工学部, 助教授 (20274558)
久保山 哲二  東京大学, 国際産学共同研究センター, 助手 (80302660)
研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
5,500千円 (直接経費: 5,500千円)
2005年度: 2,300千円 (直接経費: 2,300千円)
2004年度: 3,200千円 (直接経費: 3,200千円)
キーワード機械学習 / 半構造データマイニング / 情報抽出 / 木構造パターン / タグ木パターン
研究概要

本研究課題では,機械学習手法による半構造データマイニングと情報抽出について研究を行い,本年度は次の成果を得た.
Web空間の爆発的な発展に伴い,インターネット上の大規模分散コンテンツを流通・提供・活用するための手法やシステムの研究開発が求められている.機械学習技術を適用することは,人に優しい情報通信技術やフレンドリーな情報処理システムの開発に有効である.本研究課題では,HTML/XMLファイルなどのWeb文書が半構造性を持つことに注目し,機械学習技術を活用して,半構造データからのデータマイニング技術を発展させ,Webデータから有用なコンテンツを発見する手法,すなわち情報抽出技術を確立することを目的とする.
均質でない半構造文書からの情報抽出に応用するため,半構造文書に共通する構造的特徴を表現する木構造パターンである,高さ制約変数付きの極大頻出タグ木パターンを発見するアルゴリズムを与えた.電気図面などTTSPグラフでモデル化できる半構造データに共通する構造パターンを表現するTTSP項グラフを多項式時間で帰納推論する学習アルゴリズムを与えた.半構造データを効率よく比較・照合するための様々な手法を統一的に記述できる一般的なフレームワークを与え,従来知られていなかった編集距離に基づく木の近似照合クラス間の関係を明らかにした.複数の半構造データを統合するため,近似照合から2つの木を結合する効率的なアルゴリズムを提案した.半構造データのフィルタリングやクラスタリングを行うために,半構造データからの局所位相情報に基づく距離を考案し,これを高速に計算する手法を開発した.

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (18件)

すべて 2006 2005 2004

すべて 雑誌論文 (18件)

  • [雑誌論文] On Generalization and Subsumption for Ordered Clauses2006

    • 著者名/発表者名
      Megumi Kuwabara et al.
    • 雑誌名

      Proc.19th Annual Conferences of the Japanese Society for Artificial Intelligence, Lecture Notes in Artificial Intelligence

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Discovery o Maximally Frequent Tag Tree Patterns with Height-Constrained Variables from Semistructured Web Documents2005

    • 著者名/発表者名
      Yusuke Suzuki et al.
    • 雑誌名

      Proc.International Workshop on Challenges in Web Information Retrieval and Integration (WIRI 2005), IEEE Computer Society

      ページ: 104-112

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Polynomial Time Inductive Inference of TTSP Graph Languages from Positive Data2005

    • 著者名/発表者名
      Ryoji Takami et al.
    • 雑誌名

      Proc.ILP 2005, Lecture Notes in Artificial Intelligence (Springer-Verlag) 3625

      ページ: 366-383

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] The q-Gram Distance for Ordered Unlabeled Tree2005

    • 著者名/発表者名
      Nobuhito Ohkura et al.
    • 雑誌名

      Proc.DS 2005, Lecture Notes in Artificial Intelligence (Springer-Verlag) 3735

      ページ: 189-202

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] On Finding Acyclis Subhypergrahs2005

    • 著者名/発表者名
      Kouichi Hirata et al.
    • 雑誌名

      Proc.FCT 2005, Lecture Notes in Computer Science (Springer-Verlag) 3623

      ページ: 491-503

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Extraction of Frequent Few-Overlapped Monotone DNF Formulas with Depth-First Pruning2005

    • 著者名/発表者名
      Yoshikazu Shima et al.
    • 雑誌名

      Proc.PAKDD 2005, Lecture Notes in Artificial Intelligence (Springer-Verlag) 3518

      ページ: 50-60

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Disjunctive Rules Extracted from MRSA Data with Verification2005

    • 著者名/発表者名
      Kouichi Hirata et al.
    • 雑誌名

      Proc.1st International Conference on Complex Medical Engineering (CME 2005)

      ページ: 326-330

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Extracting Disjunctive Closed Rules from MRSA Data2005

    • 著者名/発表者名
      Yoshikazu Shima et al.
    • 雑誌名

      Proc.1st International Conference on Complex Medical Engineering (CME 2005)

      ページ: 321-325

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Theoretical Analysis of Tree Edit Distance Measures2005

    • 著者名/発表者名
      Tetsuji Kuboyama et al.
    • 雑誌名

      情報処理学会論文誌 数理モデル化と応用(TOM) Vol.46,No.SIG17

      ページ: 31-45

    • NAID

      130000058410

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Theoretical Analysis of Alignment and Edit Problems for Trees2005

    • 著者名/発表者名
      Tetsuji Kuboyama et al.
    • 雑誌名

      Proc.ICTCS 2005, Lecture Notes in Computer Science (Springer-Verlag) 3701

      ページ: 323-337

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Tractable and Intractable Second-Order Matching Problems2004

    • 著者名/発表者名
      Kouichi Hirata
    • 雑誌名

      Journal of Symbolic Computation Vol.37,No.5

      ページ: 611-628

    • NAID

      120002440590

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Discovery of Maximally Frequent Tag Tree Patterns with Contractible Variables from Semistructured Documents2004

    • 著者名/発表者名
      Tetsuhiro Miyahara
    • 雑誌名

      Proc.PAKDD 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3056

      ページ: 133-144

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Polynomial Time Inductive Inference of Ordered Tree Languages with Height-Constrained Variables from Positive Data2004

    • 著者名/発表者名
      Yusuke Suzuki
    • 雑誌名

      Proc.PRICAI 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3157

      ページ: 211-220

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Automatic Wrapper Generation for Metasearch using Ordered Tree Structured Patterns2004

    • 著者名/発表者名
      Kazuhide Aikou
    • 雑誌名

      Proc.AI 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3339

      ページ: 1030-1035

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Frequent Structural Features among Words in Tree-Structured Documents2004

    • 著者名/発表者名
      Tomoyuki Uchida
    • 雑誌名

      Proc.PAKDD 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3056

      ページ: 351-350

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Extracting Multiple Layers from Data Having Graph Structures2004

    • 著者名/発表者名
      Yuko Itokawa
    • 雑誌名

      Proc.2nd Asian Symposium on Geographic Information Systems from-Computer Science & Engineering View (ASGIS 2004)

      ページ: 283-291

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Generalization Algorithms for Second-Order Terms2004

    • 著者名/発表者名
      Kouichi Hirata
    • 雑誌名

      Proc.ILP 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3194

      ページ: 147-163

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Extracting Minimal and Closed Monotone DNF Formulas2004

    • 著者名/発表者名
      Yoshikazu Shima
    • 雑誌名

      Proc.DS 2004, Lecture Notes in Artificial Intelligence, Springer-Verlag 3245

      ページ: 298-305

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi