2003 Fiscal Year Annual Research Report
事例に基づくHTML文書からXML文書への自動変換法と対話型変換支援システム
Project/Area Number |
13680440
|
Research Institution | University of Yamanashi |
Principal Investigator |
岩沼 宏治 山梨大学, 大学院・医学工学総合研究部, 教授 (30176557)
|
Keywords | 事例 / HTML / XML / 時系列パターン / 時間差分検出 / ハイパーリンク / ラッパー / データマイニング |
Research Abstract |
平成15年度は,前年までの研究成果を元に以下の応用・発展研究を行った。 1.老若男女だれでも取扱える、WEB自動抽出プログラムの自動合成システムの研究開発。 2.意味的対応と場所対応の双方を統一的に取扱えるHTML文書の時間差分検出システムの研究開発。 3.リンク元コンテキストを考慮するハイパーリンク最重要個所同定法の開発とプロキシサーバ技術を用いたブラウジング支援システムの開発。 4.大規模な時系列テキストデータからのイベント時系列パターンの発見 上記1と2は、前年度までに開発したHTML文書の意味・論理構造の自動認識技術を応用し成果した研究成果である。また支援システムとして対話型GUIシステムを開発している。WEBサイト上の時間差分情報を即座にユーザに知らせるためには、携帯情報端末当を用いる必要があるが、一般に携帯端末の画面は非常に小さく、操作性も悪い。第3番目の研究はそれらの問題を解決を目的としたものであり、HTML文書の大きな特徴であるハイパーリンクの構造解析の新しい側面を開くものである。最後のイベント時系列パターンのマイニングは、表面上は関係の見出し難いHTML文書の追跡をおこなうことを目的としたものである。
|
Research Products
(1 results)
-
[Publications] M.Nakamura, K.Iwanuma, H.Nabeshima: "Detecting Two Sorts of Correspondences between HTML Documents for Extracting Temporal Differences"Proceedings of the Third IASTED International Conference on Artificial Intelligence and Applications (AIA2003). 611-616 (2003)