2013 Fiscal Year Research-status Report
ウェブリンク構造の時系列データからのマイニング―表現モデルとアルゴリズム―
Project/Area Number |
23500022
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
宇野 裕之 大阪府立大学, 理学(系)研究科(研究院), 准教授 (60244670)
|
Keywords | アルゴリズム / ウェブグラフ / 時系列データ / データマイニング / 情報基礎 / 離散最適化 / 遺伝子情報学 |
Research Abstract |
ウェブのリンク構造は通常ウェブグラフとして表現され,ウェブ上で動作するさまざまなアルゴリズム設計の基礎的なモデルである.このウェブグラフはしかしながら,リンク構造のある瞬間のスナップショットにすぎず,動的に変化し成長を続けるリンク構造の様子 を表現するには不十分である.そこで本研究の主たる目的は,変化・成長するリンク構造を時系列データとしてとらえ,1. ウェブ時系列データを表現するモデルを構築すること,および 2. そのモデルをもとに, ウェブに潜む新たな知識を時系列データから発見するためのデータマイニング・アルゴリズムを設計・開発することを目指している. 平成25年度は,前年度までにひきつづき時系列データをいかに表現するかというモデル化そのものを行った.昨年度までに提案したウェブグラフの時系列データを,グラフとグラフの各枝が存在する時区間のペアとして定義する方法をさらに拡張することを考え,長い時間存在するクリークをより効率的に列挙する方法を考察した.これらの結果は,単にウェブのスナップショットだけでは得られない新たな知識を得た上で,時系列にもとづく将来への知見や予測の獲得,ウェブを通じた社会現象の解明などにより人類への貢献につながると考えている. 一方,25年度は,ウェブリンク以外にも本質的に時系列と同様の性質をもつデータを取り上げ,それらのモデル化に着手した.その一例として,生物の遺伝子構造の類似性による繋がりが,その閾値により離散連続的に変化する様子に着目し,そこに潜む重要構造のモデル化を行うと同時に,実データによるマイニングの実験を開始した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成25年度に当初予定していた計画は,前年度までにひきつづき時系列データをいかに表現するかというモデル化そのものを行うと同時に,それらのモデルに従い,実際のウェブの時系列データを対象にマイニングの実験を実施するというものであった.しかしながら,モデル化の段階で思いがけないさまざまな変化や発展のきっかけを得たことより,研究の比重を引き続きモデル化に置いたことにより,実データによる実験に若干の遅れが生じている.一方で前記のように,当初は想定していなかった成果も得られている. また,ウェブリンク以外にも本質的に時系列と同様の性質をもつデータを取り上げ,それらのモデル化に着手した.その一例として,生物の遺伝子構造の類似性による繋がりが,その閾値により離散連続的に変化する様子に着目し,そこに潜む重要構造のモデル化を行うと同時に,実データによるマイニングの実験を開始したことも原因の一つとなっている.
|
Strategy for Future Research Activity |
平成25年度における研究では,当初予定していたウェブの時系列データをいかに表現するかというモデル化そのものの研究において,モデル化の段階で思いがけないさまざまな変化や発展のきっかけとなる着想を得た.そこで平静26年度は,ここでも当初予定を若干変更し,モデル化そのものの新展開をはかる.それと同時に当初計画どおり,それらのモデルに従い実際のウェブの時系列データを対象にマイニングの実験を実施する. またこれも25年度に,ウェブリンク以外にも本質的に時系列と同様の性質をもつ生物の遺伝子情報データを取り上げ,それらの時系列データのモデル化に着手した.それらは,生物の遺伝子構造の類似性による繋がりが,その閾値により離散連続的に変化する様子に着目するものであり,そこに潜む重要構造のモデル化を行うと同時に,実データによるマイニングの実験を行う.このように異なるデータに潜む類似の時系列構造モデルが,結果的に本来目指しているウェブ時系列データのモデル化や効率的処理へとフィードバックされることが期待できる.
|
Expenditure Plans for the Next FY Research Funding |
当初計画では,モデル化やアルゴリズム設計が完了したものから順次実装を行い,実際のウェブデータを用いて実験を開始する予定であった.しかしながら,モデル化など理論的な研究に興味深い着想や進展を見たため,前年度は大規模な計算機実験を見合わせたことにともない,計算機設備の購入・導入をひかえたため. 理論的な研究のためには,最新の研究動向や成果を得るために,さまざまな関連国際会議に出席し講演を聴講することや,同分野の研究者との意見交換や討論を行うために,前年度に引き続き旅費を計上している.また,新たな着想にもとづく計算機実験を実施するための計算機を導入・整備するための物品費も計上の予定である.
|
Research Products
(3 results)