2007 Fiscal Year Annual Research Report
WWWにおける話題の分岐収束過程の抽出と可視化に関する研究
Project/Area Number |
19700143
|
Research Institution | Kyoto University |
Principal Investigator |
森 幹彦 Kyoto University, 学術情報メディアセンター, 助教 (70362423)
|
Keywords | 情報集約 / 人工知能 / インターネット高度化 |
Research Abstract |
本課題研究は,WWWの広がりとともにオンラインニュースに代表されるようなその時々の出来事が記されたWeb文書が大量に公開されている中で,長期的な視点で話題を眺めたときの話題に含まれる内容の変化や話題の分岐や収束があった場合でも追跡な可能な技術の確立と,一連の話題のつながりを可視化するシステムの実現を目的とする.この目的を達成するため,今年度はとくに,安定的に話題を提供しているオンラインニュースの記事に注目し,ニュースにおける話題提示の性質の分析によるニュース記事群の話題に関する関係性のモデル化と,それをもとにした話題ごとの分類を目指したニュース記事群のクラスタリング手法の検討を行った. 話題を継続的に追跡するには,あらかじめニュース記事群を固定することができず,新規ニュース記事の話題への対応付けを逐次的に行う必要がある.そこで,ニュース記事は日ごとなどの一定期間を単位として話題の内容が変化することに着目し,それぞれの期間ごとの話題の発見と隣接する期間の話題間の関係を考慮した話題の遷移モデルを構築した.この話題遷移モデルは,ある話題において初期から終了までに語られる内容が変化した場合でも追跡でき,話題がいくつもの話題に発展する分岐状態やいくつかの話題がひとつの話題として認識されるようになる収束をモデルの中で表現できるため,分岐と収束を識別して追跡できる.このモデルにもとづいてニュース記事群を話題ごとに分割する手法を提案した.最後に,構築したモデルの有効性を確認するため提案した分割手法を用いた話題追跡システムを開発し,オンラインニュース記事を利用して検証したところ,ニュース記事群における話題の独立度合いと記事数の影響を受けるものの,話題を追跡できたことを確認した.
|
Research Products
(1 results)