Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2012: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
|
Research Abstract |
本研究は,Web上のテキストデータを可視化対象とした、大規模テキスト群可視化システムを構築するために,1.SOMの高速化・大規模化の実現,2.上位概念マップの精度向上,3.インタラクティブなSOMの構築およびフィードバック機能,4.利用実態に合わせたSOMの最適化について検討を行った.このうち1,2については前年度に成果を挙げており,本年度は3,4について主に研究を進めた.これまでの提案手法によるSOMでは,学習結果を一方的に提供しているに過ぎず,どのような経緯からマップが構築されているかをユーザが判断することはできない.テキストクラスタリングはユーザが介在するインタラクティブな要素が含まれている必要があると考えられることから,ユーザの操作によってマップの変化を観察可能なシステムが必要であるとの結論に至った.新たに提案した手法では,ユーザが入力したクエリに対する検索結果群に対してテキスト内のキーワードを抽出し,キーワードとクエリの共通概念をWikipediaから取得する.この概念を用いてテキスト間の類似度を測定し,この類似度に応じてSOMを適用しマップを構築する.ここで構築されたマップは,類似度に基づいた階層構造を有しており,ユーザが類似度を調整することによってデータの分布の変化を観察できる仕組みを組み込むことが可能となった.ユーザが類似率を調整することにより,マップにおける学習結果のアイテムの分布を変化することが可能になり,学習結果の位相情報を保持させることで,学習ごとに異なる学習結果が出力される問題点を解決することが可能となった.さらに,マップの類似度情報によってマップが変化する仕組みは,ユーザの利用実態に合わせたマップの最適化を可能にしており,研究目的および研究実施計画のすべてを達成した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究課題として挙げた3点の問題点に対して,前年度に2点が解決済みであり,残り2点(前年度の計画では1点であったが進行状況に合わせて追加した)についても本年度中におおよその成果を得ている.SOMにユーザインタラクションの仕組みを組み込むことで,よりユーザのニーズに合わせた情報を抽出できるようになったことから,計画以上の進展があったと思われる.
|
Strategy for Future Research Activity |
ユーザインタラクションに関して,ユーザの評価や学習結果に対して調整する機能等を追加することにより,より精度の高いマップの構築が可能になると考えられる.この点について現在研究を進めているが,ユーザが入力したクエリとそれに対する検索結果のデータそのものに大きな差異がある場合,SOMのマップについての評価を適切に行うことが困難になることが考えられる.このような検索結果の偏りについては十分に注意が必要であり,検索結果の取得段階で,幅広い内容を網羅したデータ群を選別する機能を搭載する必要があると考えられる.
|