研究概要 |
本年度は,研究期間の初年度であるため,研究のためのデータの収集,収集したデータ間の関係をどのように表現するか,および,その表現からどのような知識が学習できるかについて研究を行った. インターネットで公開されているデータは,生成,消滅の周期が早いため,データを動的に収集,解析すると共に,実験で使用できるような情報に加工して,即時に保存するような機構が本研究を遂行する上で欠かせない.そのようなことを機械が自動的に行うプログラムの開発を行い,インターネット上の情報を即時に収集して利用できるような環境の整備を行った. 次に,このプログラムを利用してインターネットから収集した情報をグラフとして表現することで,それぞれの情報間の関係性を分析した.この分析を通して得られた知見から,情報の分類の類似関係に着目した.異なる分類体系において,分類同士の類似した関係性を発見することができれば,ある分類体系によってすでに行われた情報の分類を,別の分類体系によって利用することが可能となる.この性質を利用して情報の分類をすると,従来の手法に比べて高い精度で分類が行えるということを本研究では明らかにした.分類同士の類似した関係性を発見するには,一般的に,異なる分類同士の組み合わせの数だけ類似性判定を行わなければならない.これは非常に計算コストが高い問題であると言える.本研究では分類体系が持つ階層性に着目することで,計算コストを削減できることも示し,今後の応用可能性を大きく広げることができた. これらの研究成果は,アルゴリズムとしての理論的な有効性を示しているのみならず,本研究で開発したプログラムを使って収集した情報で実験的な有効性も示しており,国内外の学会論文誌等で幅広く報告を行った.
|