本年度では、球面クラスタリングで扱うデータの拡張として、ソフトウエアコンポーネントの類似性の観察や、Tweet情報の単語毎の類似性の観察等を行った。基本的な理論は同様であるが、広い応用の可能性があることを証明している。また、特にソフトウエアコンポーネントの類似性については、Java系APIでは名前にコンポーネントの意味を付与していることから、意味解析を併用することでかなりの精度で『役割の似ている』ソフトウエアコンポーネントを球面上にクラスタリングし、可視化できることが明らかとなった。 理論的応用として、時系列データに対する球面上の可視化を行った。元となるASKSの数値計算では、ランダムで与えられた初期配置に依存してしまうため、同じデータセットでも空間中の絶対座標は同一になることはほぼない。このため、時系列的に連続するデータをもって、表面上でデータの動きを観察することができなかったが、初期配置を『前のフレームの点』から計算することで、ある程度連続性を持ってデータの移動量を定義することができた。これによって、Twitterの単語の意味がどのように変遷するのかなどの考察を行うことができるようになった。
|