研究概要 |
本年度は,ユーザによる時系列データの多面的な解釈を支援するシステムの開発実装を行った。まず,昨年度までに我々の開発した多重スケールマッチングとラフクラスタリングによる系列の比較分類法に加え,DTW,AHCなど様々に異なる比較法,類型化法を用いて時系列を類型化し,その結果を視覚的に提示する時系列データからの樹状図生成システムおよび類型化結果表示システムを構築した。また,同システムを用いて,種々の類型化法の性質について共通データ上で比較実験を行った。全ての属性における比較には至っていないが,(1)CL-AHCとAL-AHCは明らかに異なる樹状図を与え,階層構造把握の容易さと類型化結果の解釈の容易さにおいて,CL-AHCはAL-AHCより優れていること,(2)DTWとCL-AHCの組み合わせが解釈の容易な結果を安定して生成し得ること,(3)DTWとRCの組み合わせでは各クラスタの代表的な系刻が得られること,(4)多重スケールマッチングは非対応系列の取り扱いが問題となりAHCとの組み合わせでは良い結果が得られなかったが,RCを類型化法として用いた場合には問題が回避できること,など,時系列の類型化結果を解釈する上で考慮に入れるべき様々な性質が明らかとなった。 加えて,類型化を通じて明らかとなった短期系列および不均質系列の問題に対応するため,データの収集期間,収集間隔,収集回数からなる不要系列の判定法を提案した。同方法を適用して不要なデータを除外した後,血小板数が正常下限値以下に至るまでの期間と肝炎進行度の関係について再解析した。その結果,肝生検時における血小板数の平均値はF4<F3<F2<F1であるが,正常下限に至るまでの期間ではF2とF3の間に順序の逆転が見られたこと,全てのステージにおいて,C型IFN非投与例でIFN投与例よりも長い期間を要したこと,など,興味深い知見が新たに得られた。
|