23年度は情報連携・統合により診療データに対するデータマイニングの結果を再構成する手法と医学的知識の発見をを目指した。前者では使用するデータ項目の見直しと提供内容の拡張についてデータ提供元と検討・調整をし、新データの取得・提供を依頼した。新規に提供される投薬量と期間のデータをこれまでの時系列パターンと組み合わせつつ、医学的関心にあわせたマイニング結果と医学文献からの背景知識との連携を再検討したものの、上位レベルの医学的な知識獲得には至らなかった。また医学的知識の発見に関しては診療データと並行して、前年度に引き続き肝炎ウイルスの遺伝子亜型パターンと治療法の著効性との関係を明らかにするために、主に公開配列データを対象とする準教師付学習手法の改良に取組んだ。多量の遺伝子亜型配列が公開されながらも治療の効果が登録されている遺伝子亜型が極端に少ないという状況に対し、効果の有無を特徴付けるパターンのうち、配列中に1度しか出現しない特定配列パターンDOOPSを見つけるためのexhaustive search手法、および配列中に繰返し出現する特定パターンDMOPSを見つけるseparate-and-conquer学習手法を提案し、C型肝炎ウイルス内のNS5Aドメインへの適用についてECML/PKDD2011併設ワークショップにて報告したほか、ACIIDS2012でも予測精度の向上について報告した。H24年度は、医学的新知識の一例として遺伝子発現抑制につながるsiRNA配列の識別問題に取り組み、Aprioriをベースとする記述的学習手法および冗長な結果のフィルタリング手法を提案しISKSS12にて発表した。一方、HCV遺伝子亜型の識別モチーフ発見のための準教師付学習については、クラス判断の際にクラスタ的性質を仮定するアンサンブル学習手法の開発による学習性能向上成果を雑誌報告予定である。
|