研究概要 |
本年度は,未知の遺伝的関連予測(仮説発見)の枠組みの中で,特に遺伝子機能と表現型(phenotype)の因果関係推定における(1)遺伝子機能オントロジーおよび表現型シソーラスの有用性,(2)全文データの有用性を調査した.(1)について具体的には,オントロジーあるいはシソーラス中の概念の階層関係に注目し,訓練事例から推定された因果関係を隣接概念に伝播することで,より頑健なパラメタ推定を試みた.実データによる評価実験を行ったところ,遺伝子機能オントロジーのみ,かつ上位から下位への関係のみを用いたときに,仮説発見の性能向上が見られた.この結果は,上位概念の性質(具体的には遺伝子機能が引き起こす表現型)が下位概念に継承されるということを意味する.パラメタ推定に利用できる事例は限られているため,本手法によって,既知の事例からは獲得できないような因果関係に対しても,より信頼性の高い推定が可能になる.(2)については,遺伝子機能と表現型の因果関係推定に際して,論文タイトルと要約に加えて全文データを用いた場合,遺伝的関連の予測性能が向上するかを調査した.要約と比較し,全文データは実験等に関してより完全な情報を提供するため,本研究のような学術文献解析に基づく知識システムでは,全文データを利用することでシステムの性能向上が期待できる.しかし,著作権の関係などから,これまで仮説生成における全文データの有用性を定量的に調査した例はない.評価実験の結果,全文データを用いた場合には全体で5.1%の性能向上が見られ,その有用性が実証された.
|