まず前年度に勾配ブースティング木に基づくXGBoostを利用した遺伝子制御ネットワーク推定に対するL1正則化を導入した際にも推定精度の著しい上昇が見られなかったことに加えて、提案アルゴリズムにより推定された遺伝子制御ネットワークが疎な構造に制約することができていないということが明らかになったことを受けて、L1正則化の掛け方に関する検討を行なった。 前年度までに導入したL1正則化では、勾配ブースティング木のパラメータである回帰出力のみに対する正則化に留まっており、本質的に構築した回帰木すなわち学習器の構造に対して正則化の効果に伴う構造変化を誘導していないことが主な要因であると考えられた。 そこで、L1正則化に伴い学習器の構造自体に制約がかかるように提案アルゴリズムを変更した結果、提案アルゴリズムによって推定された遺伝子制御ネットワークは、先行研究よりも現実に見られる遺伝子制御ネットワークに近い疎な構造を出力できるようになった。 一方で、提案アルゴリズムと先行研究による遺伝子制御ネットワーク推定の精度を比較したところ、その間には顕著な精度向上は確認できなかった。 提案アルゴリズムによって推定した遺伝子制御ネットワークにおいて本来は制御関係にないはずの偽陽性である制御関係における遺伝子の時系列発現量を調査したところ、発現量の絶対値が高い関係を優先的に推定結果として出力してしまう傾向が確認されたことから、このような絶対値としての違いではなく遺伝子制御を決める遺伝子発現の前後関係を強く反映するアルゴリズムへの改良が精度向上に繋がると考えられる。
|