2017 Fiscal Year Annual Research Report
ダイバージェンスに基づいたモデル評価規準の提案と考案
Project/Area Number |
16J04579
|
Research Institution | Osaka University |
Principal Investigator |
倉田 澄人 大阪大学, 基礎工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2016-04-22 – 2019-03-31
|
Keywords | モデル選択 / ロバストネス / 統計的ダイバージェンス / 多項式回帰 / 因果推論 / 意思決定 / ベイズ統計 |
Outline of Annual Research Achievements |
本研究では、BHHJ divergenceというダイバージェンス族を重点的に視ている。これは異常な値(外れ値)がある場合、母数推定が安定し易い性質を持つ。このダイバージェンスから、AICを拡張する恰好で導出されるのが、BHHJ-C (Kurata and Hamada (2018))である。この手法は多項式回帰に対するモデル選択に於いて、優秀な頑健性を示している。 本年次の研究では、このモデル評価規準をDAG (有向非巡回グラフ)を用いた因果推論に応用することを1つ目の主とした。DAGモデルでのモデル選択問題は、因果構造を示したグラフを描くに際して「何処に矢印を引けば良いのか?」ということを、統計学的に決定することを目的とする。複数種の異常値を混入させて数値実験を行うと、従来の手法と比較して提案手法BHHJ-Cは、ほぼ異常が無い場合と同様の結果を得た。 続いて、今年時の中盤から終盤に主眼を置いたのが、一対比較行列(PCM)の頑健な解析である。PCMはAHPやANP等で用いられる手法で、意思決定問題で多く用いられる。複数の対象の評点付けを人間に行わせる場合、人の曖昧な思考能力では客観的に同時比較することが難しい。そこで評価対象を1対1で取り出し、その2つの相対評価を「同程度」「~の方が少し好い」といった選択肢で問うて、それらの集計結果から全体の評点(優先度比)を抽出するアプローチがある。現状、この解析には統計学的アプローチが少ないので、当研究ではそこに離散確率モデル(DPM)を導入した解析手法を提案した。ここにBHHJ divergenceを応用して抽出を行うと、非統計学的な先行手法や、連続モデルを用いた最尤推定よりも、多様な異常データ、特に三竦み状態に対して安定した抽出を成すことが確認された。現在はこの内容を論文に纏めて提出している(under revision)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
二年目に入った本研究は、前年次に導出した規準の検討と、その応用が中心となった。 応用の中で一本の論文を投稿することを目標に据えていたが、現在その論文はrevisionの只中であり、目標は概ね達成されたと思う。 前年度終盤に着手した3つ問題(規準の理論的検討、因果推論への応用、意思決定分野への応用)の中で、1つ目はある程度順調に進み、2つ目は確認を済ませ、3つ目はある程度方向転換を行った(昨年次終盤に考えていた設定下ではダイバージェンスの応用以前に統計的手法にあまり馴染まないことが研究を進めるに従い分かった為。その後PCMという別の問題を扱った)。その為、結果的に理想的な進捗速度からは若干の遅れはあったが、頑健ダイバージェンス及び提案手法BHHJ-Cの応用を多数扱うことは出来た為、この評価とする。 当年次の研究で、前年次のものよりも複雑なモデルや、離散的な設定下でも機能が良いことが検証され、提案規準の有用性に対する期待は更に高まったと言える。
|
Strategy for Future Research Activity |
本年次最終盤から現在に至るまで、モデル評価規準の選択一致性と頑健性についての検討を行っている。多項式回帰の例で言うと、真の構造が4次多項式で表せる場合、3次以下の多項式では真の分布を表現することが出来ない為不適切である(過小適合と言う)。一方で、5次以上の多項式は、5次以降の回帰係数を0にすれば実質的に真の構造と一致し得るが、推定誤差や予測効率を考えても、また単純に無駄があるという意味でも望ましくはない(過剰適合)。 BHHJ-Cがかなり優秀な頑健性を様々な場面で発揮することを本研究はこれまで確認してきたが、AIC同様の過剰適合傾向は否めない。然し乍ら、BICは選択一致性(過小適合も過剰適合もせず、最適なモデルを択ぶ確率が標本数の増大に伴って1に収束すること)を有しているが、バイアスの過大見積もりが災いして、小標本時に不安定であることが知られている。また、ある程度の大標本でも異常値を入れた場合に過小適合モデルばかりを択んでしまう現象を、本研究でも幾度と無く観測している。 選択一致性と頑健性は、直接的関係を持たない概念であるが、是非両立して欲しい能力である。次年次では、BHHJ-C及びその関連規準について検討すると共に、どのような場面でどの規準が望ましいのかを示すことを目標の一つとしている。 他にも、BHHJ divergenceに常に付随する問題である、ダイバージェンス固有の調整母数の適当な範囲の提言や、異なるモデルへの応用についても随時並行して進めたい。
|