研究課題/領域番号 |
16K01958
|
研究機関 | 株式会社国際電気通信基礎技術研究所 |
研究代表者 |
川脇 沙織 (田中沙織) 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究室長 (00505985)
|
研究分担者 |
成本 迅 京都府立医科大学, 医学(系)研究科(研究院), 教授 (30347463)
酒井 裕 玉川大学, 脳科学研究所, 教授 (70323376)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 衝動性 / 強迫性 / 数理モデル / 強化学習 / 疾患 |
研究実績の概要 |
1) OCDの患者の臨床症状を元に、不安な状態から強迫行為を行うことで不安のない状態に戻るという2状態間の遷移問題を設定した。強化学習の問題設定で、不安のない状態 (s0)と不安のある状態 (s1)で、「何もしない (a0)」「不安な状態に遷移する (a1)」「強迫行為を取る (a2)」の行動を各状態に設定した。また、強化学習アルゴリズムは一般的なTD学習則を採用したが、先行研究に基づきTD誤差の記号が正の場合と負の場合で、異なるパラメータセットを用意した。OCD症状の定義として、a1とa2のサイクルに陥る頻度を用いる。OCD症状がどうやって形成されるか、どれぐらいの強度で持続するのかを、シミュレーションで検証した。具体的には、衝動性に関わるパラメータである時間割引率γについて、OCD症状の頻度を評価した。その結果、正のTD誤差を用いた学習での時間割引係数γ+と、負のTD誤差を用いた学習での時間割引係数γ-の関係が非対称でかつγ+>γ-の領域では、OCD症状が発生することを確かめた。この結果に関して、OCDモデルに詳しい海外研究者の招聘を行い、研究協力者メンバーと共に日本神経科学大会においてディスカッションを行った。 2) OCD患者における衝動性および強迫性に対応するパラメータの分布の推定を行うために、強迫性に対応するパラメータを測定する課題として提案されている2状態マルコフ意思決定課題 (Daw et al., 2011) を実装し、健常者93名、OCDサブクリニカル被験者22名を対象としたデータ収集を行った。 3) OCDの治療効果の予測の予備的な解析として、現状のモデルでの治療効果の検討をシミュレーションで行った。1)のモデルにおいて、薬物療法の効果を評価するために、OCDの第一選択薬として用いられるSSRIの効果を、先行研究に基づき「γ+とγ-を対称にする介入」と解釈し、薬物療法の評価をシミュレーションで行った。その結果、薬物療法後ではOCD症状の頻度が減少することを確かめた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
数理モデルの構築とシミュレーション、行動実験の実施は予定通り進んでいる。さらに、モデルを用いた治療効果の予測に関する予備的な検討も開始していることから、順調に進展していると考える。
|
今後の研究の推進方策 |
モデルの検討に関しては、パラメータ設定に加え、学習アルゴリズムの評価( TD (λ)(一般的な強化学習)、モデルフリー/モデルベース(環境のフォワードモデルの有無)、仮想学習 (過学習の欠如したハビットが、「手を洗うと安心するから、手を洗わないと安心できない」のような「不適切な仮想学習」の過学習から生じている可能性))や、model-free/model-basedのフレームワーク(Daw et al., 2011)に関しても検討を行う。また、実験課題に関しては、衝動性に対応するパラメータと強迫性に対応するパラメータを同時に測定することができる新たな意思決定・学習課題の作成とデータ収集を進める。これらから得られた知見を元に、OCDで確立されている投薬治療と行動療法のモデルへの実装を本格的に進める。
|