研究課題/領域番号 |
21K12096
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61060:感性情報学関連
|
研究機関 | 金沢工業大学 |
研究代表者 |
松下 裕 金沢工業大学, 情報フロンティア学部, 教授 (60393568)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 強化学習 / 眼球運動 / Webサイト / 文字識別 / 予測 / 情報検索 |
研究開始時の研究の概要 |
本研究では,強化学習を用いて,視線データからユーザの文字識別困難の発生を予測するシステムを構築する.主要な研究課題は学習時間の短縮と文字識別困難判定のための効果的な学習方法の考案である.これらの課題を二段階解析法によって解決する.第一段階では,眼球運動特性によって被験者を二つの群に分け,各群でTD法により文字識別困難の予測手順を構築する.これにより効果的な学習方法を考案する.第二段階では,現実のWebサイトで閲覧実験を行い,第一段階で得られた学習条件をDeep Q-Networkで使用することによりユーザに応じた文字識別困難発生の予測を実施する.このとき,学習時間の短縮と精度の向上を検証する.
|
研究実績の概要 |
本研究の目的は,Webサイト閲覧時の視線データから,ユーザの文字識別困難の発生を予測することである.ユーザが視線を停留させると,速やかにエージェントを起動させて文字識別困難に陥ったか否かを判定させることが肝要である.本研究では,視線停留時間を(説明変数として扱うのではなく)逐次的に時間発展させ,時間区分ごとに文字識別困難の発生の有無を判断させるアルゴリズムをSARSA法に基づいて構築した.ここに,SARSA法は行動方策(文字拡大)に従って価値を更新する学習法である 視線停留は様々な要因で発生し,文字識別困難時の停留時間が他の原因の場合より長いとは限らないため,方策決定のための停留時間の閾値の算出は困難である.このため,エージェントが誤って方策決定を行うことがあり得る.方策決定の誤りは以下の2種類である.一つは文字識別困難でないときに文字を拡大させる場合(第1種の誤り)であり,もう一つは文字識別困難に陥っているのに文字を拡大させない場合(第2種の誤り)である.前者はユーザに多大な不快感を与えるが,後者は一定時間(3000 ms)を超すと文字を拡大させれば前者ほどの不快感は与えないであろう.そこで,視線停留以外の眼球運動特性も判定に利用するとともに,適合率と再現率に基づいて第1種の誤りの発生を抑制させた上で第2種の誤りを許容範囲内に収めることを検討した.視線停留時間を500 msから3000 msまで100 ms間隔で逐次的に増加させ,視線移動速度と移動距離を外部条件として組み入れ,時間区分ごとに文字拡大の有無を判定させて判定が適切であれば報酬を不適切であれば罰則を与えることにより行動価値関数を評価した.このとき,各時間区分で報酬と罰則に掛ける増幅係数を精緻に評価することにより2種類の誤りの発生を制御した.これにより,第1種の誤りの発生率を8 %以下に抑えることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度は,第1種と第2種の誤りを低減させるために,昨年度のSARSA法のアルゴリズムに改良を加えた.まず,視線移動速度と移動距離をそれぞれ3水準に分割してこれらの組み合わせごとに行動価値関数を算出した.さらに,視線停留時間500 ~3000 msを100 msごとに分割して得られた25個の状態を4つのカテゴリーに統合した上で報酬と罰則に対する増減係数を精緻に評価した.このとき,適合率を向上させれば第1種の誤りを低減でき,再現率を向上させれば第2種の誤りを低減できるという事実を利用して,試行錯誤的に増減係数の評価を行った.その結果,2000 ms以下の文字拡大に対する報酬の増減係数の値を小さくするとともに罰則の増減係数の値を大きくすると第1種の誤りを抑制できることが分かった.また, 2500 ms以上での文字の非拡大に対する罰則の増減係数を極端に大きくすれば第2種の誤りの発生を抑えられることが分かった.この効果を定量的に評価するために,視線移動速度と移動距離を行動価値関数の評価に組み込まなかったときの結果を昨年度と今年度で比較すると次のようになる.適合率は昨年度では0.5~0.6であったのに対して今年度では0.8程度に向上(改善)したが,再現率は昨年度では0.8以上であったのに対して今年度では(最悪の場合)0.5に低下(悪化)した.しかし,視線移動速度と移動距離を行動価値関数の評価に組み込むと,今年度の適合率は0.9を超え,再現率は0.8程度に回復させられることができた.従って,第1種の誤りを抑制し,第2種の誤りを許容範囲内に収めるという目標は達成できたと考えられる.また,文字困難(I.e., 文字拡大)判定のための視線停留時間の閾値の決定を容易にするために,適合率と再現率を視線停留の各時間区分(25状態)で算出して両者の形状から適切な閾値を求める方法を考案した.
|
今後の研究の推進方策 |
今年度は,第1種の誤りを低減させるために,増減係数の評価を精緻にするとともに視線移動速度と移動距離を組み入れて行動価値関数を評価した.その結果,第2種の誤りを昨年度と同レベルに保ったままで第1種の誤りを大幅に低下させることができた.このとき,視線移動速度と移動距離をそれぞれの視線停留の頻度が均等になるようにして3水準(S, M, L)に分類した.従って,行動価値関数の表は総計9個になる.しかし,視線移動速度と移動距離には正の強い相関が見られ,収集した視線停留には強い偏りが生じた.実際,移動速度と移動距離の水準の組み合わせが対角線になる場合 (i.e., (S, S), (M, M), (L, L)) を除くと視線停留は殆ど生じなかった.然るに,Web閲覧の頻度を実験室レベルから生活レベルまで引き上げれば対角線以外でも視線停留が起こり得るため,対角線以外の組み合わせでの行動価値関数の評価が必要である.そこで,被験者に複数回(少なくとも3回以上)実験刺激のWebサイトを閲覧させて大規模な視線停留のサンプルを収集する予定である.また,視線移動速度と移動距離を細かく分割するといずれかの組み合わせで視線停留のサンプルが得られなくなる恐れがある.そこで,視線移動速度と移動距離を連続量として扱うDeep Q-Networkの構築についても検討する予定である.すなわち,視線停留時間を逐次的に時間発展させた上で視線移動速度と移動距離の観測値を説明変数として用いニューラルネットワークに文字識別困難の発生を予測させる.
|