研究課題/領域番号 |
26700009
|
研究機関 | 京都大学 |
研究代表者 |
加藤 誠 京都大学, 情報学研究科, 助教 (00646911)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 情報検索 / 機械学習 / 情報推薦 |
研究実績の概要 |
本年度は「選好の誘出」に関わる以下の3つの研究成果を得た: 研究成果1.「オブジェクト間の選好の推定」 部分的に観測されたオブジェクト間の選好,および,レビュー中に書かれたオブジェクト間の選好から,オブジェクトの属性に基づいて選好を復元するような関数の推定を行った.主な研究課題は,オブジェクトのランキング学習において不足する訓練データを補うことであり,これに対して,1) 依存関係からの訓練データの拡張,2) 明示的に表現されていない選好の推定,3) 文脈を用いた学習の誘導,の3つのアプローチを提案した.依存関係からの訓練データの拡張では,順接関係を言語パターンにより同定し,信頼度を考慮しつつ訓練データの拡張を行った.明示的に表現されていない選好の推定では,絶対的評価として書かれている文章から,暗黙的な比較対象を仮定し選好の推定を行った.文脈を用いた学習の誘導では,新しい機械学習手法である文脈誘導型学習を提案した. 研究成果2. 「形容詞-名詞クエリに対する画像の適合性推定」与えられた画像が形容詞と名詞から成るクエリに対して適合するか推定する問題に取り組んだ.この課題を達成することによって,ある形容詞に対する画像への選好を得ることができる.この問題では,疑似適合画像集合と疑似不適合画像集合が得られていることを仮定し,両集合をよりよく識別するための特徴空間をオートエンコーダを用いた手法によって得ることによって,画像の適合性判定に有効な特徴を発見する. 研究成果3. 「脳構造データからの脳活動データの予測」選好の誘出のために脳活動データを用いる予定であったが,ある刺激に対する脳活動データをfMRIなどの機器によって得るためには,多くの時間と労力を必要とする.そのため,いくつかの脳構造データと脳活動データのペアから脳構造データを用いて脳活動データを予測する方法を開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究実績の概要にて述べたように,選好の誘出のために脳活動データを用いる予定であったが,このデータを取得するためのコストが大きく,統計的手法を適用するほど多くのデータが得られなかった.そのため,実ユーザからのデータ取得が予定に比べ遅れており,選好の誘出の課題において多くの成果が上げられていない.一方で,ユーザが既に発信しているようなデータに基づいて選好を推定する手法については,主に理論的な側面から大きな発展があった.
|
今後の研究の推進方策 |
選好の誘出に関して,予定していた成果を得られていないが,次年度は予定通り,意見の誘出に関する課題に取り組む.今年度の状況を踏まえて,また,次年度以降の発展を見据えた上で,ユーザから得られるデータを用いた研究の比率を低減させ,ユーザがある状況下で発信した情報を主に用いることを予定している.このアプローチでは,システムから与える刺激をコントロールすることはできないが,既に与えられている刺激(そのユーザが他のユーザから得たメッセージや環境から受ける影響など)の中でどのような刺激が誘出に有用であったかを評価する.評価のための実験などでは,刺激を生成することは行わず,刺激の選択を行うだけになるが,データ量が十分であれば刺激を生成できる場合の条件と近くなる.これによって,次年度においては安定した研究推進が期待できる.
|
次年度使用額が生じた理由 |
現在までの進捗状況に記載したとおり,ユーザからの情報収集に関して,想定した以上のコストが必要であったため,当初の計画を実行するのではなく,研究計画を一部変更して,逐次ユーザからの情報を必要としないようなアプローチを取った.このため,ユーザからの情報収集に計上していた費用が必要なくなり次年度使用額が生じた.
|
次年度使用額の使用計画 |
今後の研究の推進方策で述べたとおり,次年度以降はユーザからの逐次的なデータ収集についてはその比率を低減させる予定である.そのため,ここで生じた次年度使用額の分に関しても同様に,ユーザからのデータ収集に当てるのではなく,リサーチアシスタントに対する謝金として当て,理論的な側面の発展に当てたいと考えている.
|