研究課題/領域番号 |
15H02701
|
研究機関 | 東京工業大学 |
研究代表者 |
宮崎 純 東京工業大学, 情報理工学院, 教授 (40293394)
|
研究分担者 |
波多野 賢治 同志社大学, 文化情報学部, 教授 (80314532)
中村 匡秀 神戸大学, システム情報学研究科, 准教授 (30324859)
欅 惇志 東京工業大学, 情報理工学院, 助教 (00733958)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 情報検索 / コピュラ / 情報推薦 / Top-kアルゴリズム |
研究実績の概要 |
索引語やキーワードなどのテキスト情報の適合性やアイテム、ユーザの嗜好や状況等を周辺分布としてモデル化して入力とし、コピュラ関数によりこれらの入力間の因果関係を考慮して、出力である適合情報の分布を表現する同時確率分布を導き、適合理由を直観的に表現可能な新しい情報検索・情報推薦システムの提案を目的としている。 本年度は、文書の読みやすさと文書適合度指標をコピュラにより統合し、高精度の検索を実現するための方式、ランキング結果のTop-k件を効率良く導出するアルゴリズム、情報推薦へのコピュラの適用について研究を実施した。 文書の読みやすさと文書適合度とのコピュラでの統合の研究では、読みやすいWeb文書の検索を実現した。その際、NDCと呼ばれる既存の標準的な可読性の指標がWeb文書検索に適切でないことを明らかにし、新たな可読性指標を提案するに至った。一方で、ランキング結果のTop-k検索の研究では、コピュラによる非線形なスコア統合方法は、統合対象のデータを事前にインデキシングする既存手法では実現できない。そこで、コピュラのような非線形関数で定義される超曲面をインデキシングする新しい計算方法を提案した。これにより、滑らかな任意のスコア統合関数を利用したTop-k検索が可能となった。最後の情報推薦のコピュラへの応用では、複数の評価軸をもつアイテムを、コピュラを利用して高精度に推薦するための手法について研究を行った。この研究において、ユーザが重要視する評価軸や逆にユーザが考慮しない評価軸を判定する方法を提案した。ユーザが考慮しない評価軸を除いてコピュラを構成することで、機械学習を用いた手法よりも高い精度で推薦が可能となった。 この他、自動的に最適なコピュラを構成する手法や、コンテキストアウェアな情報推薦サービスを行うためのコピュラの応用について研究を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コピュラを利用した検索モデルでは、既存のアルゴリズムでTop-k検索を行うことが難しい。これは、既存のアルゴリズムが、対象データがソート済みであることや特殊なインデクスを必要としているからである。しかしながら、ある文書を複数の評価指標でスコア統合する場合、各評価指標から動的にスコアデータが生成されるため、スコア統合直前にデータをソートすることやインデクスを作成するのは効率的ではない。本研究ではデータではなく、スコア統合関数で定義される超曲面にインデクスを作成することにより、統合されるスコア値の事前処理が不要なTop-k検索アルゴリズムを提案した。このアルゴリズムはスコア統合関数が連続でかつ滑らかであれば適用可能で、性能が非常に高いことを実証しており、完成度は高いと言える。 一方、情報推薦にもコピュラを利用することを試みた。この際、推薦対象アイテムの各特徴パラメタの関心度を推定し、不要な特徴パラメタを排除した上で、ユーザの嗜好を表現するプロファイルをコピュラを利用して作成した。これにより高精度でアイテムを推薦可能であることを明らかにしている。情報推薦におけるユーザの嗜好を、コピュラを利用してモデル化可能であることを明らかにしたことは、十分な達成度であると言える。 以上を総合すると、本研究は目標通りの達成度であると判断できる。
|
今後の研究の推進方策 |
今後は、最適な多峰コピュラを自動的に推定して統合関数を構成する手法、コピュラを利用した情報推薦についての一般化、例えばコンテキスト情報を考慮した推薦などの手法を中心に研究を行う予定である。 前者については、情報量規準を利用したクラスタリングの最適化に結びつけることが可能であるが、よく知られている情報量規準のAICやBIC等では最適なコピュラが得られないことが予備実験により判明している。そのため、新しい情報量規準について今後検討を進めていく予定である。 後者についても、最適なユーザプロファイルを構成するための特徴パラメタの要不要を決定する閾値の自動設定や、意思決定に支配的となる特徴パラメタが少ないアプリケーションを利用して、提案手法の有効性、有用性の検証を行う。同時に、時間軸を考慮したコンテキストアウェアな推薦サービスについても、その構成方法の検討を進めていく。
|