研究概要 |
前年度まで,意味を理解するエージェント実現をめざして,記号表現をベースにした利用者モデル構築してきた.今年度は,このモデルを用いてインセンティブの設計を以下の過程で行った. 1.利用者エージェントネットワークにおける信頼構造を,グラフ理論に基づいて数理的に解析した:現実のWeb社会が持つといわれているスケールフリー性を仮定して利用者エージェントを配置し,各エージェントが必要な情報に至るまでの最短距離の評価,また,最短距離で到達するための探索知識をこれまでのエージェントモデルに組み入れた.この成果は,「強化学習エージェント間の相互関係性の抽出」と題して電気学会の電子・情報・システム部門大会にて発表した. 2.1がスケールフリーネットワーク上にエージェントを配置したのに対し,1で構築したエージェントが,どのようなインセンティブを与えればスケールフリーネットワークになるのかという観点から,インセンティブの設計問題および,スケールフリー生成モデルの提案と実験を行った.エージェントの満足度は相互情報量に基づいて算出し,エージェントはこれを報酬(インセンティブ)としてネットワークのリンクを生成する枠組みである.この成果は,"Reward Design for Emerging Cooperative Behavior in Continuing Task Domains"にまとめ,今年5月に発表予定である.尚,スケールフリー性を評価するクラスター係数の算出法は巡回セールス問題と関係が深く,関連の論文として報告した. 3.2における報酬の設定によって,生成されるネットワーク構造の違いと全体の挙動評価を評価するためのシミュレーション環境を構築し,スケールフリー性を持つネットワークが必ずしも,信頼性を維持する上でよいとはいえないという結果を得ている.この結果を検証するためには更なるデータ収集を必要とする.
|