研究実績の概要 |
本年度の主な研究内容・成果は以下のとおりである: - 重み付き全域森に基づくグラフ密度尺度 (sum-over-forests density index) を開発した. 本手法は全域木 (spanning tree) に基づく密度尺度計算法の拡張であり, この手法に, 物理学の枠組みに倣って温度パラメータを導入することで, 森の重み付けを用途に応じて制御可能である. また, 全域森定理 (spanning forest theorem) を応用し, closed form によって計算可能という好ましい特徴がある. - 対訳抽出タスクにおいて, ハブ (hub) が出現し, 精度を悪化させていることを明らかにした. また, 同タスクにおいてグラフスパース化がもたらす精度向上は, ハブが抑制されることによってもたらされることがわかった. また, 前年度開発したセンタリングが, 同タスクに対して有効であり, 最新のグラフ伝搬に基づく対訳抽出よりも高精度であることを実証した. - 高次元空間のみならず, 多数の事例を持つデータセットにおいてもハブが出現することを明らかにした. このようなハブは, やはり k 近傍分類 (k-nearest neighbor classification) タスクの精度を悪化させるが, センタリングでは削減することができないことがわかった. このため, 昨年開発した重み付きセンタリング法を発展させ, その抑制に有効な新しい手法を開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本課題の研究成果を含む, リンク解析法に関する書籍を出版予定であるが, 海外共著者との調整・出版社との交渉で遅れが生じたため, 出版年が 2015 年に延期された. しかしながら, 契約自体は成立しており, 現在は執筆についてもほぼ完成し, 微細な加筆修正・索引・文献一覧の作成・整理と校閲を残すのみである.
それ以外の研究については, ほぼ計画どおりである.
|
次年度使用額が生じた理由 |
本課題の研究成果を含む, リンク (ネットワーク) 解析法に関する書籍を出版を企画し・執筆中であるが, 海外共著者 (本課題連携研究者) との調整および出版社との交渉で遅れが生じたため, 出版年が 2015 年に延期された. これにともない, 予定していた校閲費用に剰余が生じた.
また, 最近のディープラーニングとそれにともなうベクトル表現学習技術の急速な発展にともない, 本課題が対象にするベクトル空間上の類似度尺度についても, その影響調査の必要が生じた.
|