研究課題/領域番号 |
16K00291
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 北海道大学 |
研究代表者 |
原口 誠 北海道大学, 情報科学研究科, 特任教授 (40128450)
|
研究分担者 |
大久保 好章 北海道大学, 情報科学研究科, 助教 (40271639)
吉岡 真治 北海道大学, 情報科学研究科, 教授 (40290879)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 極大類比 / 疑似クリーク / 局所相関推論 / 非負行列分解 / グラフ正則化 / アナロジカルヒント / クロスクラスター / 擬似クリーク / グラフ正則化項 / クロスクラスタ― / 構造類似性 / 構造類比 / 属性相関検出 / 形式概念 / 汎化パターン / 構造写像 / 記述的類似性 / グラフ部分マッチング / パス列挙 / 抽象化 / 密度に基づくクラスタリング |
研究成果の概要 |
物語や判例などにおいて,各物語に固有な登場人物などの違いを超えて観察できる類似性を検出することが本研究の目的であり,登場人物や物の間に同一もしくは類似した関係が成り立つときに二つの物語は関係構造が類似しているという.本研究では2個以上の複数の物語文を与え,一定数の物語で具体化できる共通の関係構造類似性を,行列非負分解やグラフマイニングの技法を用いて抽出できるアルゴリズムを与えた.この手法はテキスト解析のみならず,複数のデータウェアハウス間の共通関係構造抽出などにも応用でき,一般的なものである.
|
研究成果の学術的意義や社会的意義 |
構造類似性抽出タスクは,関係を構成する個体のマッチングとそれに基づく関係のマッチングという2重のマッチング問題を含んでおり,一般論として述べれば高度に組み合わせ論的な問題を内包していた.本研究では,行列非負分解によるデータ圧縮により得られるクラスタリングとクラスターを記述要素とするグラフに対するグラフマインニング技法を併せて考えることにより,現実的な計算時間で構造類似性を検出可能な道を拓いた点が学術的意義である.さらには,様々な物語のインデックスとして構造類似性を付与した物語データベースなど,応用面での基礎を与えたとの意味で社会的意義を持つであろう.
|