研究課題/領域番号 |
25330360
|
研究機関 | 電気通信大学 |
研究代表者 |
兼岩 憲 電気通信大学, 大学院情報理工学研究科, 教授 (00342626)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | セマンティックウェブ / RDFデータ |
研究実績の概要 |
平成28年度では、ユーザーの漠然とした関心から検索や質問に答えるために、これまでのキーワードや自然言語文からの推論に加えて、機械学習やデータマイニングによってユーザーが求める知識を推定する方法に取り組んでいる。
RDFデータはURI(Uniform Resource Identifier)やリテラルで記述されたWebデータのため非常に冗長性が高く,必要な情報がデータ構造内に埋もれてしまうことが多い.そこでSVMの機械学習器をRDFデータに適用するために開発したカーネル関数により、RDFデータからリソースに関する属性データの推定が可能になった。従来のSPARQLでは、RDFデータの中身に精通したユーザーが適切なクエリ文により検索しなければならない。それに対して、本研究ではリソースを指定するだけでクエリ文なしで機械学習によってそのリソースのタイプや属性が推定できる。
また、データマイニングの手法をRDFデータ用に改良することにより、出現頻度の高いRDFデータの部分構造を発見できる。こうしたデータマイニング手法は、大量のデータからの頻度計算が必要なため独自開発したインメモリ型RDFデータストアシステムを改良して実現している。これを用いてリンクトデータの意味的推論を検証するために、DBpediaやYAGOなどの大規模リンクトデータを提案手法に適用した。その結果、一般的なリソースに関する概念の推定、リソース間の関係、人物リソースの共通属性などの知識を推定できることが確認された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
RDFデータに対する意味的推論を実現するために機械学習とデータマイニングを取り入れた手法を提案している。これらはRDFのグラフ構造とそのWebデータとしての特性を考慮した新しい工夫(RDFカーネルやグラフ構造マイニング)が導入されている。
また、RDFデータが非常に大規模であることから圧縮してメモリ上で処理する必要性がある。このとき独自開発したデータストアエンジンが威力を発揮して、意味データの学習や推論を実現する。
|
今後の研究の推進方策 |
最終の29年度は、実データを検索、推論、学習を融合したRDFデータに対する意味的推論に適用して実用性・応用性の検証を行う予定である。そのために、限られたユーザー入力から求める情報を推定するアルゴリズムを強化し評価する。
加えて、実用的な性能向上のために自然言語文のテキストデータからオントロジーやRDFデータを半自動構築して知識ベースの拡充も行う。
|
次年度使用額が生じた理由 |
本研究課題の成果発表が予定より遅れたためその諸経費が一部残ったので、次年度に残額を使用する。
|
次年度使用額の使用計画 |
次年度使用額に関しては、研究成果の発表にかかる経費に使用する予定である。
|