• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

データベースとウェブの連携による情報の獲得と利用に関する研究

Research Project

Project/Area Number 21300058
Research InstitutionNational Institute of Informatics

Principal Investigator

相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)

Keywordsウェブ文章 / データベース / 情報固定 / 固有表現参照 / 学術コンテンツ
Research Abstract

本研究の目的は、大規模なデータベースとウェブの連携による知識獲得のフレームワークの提案と実証である。異種データベース間で共通するレコードや、テキスト中で特定のレコードを指示する記述を同定し、その結果を手がかりとして、共起する属性値どうしをさらに同定したり、周辺に出現する文脈を単語ベクトルとしてあいまい性解消に利用したりする手法を検討する。具体的には、(1)データベースと外部データの相互参照手法の提案と実証、(2)ネットワーク構造を用いた情報同定手法の開発、の2つの目標を設定して研究を進める。
本年度は、まず(2)の情報同定手法について、論文著者の同定問題を対象として手法の開発および評価を進めた。情報同定の処理を、(a)同定ペア候補抽出、(b)機械学習手法による候補ペアの同一性判定、(c)獲得されるネットワーク構造上でのクラスタリングおよび統合によるクリーニング、の3つのステップにまとめ、各々について、昨年度開発した手法を詳細に評価し、改善手法を検討した。これに先立って、サンプリング方法に注意しながら人手判定用のデータを作成し、評価用データセットを構築した。また、最終的に(b)の機械学習で判断が困難である候補ペアについて、関連文書の内容(抄録・本文)解析による同一性判定を行うため、情報距離に基づく類似度計算法を新たに提案した。また(1)の外部データとの連携について、(2)によりエンティティ(対象)ごとに集約した情報を使った、情報推薦手法の検討を進めた。特に内容に基づく推薦手法に焦点をあてて検討を進めるとともに、評価のための実証基盤の開発に取り組んだ。
最終年度となる来年度は、これまでに提案した手法の評価および改善を行うとともに、外部データとの連携について取り組む予定である。また、関連文書の内容の解析による同定性能の向上やデータクリーニング手法について、適用対象を拡大しながら、検討を進めたい。

  • Research Products

    (9 results)

All 2011 2010

All Journal Article (5 results) (of which Peer Reviewed: 5 results) Presentation (4 results)

  • [Journal Article] 調査データに基づく社会構造変化の抽出2011

    • Author(s)
      金城敬太, 相澤彰子, 尾崎知伸
    • Journal Title

      人工知能学会論文誌

      Volume: 25,3 Pages: 452-463

    • Peer Reviewed
  • [Journal Article] OSUSUME : cross-lingual recommender system for research papers2011

    • Author(s)
      Kiyoko Uchiyama ; Akiko Aizawa ; Hidetsugu Nanba ; Takeshi Sagara
    • Journal Title

      Proceedings of the 2011 Workshop on Context-awareness in Retrieval and Recommendation (CaRR 2011)

      Volume: 全1巻 Pages: 39-42

    • Peer Reviewed
  • [Journal Article] A Novel Weighting Scheme for a Multi-Criteria Rating Recommender System2011

    • Author(s)
      Pakapon Tangphoklang, Saranya Maneeroj, Atsuhiro Takasu
    • Journal Title

      IADIS Inernational Conference on Information Systems (IS2011)

      Volume: 全1巻 Pages: 21-29

    • Peer Reviewed
  • [Journal Article] A Recommendation Algorithm Using Positive and Negative Latent Models2011

    • Author(s)
      Atsuhiro Takasu, Saranya Maneeroj
    • Journal Title

      IEEE Symposium on Computational Intelligence and Data Mining (CIDM 2011)

      Volume: 全1巻 Pages: 72-79

    • Peer Reviewed
  • [Journal Article] Cross-lingual keyword recommendation using latent topics2010

    • Author(s)
      Atsuhiro Takasu
    • Journal Title

      International Workshop on Information Heterogeneity and Fusion in Recommender Systems (HetRec 2010)

      Volume: 全1巻 Pages: 52-56

    • Peer Reviewed
  • [Presentation] 話題推薦システムのためのモデル構築手法2011

    • Author(s)
      冨坂亮太、鈴木崇文、相澤彰子
    • Organizer
      情報処理学会第51回全国大会
    • Place of Presentation
      東工大(東京)
    • Year and Date
      2011-03-02
  • [Presentation] 発話を意識した文推薦システムの構築と評価2011

    • Author(s)
      冨坂亮太、鈴木崇文、相澤彰子
    • Organizer
      情報処理学会研究報告.情報学基礎研究会報告
    • Place of Presentation
      NHK技研(東京)
    • Year and Date
      2011-02-28
  • [Presentation] 情報検索における圧縮距離の適用に関する考察2010

    • Author(s)
      相澤彰子
    • Organizer
      情報処理学会研究報告.自然言語処理研究会報告
    • Place of Presentation
      広島市立大(広島)
    • Year and Date
      2010-11-18
  • [Presentation] 稀な事象同士の関連性指標~異常値間の関連性抽出のための時系列データマイニング2010

    • Author(s)
      金城敬太, 相澤彰子, 市瀬龍太郎, 小暮厚之
    • Organizer
      2010年度人工知能学会全国大会(第24回)
    • Place of Presentation
      長崎大学(長崎)
    • Year and Date
      2010-09-07

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi