• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

Linked Open Dataを用いた固有名詞タグ付けと情報検索への応用

研究課題

研究課題/領域番号 25280035
研究機関北海道大学

研究代表者

吉岡 真治  北海道大学, 情報科学研究科, 准教授 (40290879)

研究分担者 神門 典子  国立情報学研究所, 大学共同利用機関等の部局等, 教授 (80270445)
研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード情報検索 / 固有名抽出 / Linked Open Data / 多観点分析
研究実績の概要

本年度は、Linked Open Dataの中心と位置付けられているDBPediaのメタデータの品質向上を目標として開発したWC3について、日本語化を行うとともに、日本語DBPediaの開発チームとのディスカッションを行うとともに、システムの公開を行っている。また、このLinked Open Dataから得られた固有名詞のクラス情報を利用して、人名、地名などのタイプ付きの固有名詞を抽出するシステムを作成した。また、これらのタイプ情報をファセットとして利用した文書群に対する文書生成モデルとして、特定のファセットに関連する単語を主に生成するトピックという考え方を導入したFacet biasedトピックモデルを提案した。また、このFacet biasedトピックモデルを用いたニュース記事のカテゴリ分類システムを提案し、このような固有名詞に関する情報を用いることが、従来型の、トピックモデルを用いるよりも、有意に分類性能を向上させることを確認した。また、このFacet biasedトピックモデルは、特許文書における、分析の観点と対象物といった特許マップで用いるような異なる観点についての同時クラスタリングが行える事を具体的な事例で確認した。さらに、
世界中の新聞記事の報道の違い(興味・賛否など)を分析するNSContrastについて、ニュース記事のデータベースであるGDELTにより提供される1日15万記事以上の記事を対象として利用できるようにすることで、これまでのシステムでは、あまり分析のできなかった、アフリカやオセアニアといった地域のニュース記事についても分析を行えるように改良した。昨年度から行っているこの研究の成果については、人工知能学会の研究会優秀賞を受賞した。

現在までの達成度 (段落)

27年度が最終年度であるため、記入しない。

今後の研究の推進方策

27年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

27年度が最終年度であるため、記入しない。

次年度使用額の使用計画

27年度が最終年度であるため、記入しない。

  • 研究成果

    (9件)

すべて 2016 2015 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件、 オープンアクセス 1件) 学会発表 (6件) (うち招待講演 1件) 備考 (1件)

  • [雑誌論文] Comparative Analysis of GDELT Data Using the News Site Contrast System2016

    • 著者名/発表者名
      Masaharu Yoshioka and Noriko Kando
    • 雑誌名

      Proceedings of the First International Workshop on Recent Trends in News Information Retrieval co-located with 38th European Conference on Information Retrieval (ECIR 2016)

      巻: - ページ: 63065

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] WC3: Wikipedia Category Consistency Checker Based on DBPedia2015

    • 著者名/発表者名
      Masaharu Yoshioka and Rhett Loban
    • 雑誌名

      Proceedings of the 11th Intl. Conf. on Signal-Image Technology & Internet-Based Systems

      巻: - ページ: 712-718

    • DOI

      10.1109/SITIS.2015.26

    • 査読あり / 謝辞記載あり
  • [学会発表] facet-biasedトピックモデルと距離尺度学習を用いたニュース記事の分類2016

    • 著者名/発表者名
      小野寺大輝, 黄楽, 吉岡真治
    • 学会等名
      2016年度人工知能学会全国大会(第30回)論文集
    • 発表場所
      北九州国際会議場(福岡県北九州市)
    • 年月日
      2016-06-06 – 2016-06-09
  • [学会発表] 対象-観点を考慮したfacet-biasedトピックモデルと特許マップへの応用2016

    • 著者名/発表者名
      小野寺大輝, 吉岡真治
    • 学会等名
      言語処理学会第22回年次大会発表論文集
    • 発表場所
      東北大学 川内北キャンパス(宮城県仙台市)
    • 年月日
      2016-03-07 – 2016-03-11
  • [学会発表] 日本語版WC3(Wikipedia Category Consistency Checker) ― 日本語版Wikipediaのカテゴリに所属するページのメタデータの一貫性の分析 ―2015

    • 著者名/発表者名
      吉岡 真治
    • 学会等名
      人工知能学会第37回セマンティックウェブとオントロジー研究会
    • 発表場所
      慶応義塾大学 日吉キャンパス 來往舎(神奈川県横浜市)
    • 年月日
      2015-11-13 – 2015-11-13
  • [学会発表] 複数国の新聞からの多観点比較による分析~GDELTデータを用いた分析~2015

    • 著者名/発表者名
      吉岡 真治, 神門 典子
    • 学会等名
      人工知能学会合同研究会 優秀賞記念講演
    • 発表場所
      慶応義塾大学 日吉キャンパス 來往舎(神奈川県横浜市)
    • 年月日
      2015-11-13 – 2015-11-13
    • 招待講演
  • [学会発表] Comparison of different strategies for utilizing two CHEMDNER corpora2015

    • 著者名/発表者名
      Thaer M. Dieb and Masaharu Yoshioka
    • 学会等名
      Proceedings of the Fifth BioCreative Challenge Evaluation Workshop
    • 発表場所
      cicCartuja (Sevilla, Spain)
    • 年月日
      2015-09-09 – 2015-09-11
  • [学会発表] DBPediaの情報に基づくWikipediaのカテゴリ情報の一貫性の分析2015

    • 著者名/発表者名
      吉岡 真治, Rhett Loban
    • 学会等名
      2015年度人工知能学会全国大会(第29回)論文集
    • 発表場所
      公立はこだて未来大学(北海道函館市)
    • 年月日
      2015-05-30 – 2015-06-02
  • [備考] WC3(Wikipedia Category Consistency Checker)

    • URL

      http://wnews.ist.hokudai.ac.jp/wc3/

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi