• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

Webページの大域的・局所的特徴の可視化による情報信頼性の判断支援方式の研究

研究課題

研究課題/領域番号 17K00429
研究機関兵庫県立大学

研究代表者

湯本 高行  兵庫県立大学, 工学研究科, 助教 (20453152)

研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード情報信頼性 / ウェブインテリジェンス
研究実績の概要

(1) 2018年度に開発した文の典型性の推定手法では,語ごとに頻度に基づいて典型性を推定し,その平均値を用いていた.2019年度は,語の出現頻度を補正することによってこの手法の改良を行った.具体的には,同義語の出現頻度の反映,類似する高頻度の語への置き換え,使用するデータベースの変更,共起しない語に対するスムージングを検討した.同義語の出現頻度の反映では,Wikipediaで同一の記事にリンクしているアンカー文字列を同義語として扱い,元の語の出現数および共起数に同義語の出現数および共起数を加えたものを用いた.また,類似する高頻度の語への置き換えでは,出現頻度の低い語については語の共起数も少なくなるため,共起に基づいて語の関連性を把握することが困難であるため,類似する高頻度の語に置き換えたうえで典型度を算出するものである.語の類似度の算出には,日本語Wikipediaエンティティベクトルのコサイン類似度を用いた.これらの手法により,低頻度の語を含む文においては典型性の推定精度が向上した.
(2) 情報の発信者の特徴表現とそれを抽出する手法を開発した.この手法では,主にツイートを対象とし,ツイート中に出現する名詞が表すエンティティを Wikipedia の記事に紐付け,記事毎のカテゴリ情報を集計することで,ツイートの特徴表現を作成する.発信者のすべてのツイートに対して集計し,発信者の特徴表現を行う.

  • 研究成果

    (4件)

すべて 2020 2019

すべて 学会発表 (4件)

  • [学会発表] 類似工場推薦のための特徴表現2020

    • 著者名/発表者名
      服部雄也,湯本高行, 芦田真一, 井上直樹,礒川悌次郎,上浦尚武
    • 学会等名
      第12回データ工学と情報マネジメントに関するフォーラム
  • [学会発表] Wikipediaのカテゴリ情報を用いたツイート発信者の特徴表現2019

    • 著者名/発表者名
      中谷将佳史,湯本高行,礒川悌次郎,上浦尚武
    • 学会等名
      情報処理学会第169回データベースシステム研究発表会
  • [学会発表] 構文木と専門用語辞書を用いた医学論文からの未知用語の発見2019

    • 著者名/発表者名
      吉田恭輔,湯本高行,金子周司,礒川悌次郎,上浦尚武
    • 学会等名
      情報処理学会第169回データベースシステム研究発表会
  • [学会発表] QAサイトでの共起に基づく患者の自覚症状入力支援2019

    • 著者名/発表者名
      新本拓也,湯本高行,金子周司,礒川悌次郎,松井伸之,上浦尚武
    • 学会等名
      情報処理学会第170回データベースシステム研究発表会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi