• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

100億Webページ収集に基づくWebコンテンツの信頼性解析

研究課題

研究課題/領域番号 17KT0085
研究種目

基盤研究(B)

配分区分基金
応募区分特設分野
研究分野 情報社会におけるトラスト
研究機関早稲田大学

研究代表者

山名 早人  早稲田大学, 理工学術院, 教授 (40230502)

研究期間 (年度) 2017-07-18 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
18,590千円 (直接経費: 14,300千円、間接経費: 4,290千円)
2020年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2019年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2018年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2017年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
キーワードWebコンテンツ / 信憑性 / 信頼性 / フィッシング / Webクローラ / 検索エンジン / ビッグデータ
研究成果の概要

Webコンテンツの信頼性解析を目指して,Webページ収集クローラ(収集プログラム),Webページコンテンツ解析手法,Webコンテンツにアクセスすることなくコンテンツの安全性を推定する手法,従来のベンチマークの問題点の明確化と人間の判断思考に沿った信憑性解析,本分野研究活性化のためのWebページ信頼性解析研究のサーベイ公開に取り組んだ.特に,クローラでは従来手法に比較して10%の効率化,URLのみを用いて信憑性を判定できる仕組み(精度99.4%を達成)では,コンテンツへのアクセスをせずにURLのみでの判定を可能としたことから今後の実用化に向けて大きな成果を得ることができた.

研究成果の学術的意義や社会的意義

日々の暮らしに必要不可欠な存在となったWebコンテンツについて,その信頼性を判定する指標(判定手法)を考案することで,今後さらに巧妙となってくる信憑性・信頼性が低いWebコンテンツを自動判定する仕組みを構築することができた.構築された基盤技術を用いて今後ツールを構築していくことで,インターネット利用者が安心してWebコンテンツを利活用できる基盤を築くことができた.さらに,本分野の研究において欠くことのできないベンチマークの問題点を明らかにし,今後の本分野の研究のあり方を提言することができた.

報告書

(6件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (20件)

すべて 2022 2021 2020 2019 2018 2017 その他

すべて 国際共同研究 (1件) 雑誌論文 (8件) (うち国際共著 2件、 査読あり 8件、 オープンアクセス 2件) 学会発表 (11件)

  • [国際共同研究] カセサート大学(タイ)

    • 関連する報告書
      2018 実施状況報告書
  • [雑誌論文] A Survey on Explainable Fake News Detection2022

    • 著者名/発表者名
      Ken MISHIMA, Hayato YAMANA
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E105.D 号: 7 ページ: 1249-1257

    • DOI

      10.1587/transinf.2021EDR0003

    • ISSN
      0916-8532, 1745-1361
    • 年月日
      2022-07-01
    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Segmentation-based Phishing URL Detection2021

    • 著者名/発表者名
      Ent Sandi Aung, Hayato YAMANA
    • 雑誌名

      Proceedings of WI-IAT '21: IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology

      巻: 1 ページ: 550-556

    • DOI

      10.1145/3486622.3493983

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] URL-based Phishing Detection using the Entropy of Non-Alphanumeric Characters2019

    • 著者名/発表者名
      Eint Sandi Aung, Hayato Yamana
    • 雑誌名

      Proc. of the 21st International Conference on Information Integration and Web-based Applications & Services

      巻: 1 ページ: 385-392

    • DOI

      10.1145/3366030.3366064

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Effectiveness of Usability & Performance Features for Web Credibility Evaluation2019

    • 著者名/発表者名
      Kenta Yamada, Hayato Yamana
    • 雑誌名

      Proc. of IEEE BigData 2019

      巻: 1 ページ: 6257-6259

    • DOI

      10.1109/bigdata47090.2019.9006419

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Efficient Topical Focused Crawling Through Neighborhood Feature2018

    • 著者名/発表者名
      Tanaphol Suebchua, Bundit Manaskasemsak, Arnon Rungsawang, Hayato Yamana
    • 雑誌名

      New Generation Computing

      巻: 36-2 号: 2 ページ: 95-118

    • DOI

      10.1007/s00354-017-0029-8

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] External Content-dependent Features for Web Credibility Evaluation2018

    • 著者名/発表者名
      Kazuyoshi Ootani and Hayato Yamana
    • 雑誌名

      Proc. of IEEE BigData 2018

      巻: 1 ページ: 5314-5416

    • DOI

      10.1109/bigdata.2018.8622398

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] History-enhanced Focused Website Segment Crawler2018

    • 著者名/発表者名
      Tanaphol Suebchua, Bundit Manaskasemsak, Arnon Rungsawang, Hayato YAMANA
    • 雑誌名

      Proc. of IEEE the 32nd International Conference on Information Networking

      巻: - ページ: 80-85

    • DOI

      10.1109/icoin.2018.8343090

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] A Variable-Length Motifs Discovery Method in Time Series using Hybrid Approach2017

    • 著者名/発表者名
      Chaw Zan, Hayato YAMANA
    • 雑誌名

      Proc. of the 19th International Conference on Information Integration and Web-based Applications & Services

      巻: - ページ: 49-57

    • DOI

      10.1145/3151759.3151781

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり
  • [学会発表] Phishing URL Detection using Information-rich Domain and Path Features2021

    • 著者名/発表者名
      Eint Sandi Aung, Hayato Yamana
    • 学会等名
      第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)(日本データベース学会、電子情報通信学会、情報処理学会)
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 語彙の出現位置と頻度による文体類似度を用いた文章の執筆者数推定2021

    • 著者名/発表者名
      渡邉 充博, Eint Sandi Aung, 山名 早人
    • 学会等名
      第13回データ工学と情報マネジメントに関するフォーラム(DEIM2021)(日本データベース学会、電子情報通信学会、情報処理学会)
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Malicious URL detection : a survey2020

    • 著者名/発表者名
      Eint Sandi Aung, Hayato Yamana
    • 学会等名
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Webサイトのユーザビリティとパフォーマンスに注目した信頼性評価手法の提案2020

    • 著者名/発表者名
      山田健太, Eint Sandi Aung, 山名早人
    • 学会等名
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 文体変化と文体類似度を用いた文章の執筆者数推定2020

    • 著者名/発表者名
      渡邉充博, Eint Sandi Aung, 山名早人
    • 学会等名
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 日本語の文章を対象にした執筆者数推定2019

    • 著者名/発表者名
      塩浦尚久, 山名早人
    • 学会等名
      DEIM2019 第11回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 新聞記事における発言引用部分の特定手法および引用方法の分類手法の提案 -ファクトチェック支援への応用-2019

    • 著者名/発表者名
      山田健太, 真鍋智紀, 山名早人
    • 学会等名
      DEIM2019 第11回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Enhancing Focused Crawler through Genre Detection,2019

    • 著者名/発表者名
      Qian Jiayi, Tanaphol Suebchua, Hayato Yamana
    • 学会等名
      DEIM2019 第11回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] A Survey of URL-based Phishing Detection2019

    • 著者名/発表者名
      Eint Sandi Aung, Chaw Thet Zan, Hayato Yamana
    • 学会等名
      DEIM2019 第11回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] 特定分野における単語重要度CrRvの提案と和英短文を対象とした著者専門性推定への応用2018

    • 著者名/発表者名
      滝川 真弘, 山名 早人
    • 学会等名
      第10回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] 特定分野における単語重要度計算手法の提案と短い文章における著者の専門性推定への適応2017

    • 著者名/発表者名
      滝川 真弘, 山名 早人
    • 学会等名
      第233回自然言語処理研究会(情報処理学会)
    • 関連する報告書
      2017 実施状況報告書

URL: 

公開日: 2017-07-21   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi