• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

Efficient Text Big Data Mining Technology via Structure Extraction

Research Project

Project/Area Number 19H01133
Research InstitutionNational Institute of Informatics

Principal Investigator

宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)

Co-Investigator(Kenkyū-buntansha) 小林 亮太  国立情報学研究所, 情報学プリンシプル研究系, 助教 (70549237)
久保山 哲二  学習院大学, 付置研究所, 教授 (80302660)
橋本 隆子  千葉商科大学, 商経学部, 教授 (80551697)
申 吉浩  学習院大学, 付置研究所, 教授 (60523587)
Project Period (FY) 2019-04-01 – 2024-03-31
Keywordsソーシャルメディア分析 / クラスタリング / アルゴリズム / 多様性 / 形質
Outline of Annual Research Achievements

本年度は、ソーシャルメディア上の議論の動きやデマ、ヘイトなど、大きな偏りを持った動きが、実際どのような変遷を経ておこってきたのか、そのさいに、形質上の特徴がどのようなものであったかを、具体的な例を精査して調査研究するために、まず、このような群衆行動がおこる構造の面の知見が豊富な社会心理学の概念を調査し、それをSNS上の動きや形質との対応を見ることで分析を行った。デマ流布については、この課題の着想に至った原点である、情報源が単一であることによる多様性の低下という観察があったが、その他にも、媒介する投稿者たちの興味の低さが関係していそうだということが観察された。また、ヘイトについては、単なる嫌悪感情だけでなく、公正世界仮説に基づく行動が行われているようであることも観察された。これらがもたらす形質の変化は、使用する単語が初等的になる、意味的に類似するクラスタがありそうだなどの観察を得た。
これらをもとにした簡潔なモデルをマイクロクラスタリングを使ってアルゴリズムとして実装し、計算実験を行った。結果を観察すると、実際に頻度の高い単語の共通性が高いクラスタ群が観察され、モデルの方向性の正しさを検証することができた。今後はこのモデルのさらなる改良、安定化を行っていく。
招聘予定であった北米の David Shepard 氏は、コロナ禍のため実現が不可能となり、予算を繰り越して2020年度に延期した。しかし20年度もコロナ禍は収束せず、結局招聘はとりやめた。代わりに、メールなどによる議論と、日本側での調査実装により、Webからのテキストデータの収集ツールを構築し、プログラムとして実装した。
同時に、マイニング計算の基礎となる離散アルゴリズムについても、いくつかの新しい成果を得ることに成功した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の計画通り、SNS上で観察される群衆行動を観察し、その形質をモデル化することが進んでいる。特に、社会心理学の知見をふまえた観察によって、公正世界仮説に基づく誹謗中傷など、新たな考察と、それが導くSNSの様相の特徴を得ることができている。
データ取得においても、データ取得手法とノウハウの調査が完了するとともに、ツールの作成が終了し、データ取得が進められる状況となっている。
アルゴリズム面においても、基礎となる離散アルゴリズムやデータマイニングアルゴリズムの開発が進んでいる。

Strategy for Future Research Activity

多様性をクラスタで測るモデルをより一層深め、より安定的に物事を測れるようなモデルを開発する。現在のモデルはパラメータ依存の面があるため、これを排除するか、あるいは影響を少なくするようなものが必要である。また、時系列上での多様性の推移を可視化するモデルや、時系列データのクラスタリングを用いた分析を行うことでトピックの可視化を行う手法についても開発を行っていく。
また、これらの開発したモデルをより高性能な形で実装しテイクとともに、より大きなデータの解析を進め、その効果を検証し議論して、SNS上での群衆の作り出す文書集合の形質を明らかにする。特に、典型的な事例について、どのような事象が起きているのかを形質の面から分類できるような手法を目指し、観察と考察を行い、それらを手掛かりにモデルとアルゴリズムを開発する。

  • Research Products

    (19 results)

All 2020 2019

All Journal Article (19 results) (of which Int'l Joint Research: 5 results,  Peer Reviewed: 12 results,  Open Access: 7 results)

  • [Journal Article] Twitter Topic Progress Visualization using Micro-clustering2020

    • Author(s)
      Takako Hashimoto, Akira Kusaba, Dave Shepard, Tetsuji Kuboyama, Kilho Shin, Takeaki Uno
    • Journal Title

      Proceedings of the 9th International Conference on Pattern Recognition Applications and Methods (ICPRAM 2020)

      Volume: Volume 1 Pages: 585-592

    • DOI

      10.5220/0009160805850592

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] 狭い16ビットのスケッチを用いた高速最近傍検索2020

    • Author(s)
      樋口直哉, 今村安伸, 久保山哲二, 平田耕一, 篠原武
    • Journal Title

      情報処理学会論文誌数理モデル化と応用 (TOM)

      Volume: 13(1) Pages: 13-22

  • [Journal Article] A Fast Algorithm for Unsupervised Feature Value Selection2020

    • Author(s)
      Kilho Shin, Kenta Okumoto, David Lawrence Shepard, Tetsuji Kuboyama, Takako Hashimoto, Hiroaki Ohshima
    • Journal Title

      Proceedings of the 12th International Conference on Agents and Artificial Intelligence, ICAART (2)

      Volume: 12 Pages: 203-213

    • DOI

      10.5220/0008981702030213

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] データ研磨アルゴリズムの挙動と収束性の解析2020

    • Author(s)
      宇野毅明
    • Journal Title

      第177回情報処理学会アルゴリズム研究会

      Volume: 177 Pages: -

  • [Journal Article] 同型性の利用によるデータ研磨アルゴリズムの高速化手法2020

    • Author(s)
      宇野毅明
    • Journal Title

      第177回情報処理学会アルゴリズム研究会

      Volume: 177 Pages: -

  • [Journal Article] アピアランスを用いたクラスタリングにおける確信度の評価手法と実データによる検証2020

    • Author(s)
      岩﨑 幸子, 宇野 毅明
    • Journal Title

      人工知能学会 第112回人工知能基本問題研究会

      Volume: 112 Pages: -

  • [Journal Article] クラスタリング安定化手法を用いた芯クラスタの抽出と実データによる質の評価2020

    • Author(s)
      岩﨑 幸子, 宇野 毅明
    • Journal Title

      人工知能学会 第112回人工知能基本問題研究会

      Volume: 112 Pages: -

  • [Journal Article] Mrmr+ and Cfs+ feature selection algorithms for high-dimensional data.2019

    • Author(s)
      Adrian Pino Angulo, Kilho Shin
    • Journal Title

      Applied Intelligence

      Volume: 49 Pages: 1954-1967

    • DOI

      10.1007/s10489-018-1381-1

    • Peer Reviewed
  • [Journal Article] Prediction of Crime Occurrence using Information Propagation Model and Gaussian Process2019

    • Author(s)
      Shusuke Morimoto, Hajime Kawamukai, Kilho Shin
    • Journal Title

      14th AsiaJCIS 2019

      Volume: 14 Pages: 80-87

    • DOI

      10.1109/AsiaJCIS.2019.000-2

    • Peer Reviewed
  • [Journal Article] Neural Networks Weights Quantization: Target None-retraining Ternary (TNT)2019

    • Author(s)
      Tianyu Zhang, Lei Zhu, Qian Zhao, Kilho Shin
    • Journal Title

      CoRR, December 2019

      Volume: - Pages: -

  • [Journal Article] Reconstructing Neuronal Circuitry from Parallel Spike Trains2019

    • Author(s)
      Kobayashi R, Kurita S, Kurth A, Kitano K, Mizuseki K, Diesmann M, Richmond BJ, Shinomoto S
    • Journal Title

      Nature Communications

      Volume: 10 Pages: 4468

    • DOI

      10.1038/s41467-019-12225-2

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Adaptive integrate-and-fire model reproduces the dynamics of olfactory receptor neuron responses in moth2019

    • Author(s)
      Levakova M, Kostal L, Monsempes C, Lucas P, Kobayashi R
    • Journal Title

      Journal of The Royal Society Interface

      Volume: 16 Pages: 20190246

    • DOI

      10.1098/rsif.2019.0246

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Critical size of neural population for reliable information transmission2019

    • Author(s)
      Kostal L, Kobayashi R
    • Journal Title

      Physical Review E

      Volume: 100 Pages: 050401(R)

    • DOI

      10.1103/PhysRevE.100.050401

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Annealing by Increasing Resampling2019

    • Author(s)
      Naoya Higuchi, Yasunobu Imamura, Takeshi Shinohara, Kouichi Hirata, Tetsuji Kuboyama
    • Journal Title

      ICPRAM (Revised Selected Papers)

      Volume: 11996 Pages: 71-92

    • DOI

      10.1007/978-3-030-40014-9_4

    • Peer Reviewed / Open Access
  • [Journal Article] Using Label Information in a Genetic Programming Based Method for Acquiring Block Preserving Outerplanar Graph Patterns with Wildcards2019

    • Author(s)
      Fumiya Tokuhara, Shiho Okinaga, Tetsuhiro Miyahara, Yusuke Suzuki, Tetsuji Kuboyama, Tomoyuki Uchida
    • Journal Title

      2019 IEEE 11th International Workshop on Computational Intelligence and Applications (IWCIA)

      Volume: 11 Pages: 95-100

    • DOI

      10.1109/IWCIA47330.2019.8955031

    • Peer Reviewed / Open Access
  • [Journal Article] Fast Filtering for Nearest Neighbor Search by Sketch Enumeration Without Using Matching2019

    • Author(s)
      Naoya Higuchi, Yasunobu Imamura, Tetsuji Kuboyama, Kouichi Hirata, Takeshi Shinohara
    • Journal Title

      Australasian Conference on Artificial Intelligence

      Volume: LNCS 11919 Pages: 240-252

    • DOI

      10.1007/978-3-030-35288-2_20

    • Peer Reviewed / Open Access
  • [Journal Article] Time Series Electricity Consumption Analysis using Non-negative Matrix Factorization2019

    • Author(s)
      Akira Kusaba, Tetsuji Kuboyama, Takako Hashimoto
    • Journal Title

      IEEE 10th International Conference on Awareness Science and Technology (iCAST)

      Volume: 10 Pages: 1-6

    • DOI

      10.1109/ICAwST.2019.8923311

    • Peer Reviewed
  • [Journal Article] Time Series Topic Transition Based on Micro-Clustering2019

    • Author(s)
      Takako Hashimoto, Takeaki Uno, Tetsuji Kuboyama, Kilho Shin, Dave Shepard
    • Journal Title

      Proceedings of IEEE International Conference on Big Data and Smart Computing, BigComp 2019

      Volume: - Pages: 1-8

  • [Journal Article] New polynomial delay bounds for maximal subgraph enumeration by proximity search2019

    • Author(s)
      Alessio Conte,Takeaki Uno
    • Journal Title

      Proceedings of the 51st Annual ACM SIGACT Symposium on Theory of Computing, STOC 2019

      Volume: 51 Pages: 1179-1190

    • DOI

      10.1145/3313276.3316402

    • Peer Reviewed

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi