• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Efficient Text Big Data Mining Technology via Structure Extraction

Research Project

Project/Area Number 19H01133
Research InstitutionNational Institute of Informatics

Principal Investigator

宇野 毅明  国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)

Co-Investigator(Kenkyū-buntansha) 小林 亮太  東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
久保山 哲二  学習院大学, 付置研究所, 教授 (80302660)
橋本 隆子  千葉商科大学, 商経学部, 教授 (80551697)
Project Period (FY) 2019-04-01 – 2024-03-31
Keywordsソーシャルメディア分析 / クラスタリング / 多様性 / アルゴリズム / 形質
Outline of Annual Research Achievements

単語の多様性からテキストの多様性や類似性を図る方法を開発した。2つのテキストの多様性と、2つのテキストを合わせたときの多様性を評価することで、両者の異なりの大きさから距離のようなものを導きだし、文書集合に対してある程度直感的な類似性を図る方法を構築した。実際のニュースのコメントデータに対する適用で、直感的な観察とこの手法による類似度がおおまかに一致することが見て取れること、あらたな観点からコメントの構造に関する示唆が与えられることが確認できた。
また、形質的なアプローチから、選挙公報の解析と、誹謗中傷の語りのデータの解析を行った。前者は、選挙における候補者のメッセージングがどの程度紋切り型、中央集権的かを解釈する上での参考となり得るものであり、後者は誹謗中傷というある種定義がしにくいものがどのような形質を持っているかを解析したものであり、ある種の定量化に成功している。
また、形質的な方向からコロナ禍におけるワクチンに対する人々の反応や受容を、形質という情報学的な構造を文学の読みと意図推察の技術を用いて解析する、という新しいタイプの研究を行った。ここからは、人々の受容の、今までとらえられていなかった新しい解釈が導出されるなど。大きな進展を見ることができた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

形質によるテキストデータ解析の技術が順調に進んでいる。単語の多様性から類似性を評価する方法も開発が行われ、形質を他の定量化の尺度として利用する方向性からアプローチする方法論を構築しつつある。クラスタリングによる形質の方向からの技術開発も評価されており、国際会議において招待チュートリアルを行っている。
また、形質的なアプローチから、選挙公報の解析と、誹謗中傷の語りのデータの解析ができており、応用方向への進展が確実に進んでいる。選挙においても、誹謗中傷においても、人々の反応を形質のほうからある程度の定量化に成功しており、確実に今までの限界を少しずつ突破する研究を生み出せていると考えている。特にコロナ禍のワクチンに関するツイート解析においては、今までにない形での知見の導出に成功しており、新しい形の研究を拓けていると考えている。

Strategy for Future Research Activity

計画は順調に進んでいるので、この方向性を保持した、形質に基づくテキスト解析のアプローチをより進めていくとともに、誹謗中傷や選挙などの応用分野への展開を目指す。また、多様性やクラスタ構造を元にした形質からの他のタスクへの展開を進めていき、キーワードや重要単語の抽出などを形質の面からモデル化していくような研究を目指す。

  • Research Products

    (33 results)

All 2023 2022 Other

All Int'l Joint Research (5 results) Journal Article (13 results) (of which Peer Reviewed: 11 results) Presentation (13 results) (of which Invited: 5 results) Book (1 results) Funded Workshop (1 results)

  • [Int'l Joint Research] Ghent University(ベルギー)

    • Country Name
      BELGIUM
    • Counterpart Institution
      Ghent University
  • [Int'l Joint Research] the Institute of Physiology(チェコ)

    • Country Name
      CZECH
    • Counterpart Institution
      the Institute of Physiology
  • [Int'l Joint Research] Oxford university(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      Oxford university
  • [Int'l Joint Research] Universite; di Pisa/University; degli Studi di Firenze(イタリア)

    • Country Name
      ITALY
    • Counterpart Institution
      Universite; di Pisa/University; degli Studi di Firenze
  • [Int'l Joint Research] Universite Clemont Auvergne(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      Universite Clemont Auvergne
  • [Journal Article] 発話行動分析に基づく共食会話の心理的効果の一考察―銘々膳形式と共同膳形式の比較から―2023

    • Author(s)
      徳永弘子, 久保山哲二, 木村敦, 武川直樹
    • Journal Title

      電子情報通信学会論文誌

      Volume: J106-A-3 Pages: 104-113

    • Peer Reviewed
  • [Journal Article] Spike frequency adaptation facilitates the encoding of input gradient in insect olfactory projection neurons2023

    • Author(s)
      Lee Hayeong、Kostal Lubomir、Kanzaki Ryohei、Kobayashi Ryota
    • Journal Title

      Biosystems

      Volume: 223 Pages: 104802~104802

    • DOI

      10.1016/j.biosystems.2022.104802

    • Peer Reviewed
  • [Journal Article] An extended Hilbert transform method for reconstructing the phase from an oscillatory signal2023

    • Author(s)
      Matsuki Akari、Kori Hiroshi、Kobayashi Ryota
    • Journal Title

      Scientific Reports

      Volume: 13 Pages: -

    • DOI

      10.1038/s41598-023-30405-5

  • [Journal Article] Using Label Information in a Genetic Programming Based Method for Acquiring Tag Tree Patterns with Vertex Labels and Wildcards2022

    • Author(s)
      S. Yokoyama, T. Miyahara, Y. Suzuki, T. Uchida and T. Kuboyama
    • Journal Title

      Proc. of 11th International Congress on Advanced Applied Informatics

      Volume: 81 Pages: 418-428

    • Peer Reviewed
  • [Journal Article] Estimating asymptotic phase and amplitude functions of limit-cycle oscillators from time series data2022

    • Author(s)
      Namura N, Takata S, Yamaguchi K, Kobayashi R, and Nakao H
    • Journal Title

      Physical Review E

      Volume: 106 Pages: -

    • Peer Reviewed
  • [Journal Article] Evolution of Public Opinion on COVID-19 Vaccination in Japan: Large-Scale Twitter Data Analysis2022

    • Author(s)
      Kobayashi Ryota、Takedomi Yuka、Nakayama Yuri、Suda Towa、Uno Takeaki、Hashimoto Takako、Toyoda Masashi、Yoshinaga Naoki、Kitsuregawa Masaru、Rocha Luis E C
    • Journal Title

      Journal of Medical Internet Research

      Volume: 24 Pages: e41928~e41928

    • DOI

      10.2196/41928

    • Peer Reviewed
  • [Journal Article] Survival Information Science: Evolving Informatics for Well-Being of Humanity and Society2022

    • Author(s)
      HASHIMOTO Takako、NADAMOTO Akiyo
    • Journal Title

      TRENDS IN THE SCIENCES

      Volume: 27 Pages: 5_77~5_82

    • DOI

      10.5363/tits.27.5_77

  • [Journal Article] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022

    • Author(s)
      武富有香, 松田智裕, 須田永遠, 宇野毅明
    • Journal Title

      人文科学とコンピュータシンポジウム論文集

      Volume: - Pages: 213-220

    • Peer Reviewed
  • [Journal Article] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022

    • Author(s)
      宇野毅明, 武富有香, 小林亮太, 橋本隆子, 久保山哲二, 申吉浩
    • Journal Title

      人文科学とコンピュータシンポジウム論文集

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022

    • Author(s)
      Yuka Takedomi, Towa Suda, Kazuhiro Kurita, Ryota Kobayashi, Tomohiro Matsuda, Takeaki Uno
    • Journal Title

      Digital Humanities Conference 2022

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Using Temporal Information on Topic Mining2022

    • Author(s)
      Takeaki Uno, Ryota Kobayashi, Yuka Takedomi, Takako Hashimoto
    • Journal Title

      Digital Humanities Conference 2022

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Proximity Search for Maximal Subgraph Enumeration2022

    • Author(s)
      Conte Alessio、Grossi Roberto、Marino Andrea、Uno Takeaki、Versari Luca
    • Journal Title

      SIAM Journal on Computing

      Volume: 51 Pages: 1580~1625

    • DOI

      10.1137/20M1375048

    • Peer Reviewed
  • [Journal Article] マイクロクラスタリングを用いた選挙公報テキスト分析2022

    • Author(s)
      杉山, 佳奈美, 久保山, 哲二, 三輪, 洋文, 宇野, 毅明
    • Journal Title

      じんもんこん2022論文集

      Volume: - Pages: 289-294

    • Peer Reviewed
  • [Presentation] スケッチを用いた検索における2段階フィルタリングの有効性の検証2023

    • Author(s)
      樋口直哉, 今村安伸, 篠原武, 平田耕一, 久保山哲二
    • Organizer
      人工知能基本問題研究会
  • [Presentation] ラッセル『西洋哲学史』における各章の語彙分布・章同士の関係の分析2023

    • Author(s)
      占部雄大, 前山和喜, 須田永遠
    • Organizer
      情報処理学会第85回全国大会
  • [Presentation] 大規模Twitterデータを用いた新型コロナワクチン接種に関する世論変化の分析2023

    • Author(s)
      武富有香,中山悠理,須田永遠,宇野毅明,橋本隆子,豊田正史,吉永直樹,喜連川優,Luis E C Rocha,小林亮太
    • Organizer
      情報処理学会第85回全国大会
  • [Presentation] ラベル情報を利用した進化的学習による複合的なワイルドカード付きタグ木パターンの獲得2022

    • Author(s)
      宮原哲浩, 鈴木祐介, 久保山哲二, 内田智之
    • Organizer
      工知能学会全国大会
  • [Presentation] Modeling spike frequency adaptation of a neuron and its potential role for sensory coding2022

    • Author(s)
      Ryota Kobayashi
    • Organizer
      Minisymposium “Stochastic models for neuronal activity” in ICMNS 2022
    • Invited
  • [Presentation] Estimating synaptic connectivity from parallel spike train2022

    • Author(s)
      Ryota Kobayashi
    • Organizer
      Workshop in Ghent university
    • Invited
  • [Presentation] Network inference from time series2022

    • Author(s)
      Ryota Kobayashi
    • Organizer
      Workshop: Networks of spiking neurons
    • Invited
  • [Presentation] Structuring Topics on Large-Scale Social Media for Discovering People's Perceptions2022

    • Author(s)
      Takako Hashimoto
    • Organizer
      2022 IEEE Pune Section International Conference (PuneCon)
  • [Presentation] Discovering People‘s Perceptions from Twitter Case Study on COVID-19 Vaccine and the East Japan Great Earthquake2022

    • Author(s)
      Takako Hashimoto
    • Organizer
      Sensors for Medical Applications and Healthcare
    • Invited
  • [Presentation] 複数テキストの利用による問いの広がりと深まり(批判的思考、創造的思考の育成を目指して)2022

    • Author(s)
      松下達彦, 藤永清乃, 須田永遠, 武富有香, 江頭由美, 柿山礼美, 片山智子, 行田悦子
    • Organizer
      日本リメディアル教育学会第17回全国大会 日本語部会
  • [Presentation] 問いの循環による複数テキストの批判的統合:言語クラスにおける授業方法と教材の開発2022

    • Author(s)
      松下達彦, 藤永清乃, 江頭由美, 柿山礼美, 片山智子, 行田悦子, 須田永遠, 武富有香
    • Organizer
      「未来を創ることばの教育をめざして、内容重視の批判的言語教育のその後」第2回シンポジウム
  • [Presentation] Utility of Clustering algorithms in Social Media Analysis2022

    • Author(s)
      Takeaki Uno
    • Organizer
      IEEE Big Data 2022
    • Invited
  • [Presentation] 思想史ネットワーク分析/SNS解析のための日本語文体論の試みについて2022

    • Author(s)
      須田永遠
    • Organizer
      フランス現象学研究会
  • [Book] AI新世: 人工知能と人類の行方2022

    • Author(s)
      小林 亮太, 篠本 滋, 監修: 甘利 俊一
    • Total Pages
      288
    • Publisher
      文藝春秋
  • [Funded Workshop] Workshop on Stochastic processes and their applications2022

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi