2023 Fiscal Year Annual Research Report
Efficient Text Big Data Mining Technology via Structure Extraction
Project/Area Number |
19H01133
|
Research Institution | National Institute of Informatics |
Principal Investigator |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
|
Co-Investigator(Kenkyū-buntansha) |
小林 亮太 東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | ソーシャルメディア分析 / クラスタリング / 多様性 / アルゴリズム / 形質 |
Outline of Annual Research Achievements |
前年度開発した、形質的アプローチから人文学的な手法による解釈を加えてテキストデータを分析する手法をさらに展開した。これにより、さらなる深い解析や仮説の導出が行えるようになり、コロナ禍における社会の新たな側面に関する仮説を導き出すことができた。また、仮説をいくつもの根拠から支持するという、人文学の論拠手法を情報学の形に焼き直した記述方法を開発し、この記述方法でこれらの仮説を記述することができた。
形質の利用を行う新たなデータ解析アルゴリズムも構築した。ツイートやコメントの集合のような、短文が大量に集まるデータから効果的にキーワードを抽出する方法は、今まで決定打となるものはなかったが、今回クラスタ構造を用いて、局所的にキーワード性が高い単語を集めてくると言う新しいアプローチにより、直感的に納得度が高いと考えられるキーワード群を抽出するアルゴリズムを構築した。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] Optimal LZ-End Parsing Is Hard2023
Author(s)
Hideo Bannai ORCID-Logo, Mitsuru Funakoshi ORCID-Logo, Kazuhiro Kurita ORCID-Logo, Yuto Nakashima ORCID-Logo, Kazuhisa Seto ORCID-Logo, Takeaki Uno
-
Journal Title
CPM2022
Volume: -
Pages: 3-11
DOI
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-