2021 Fiscal Year Annual Research Report
Comprehensive research on content analysis and semi-automated content analysis for human values in texts
Project/Area Number |
18H03495
|
Research Institution | Kyushu University |
Principal Investigator |
石田 栄美 九州大学, データ駆動イノベーション推進本部, 教授 (50364815)
|
Co-Investigator(Kenkyū-buntansha) |
冨浦 洋一 九州大学, システム情報科学研究院, 教授 (10217523)
福田 悟志 中央大学, 理工学部, 助教 (10817555)
大賀 哲 九州大学, 法学研究院, 准教授 (90445718)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | バンデットアルゴリズム / 効率的な学習用集合の分析 / 価値観フレームの構築支援 |
Outline of Annual Research Achievements |
主に以下の2つの方向性で研究を行った。 内容分析の半自動化に向けた手法の中で、分類器のための学習用データ作成に関して、強化学習の観点から限られた予算の中で逐次的になるべく高性能な分類器を構築するためのデータセットのコーディング戦略を提案した。2名のコーダーを雇うという条件において、1) コーダーAが未コーディングのテキストにコーディング、2) コーダーBが未コーディングのテキストにコーディング、3) コーダーBがコーディングしたテキストにコーダーAがコーディングを行い、その後コーダー間で合議、4)は3)の逆のという4種類のコーディング方法を設定した。各方法を「アーム」とみなし、ε-greedyアルゴリズムに基づくバンディットアルゴリズムにより、次のコーディングにおいて分類性能が向上する可能性が高いアームを選択していく手法である。実験では、既定の6種類の各価値観に対するデータセット作成タスクを設定し、いずれの価値観においても概ね逐次的に品質の高いデータセットを作成できることを示した。 また、価値観は時代の流れとともに変化することを想定し、新たな価値観ラベルの発見を支援するための方法を検討した。先行研究で構築したデータセットを用いて分類器を構築し、ラベル付けされていない文集合に、Bertopicを用いてトピック分析を行った。先行研究でラベル付け対象とした年以降の社説集合に対して上記のアプローチを適用し、獲得した分析結果が、新たな価値観ラベルの発見に有効かどうか検討した。さらに、事前に定義されたラベル自体の分析や高度な内容分析目指して、トピック分析技術を用いて、価値観ラベルに内在するトピックを解析した。価値観ラベルによってトピックの推移は異なっており、一部の価値観ラベルにおいて、年によって多いトピックや一定の割合で定常的に推移しているトピックがあることがわかった。
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|
Research Products
(4 results)