2020 Fiscal Year Annual Research Report
Comprehensive research on content analysis and semi-automated content analysis for human values in texts
Project/Area Number |
18H03495
|
Research Institution | Kyushu University |
Principal Investigator |
石田 栄美 九州大学, 附属図書館, 准教授 (50364815)
|
Co-Investigator(Kenkyū-buntansha) |
冨浦 洋一 九州大学, システム情報科学研究院, 教授 (10217523)
福田 悟志 九州大学, システム情報科学研究院, 助教 (10817555)
大賀 哲 九州大学, 法学研究院, 准教授 (90445718)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 内容分析 / 人の価値観 / 分類器の適用 / コーディングの質向上 |
Outline of Annual Research Achievements |
テキスト自動分類器を用いたコーディングの質を上げるための方法を提案した。人によるコーディングは一貫性が保証されないことが指摘されている。コーディング結果を全て見直せば質は改善すると考えられるが、作業が2倍になってしまい効率的ではない。この問題を解消するために、分類器を用いて見直すべきコーディング結果を特定する方法を提案した。コーディングタスクは、社説が分析対象であるかどうかの2値の判定である(on/offトピック判定)。最初に、コーダーが対象社説をすべてコーディングし(第1ラウンド)、そのコーディング結果を用いて分類器(SVM)を学習した。次に、学習した分類器が同じ対象社説を判定し、分類器の結果と第1ラウンドの結果を比べた。この中で、分類器と第1ラウンドの結果が異なるものを選択し、改めて人がコーディングしなおした(第2ラウンド)。これらの結果を経験を積んだコーダーとの結果を比べたところ、第2ラウンドの結果を含めた結果の方が、経験を積んだコーダーの結果との一致率が高かった。初心者2名を含む3名で実験したが、全員、改善がみられた。本アプローチは、人のコーディング結果の改善に効率的な手法であることがわかった。 昨年度と同様、構築コストが異なる2種類の学習用データを用いて、on/offトピック判定と文への価値観付与タスクで、分類器の効率的な学習のための学習用データの選択アルゴリズムの開発を進めている。より高い性能を出すためにアルゴリズムの改善や計算量に関する改善を行った。 社会科学系の研究分担者・研究協力者で、「責任」についての価値観の変化を分析するためのコーディングルールを作成し、テストコーディングを行った。このテストコーディングをもとにコーディングルールとコーディングマニュアルを作成した。次年度はこれをもとにコーディングを行い、責任についての価値観変化の分析を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
コロナウイルス感染症拡大のため、年度当初にコーダーを雇うことができるか等について不透明な状況があったため、研究の遂行が一時滞ってしまった。また、学習用データの選択に関するアルゴリズムの開発や原発事故に関する社説の内容分析も進んではいるが、まとまった成果として出せる段階ではないため、このように判断した。
|
Strategy for Future Research Activity |
今後は、最終年度ということもあり、共同研究者と緊密に連絡を取りながら、研究を遂行し、本研究課題としての総括も行う。
|
Research Products
(2 results)