Project/Area Number |
20K12559
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Kanazawa University |
Principal Investigator |
山本 洋 金沢大学, 国際機構, 教授 (50583168)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | 戦国軍記 / 計量テキスト分析 / 軍書 / 固有表現抽出 / 自然言語処理 / クラスター分析 / テキストマイニング / 軍記 / 近世軍書 / 毛利氏 |
Outline of Research at the Start |
本研究は、テキストマイニングを用いた量的な研究手法を用いて、成立背景や著者すら分かっていない戦国軍記の性質を明らかにするための新たな研究手法を確立することを目的とする。具体的には、毛利関係戦国軍記を対象に、現存するすべての戦国軍記をフルテキストデータ化し、それらをもとに形態素解析やクラスター分析等の計量テキスト分析を用いることで、客観的かつ量的データに基づいて戦国軍記の性質を明らかにしていく。量的アプローチによって得られた結果は、従来の先行研究や申請者が行ってきた質的研究方法による研究成果と照合することで、本方法の妥当性・有効性を検証しつつ、最適な手法を確立していく。
|
Outline of Annual Research Achievements |
令和五年度は、①関ヶ原合戦および大坂の陣関連の軍記・軍書などの調査、撮影、テキスト化作業、②前年度に作成した人名抽出のアルゴリズムの抽出精度を高めるための検証作業、③軍記関連学会での研究報告を行った。 ①福岡県立図書館、名古屋市蓬左文庫、東京都立図書館、明治大学図書館、名古屋市鶴舞中央図書館において関ヶ原合戦および大坂の陣関連の軍記・軍書の調査・撮影を行い、毛利関係戦国軍記十二点および「難波戦記」のフルテキスト化作業を行った。(なお、「難波戦記」のテキスト化作業については報告者が研究分担者を務めている他の科研費と共同で実施し、 テキストデータをすでに公開している。) ②pythonを用いた形態素解析とIF-THENルールを組み合わせた人名抽出のためのアルゴリズムに、戦国軍記のテキストの特徴を考慮した条件文をさらに追加するとともに、誤抽出の割合を低下させるための「無視リスト」を組み込む事で、人名の抽出精度を高めた。現時点で、12000~15000字程度の毛利関係戦国軍記を対象とした場合、おおよそ70%から80%ほどの人名を自動的に抽出することが可能となっている。しかしながら、生成系AIの一つであるChatGPT4を用いた人名抽出は、報告者のモデルや機械学習をベースとしたモデルより抽出精度が高いケースが間々あるため、今後はルールベースのアルゴリズムのさらなる改良を進めるだけでなく、生成系AIを組み込んだアルゴリズムについても検討が必要であると考えている。 ③関西軍記物語研究会において、「戦国軍記研究へのAIの応用―人名抽出アルゴリズムの開発とその評価―」と題した研究報告を行った。また、その後の進捗等も含めた本研究の成果を、2024年6月に開催される台湾で開催される” International Symposium on Science and Education”において報告予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの改良作業を進めると同時に、軍記関連学会において「戦国軍記研究へのAIの応用―人名抽出アルゴリズムの開発とその評価―」という題目で研究報告を行った。また、毛利関係戦国軍記十二点および「難波戦記」のフルテキスト化作業も進めた。
|
Strategy for Future Research Activity |
最終年度は、新たにテキスト化した軍記も含め、現在開発中のアルゴリズムの精度を高めつつ、得られた成果を学会・研究会、論文などで発表していきたい。
|