2023 Fiscal Year Research-status Report
Project/Area Number |
20K12559
|
Research Institution | Kanazawa University |
Principal Investigator |
山本 洋 金沢大学, 国際機構, 教授 (50583168)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 戦国軍記 / 計量テキスト分析 / 軍書 / 固有表現抽出 / 自然言語処理 / クラスター分析 |
Outline of Annual Research Achievements |
令和五年度は、①関ヶ原合戦および大坂の陣関連の軍記・軍書などの調査、撮影、テキスト化作業、②前年度に作成した人名抽出のアルゴリズムの抽出精度を高めるための検証作業、③軍記関連学会での研究報告を行った。 ①福岡県立図書館、名古屋市蓬左文庫、東京都立図書館、明治大学図書館、名古屋市鶴舞中央図書館において関ヶ原合戦および大坂の陣関連の軍記・軍書の調査・撮影を行い、毛利関係戦国軍記十二点および「難波戦記」のフルテキスト化作業を行った。(なお、「難波戦記」のテキスト化作業については報告者が研究分担者を務めている他の科研費と共同で実施し、 テキストデータをすでに公開している。) ②pythonを用いた形態素解析とIF-THENルールを組み合わせた人名抽出のためのアルゴリズムに、戦国軍記のテキストの特徴を考慮した条件文をさらに追加するとともに、誤抽出の割合を低下させるための「無視リスト」を組み込む事で、人名の抽出精度を高めた。現時点で、12000~15000字程度の毛利関係戦国軍記を対象とした場合、おおよそ70%から80%ほどの人名を自動的に抽出することが可能となっている。しかしながら、生成系AIの一つであるChatGPT4を用いた人名抽出は、報告者のモデルや機械学習をベースとしたモデルより抽出精度が高いケースが間々あるため、今後はルールベースのアルゴリズムのさらなる改良を進めるだけでなく、生成系AIを組み込んだアルゴリズムについても検討が必要であると考えている。 ③関西軍記物語研究会において、「戦国軍記研究へのAIの応用―人名抽出アルゴリズムの開発とその評価―」と題した研究報告を行った。また、その後の進捗等も含めた本研究の成果を、2024年6月に開催される台湾で開催される” International Symposium on Science and Education”において報告予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの改良作業を進めると同時に、軍記関連学会において「戦国軍記研究へのAIの応用―人名抽出アルゴリズムの開発とその評価―」という題目で研究報告を行った。また、毛利関係戦国軍記十二点および「難波戦記」のフルテキスト化作業も進めた。
|
Strategy for Future Research Activity |
最終年度は、新たにテキスト化した軍記も含め、現在開発中のアルゴリズムの精度を高めつつ、得られた成果を学会・研究会、論文などで発表していきたい。
|
Causes of Carryover |
新型コロナのため当初予定していた史料調査を2020年、2021年に行うことができなかったことから、それ以降の予定に変更が生じたため。
|