研究課題/領域番号 |
20K12559
|
研究機関 | 金沢大学 |
研究代表者 |
山本 洋 金沢大学, 国際機構, 教授 (50583168)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 戦国軍記 / 計量テキスト分析 / 軍書 / クラスター分析 / 固有表現抽出 |
研究実績の概要 |
令和四年度は、毛利関係戦国軍記および関ヶ原合戦関連軍書の翻刻作業をすすめると同時に、戦国軍記のテキストから人名・地名などの固有名詞を抽出するためのアルゴリズムについての検討を行った。 これまで本研究を通じて、戦国軍記を類型化する方法としてクラスター分析が有効であることを提起し、その分類基準には固有名詞、とりわけ人名・地名を用いることが有用であることを明らかにした。さらに戦国軍記の性質を効率的に把握する上でも、固有名詞は重要な品詞であり、人名の出現頻度や共起関係に着目することで詳細不明な軍記についてもある程度系統を把握することができることについても論じてきた。以上の結果は、本研究計画の当初の目的をおおよそ達成するものではあるが、戦国軍記のテキストから固有名詞を自動的に抽出する方法についての検討も必須であることが確認された。 そこで、本年度は人文情報学などの領域における先行研究の成果に学びながら、戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの作成を行い、情報処理学会で研究報告を行った(「戦国軍記のテキストからの人名抽出 」情報処理学会 第85回全国大会講演論文集)。すなわち、形態素解析とIF-THENルールを組み合わせた人名抽出により、成立年代や著者が不明な戦国軍記の2つのテキストを対象に人名抽出を試みた結果、約40~45%の確度で人名を抽出できることが確認された。しかし、一部の語を誤って人名と判定するケースや重複抽出するパターンもあるため、抽出精度を向上させるためにはさらなる条件式の追記や機械学習も視野にいれた検討が必要である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は人文情報学などの領域における先行研究の成果に学びながら、戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの作成を行い、情報処理学会で研究報告を行った(「戦国軍記のテキストからの人名抽出 」情報処理学会 第85回全国大会講演論文集)。また毛利関係戦国軍記二点(『中国治乱記』・『毛利記』)をフルテキスト化しデジタル書籍として公開した。
|
今後の研究の推進方策 |
最終年度は、史料調査および翻刻作業を継続しつつ、新たに得られたテキストを対象に本手法の有効性の検証を引き続き行いながら、得られた成果を学会・研究会、論文などで発表していきたい。
|
次年度使用額が生じた理由 |
新型コロナのため当初予定していた史料調査を2020年、2021年に行うことができなかったため、期間を延長したことにより次年度使用額が生じた。
|