研究課題/領域番号 |
20K12559
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 金沢大学 |
研究代表者 |
山本 洋 金沢大学, 国際機構, 教授 (50583168)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 戦国軍記 / 計量テキスト分析 / 軍書 / クラスター分析 / 固有表現抽出 / テキストマイニング / 軍記 / 近世軍書 / 毛利氏 |
研究開始時の研究の概要 |
本研究は、テキストマイニングを用いた量的な研究手法を用いて、成立背景や著者すら分かっていない戦国軍記の性質を明らかにするための新たな研究手法を確立することを目的とする。具体的には、毛利関係戦国軍記を対象に、現存するすべての戦国軍記をフルテキストデータ化し、それらをもとに形態素解析やクラスター分析等の計量テキスト分析を用いることで、客観的かつ量的データに基づいて戦国軍記の性質を明らかにしていく。量的アプローチによって得られた結果は、従来の先行研究や申請者が行ってきた質的研究方法による研究成果と照合することで、本方法の妥当性・有効性を検証しつつ、最適な手法を確立していく。
|
研究実績の概要 |
令和四年度は、毛利関係戦国軍記および関ヶ原合戦関連軍書の翻刻作業をすすめると同時に、戦国軍記のテキストから人名・地名などの固有名詞を抽出するためのアルゴリズムについての検討を行った。 これまで本研究を通じて、戦国軍記を類型化する方法としてクラスター分析が有効であることを提起し、その分類基準には固有名詞、とりわけ人名・地名を用いることが有用であることを明らかにした。さらに戦国軍記の性質を効率的に把握する上でも、固有名詞は重要な品詞であり、人名の出現頻度や共起関係に着目することで詳細不明な軍記についてもある程度系統を把握することができることについても論じてきた。以上の結果は、本研究計画の当初の目的をおおよそ達成するものではあるが、戦国軍記のテキストから固有名詞を自動的に抽出する方法についての検討も必須であることが確認された。 そこで、本年度は人文情報学などの領域における先行研究の成果に学びながら、戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの作成を行い、情報処理学会で研究報告を行った(「戦国軍記のテキストからの人名抽出 」情報処理学会 第85回全国大会講演論文集)。すなわち、形態素解析とIF-THENルールを組み合わせた人名抽出により、成立年代や著者が不明な戦国軍記の2つのテキストを対象に人名抽出を試みた結果、約40~45%の確度で人名を抽出できることが確認された。しかし、一部の語を誤って人名と判定するケースや重複抽出するパターンもあるため、抽出精度を向上させるためにはさらなる条件式の追記や機械学習も視野にいれた検討が必要である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は人文情報学などの領域における先行研究の成果に学びながら、戦国軍記のテキストから自動的に人名等の固有名詞を抽出するためのプログラムの作成を行い、情報処理学会で研究報告を行った(「戦国軍記のテキストからの人名抽出 」情報処理学会 第85回全国大会講演論文集)。また毛利関係戦国軍記二点(『中国治乱記』・『毛利記』)をフルテキスト化しデジタル書籍として公開した。
|
今後の研究の推進方策 |
最終年度は、史料調査および翻刻作業を継続しつつ、新たに得られたテキストを対象に本手法の有効性の検証を引き続き行いながら、得られた成果を学会・研究会、論文などで発表していきたい。
|