2012 Fiscal Year Annual Research Report
Project/Area Number |
22652070
|
Research Institution | Tohoku Gakuin University |
Principal Investigator |
楠 義彦 東北学院大学, 文学部, 教授 (20234429)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | テキストマイニング / 歴史資料 |
Research Abstract |
コンピュータによるテキストマイニングを歴史資料の分析に応用する場合の手順と最終的評価は以下の通りである。 手順:準備するソフトウェアとしては、コンコーダンサーとエクセルが最低限必要である。テキストマイニングソフトがあればなおよい。そしてまず分析結果の適切さを高めるために、文書資料をデジタル化し表記の揺れやモダーナイズの範囲を定めた後にコーパスを作成する。この時、不要情報(ノイズ)の除去を行うことが必要である。第二に、当該の研究テーマに関するキーワードを決定する。これは先行研究からの経験的な判断で行うことになるが、キーワードは可能な限り限定することが分析結果の読解に有効である。歴史研究で必要な計量的分析は単語の頻度情報と出現傾向、単語間の共起関係、共起語の位置、文脈情報に限られるが、見かけ上の相関と有意味な相関を区別するために、テーマを構成する語(複数の語との共起関係)の分析を平行して行うべきである。第三に文書作成者の経歴、社会的地位、文書作成の動機、文書の版型、欠落部分の特定はテキストマイニングでは出来ないため、従来の文書分析の方法と併用することが必要である。 歴史資料の計量的分析の最終的評価:テキストマイニングはそれぞれの語の持つ意味や時代性等の多様性に鈍感であり、歴史学の専門的訓練を受けていない者が用いても信頼できる結果は得られないという課題が明らかになった。けれども歴史資料のデジタル化が急速に進展する状況を考慮すると、今後、特定のテーマにおいて未使用の文書(先行研究が利用していない文書)の資料としての有用性いかんを素早く判定できるツールとして極めて有望であると考えられる。文書資料がもつレトリックの理解と並んで、計量化分析が文書資料の分析に際して考慮されることで、歴史資料の読み直しにつながる可能性を持っていると言えるだろう。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(1 results)