2019 Fiscal Year Research-status Report
テキストマイニングの手法を用いた説話集の性質分析と分類
Project/Area Number |
17K18499
|
Research Institution | Ibaraki National College of Technology |
Principal Investigator |
平本 留理 茨城工業高等専門学校, 国際創造工学科, 准教授 (20342462)
|
Co-Investigator(Kenkyū-buntansha) |
蓬莱 尚幸 茨城工業高等専門学校, 国際創造工学科, 教授 (80633346)
|
Project Period (FY) |
2017-06-30 – 2021-03-31
|
Keywords | 説話集 / 自然言語処理 / 本文データベース / 形態素解析 / テキストマイニング |
Outline of Annual Research Achievements |
本研究の目的は、「説話集の性質分析」という文学研究に自然言語処理分野の手法である「形態素解析」と「テキストマイニング」を持ち込み、その有意性を明らかにしようというものである。昨年度までに『古今著聞集』『十訓抄』『宇治拾遺物語』の本文データベースを完成させた他、『今昔物語集』『江談抄』『富家語』『中外抄』『沙石集』『日本霊異記』の6作品について、本文データベースの骨格までを作成した。また、各説話集の個別の性質分析として『十訓抄』の分析を行なった他、三大説話集とされる『今昔物語集』『宇治拾遺物語』『古今著聞集』の3作品において、テキストマイニングの試行を終えている。 今年度は、骨格のみ作成していた6作品の本文データベースの修正を行いつつ、三大説話集の本格的な性質分析を行った。まずはそれぞれの説話集において、使用されている語彙の品詞の割合や類似語彙の傾向分析、全説話間や巻ごとの類似性などについて、さまざまな観点から検証を行なった。本研究の最終目標としては、説話集間の類似性等に触れる予定であるため、規模や文体等が大きく異なるこれらの個々の説話集をまとめて分析する際の問題点や、有意性を改めて検証し、おおよその方針を固めた。 元データそのものの細かいミスの検証やそれが与える影響の有無、上がってきたデータやグラフをどう分析し、どう分かりやすく提示するかなど、テキストマイニングを行う上でのさまざまな問題点なども浮上してきたが、これについては現在も検討を重ねているところである。ここまでの成果については、次年度6月に開催される説話文学会において、発表することを予定している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本文データベースの骨格を作り、解析用に修正を重ねる過程でかなりの時間を要したため、その後の研究計画が全体的に少しずつ後ろにずれ込んでいる。また、テキストマイニングの試行において、データ上の細かいミスの検証や修正、傾向が見えづらい等の問題点の検証を繰り返す必要があったが、研究分担者との打ち合わせ日程が思うように取れないことなどが重なった。
|
Strategy for Future Research Activity |
今後は以下の計画で研究を推進していく予定である。 1)三大説話集におけるテキストマイニングの結果の発表。 2)テキストマイニングの結果の提示の仕方や、細かい解析上のミスの影響の検証。 3)これまでのテキストマイニングの手法を応用した、9作品全体の傾向分析。 4)研究成果のとりまとめ。
|
Causes of Carryover |
今年度の予算は主に、研究成果発表のための資料収集や旅費等に使用する予定であった。しかし、研究計画が全体的に後ろにずれ込んだことにより、研究成果の発表そのものを次年度に繰り越さざるを得なくなった。よって、これらについては、次年度の成果発表のための費用にあてることを予定している。
|