2015 Fiscal Year Research-status Report
古典資料に対するテキストマイニングおよびその分析結果の可視化に関する研究
Project/Area Number |
26730169
|
Research Institution | Onomichi City University |
Principal Investigator |
木村 文則 尾道市立大学, 経済情報学部, 講師 (70516690)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 重要語抽出 / テキストマイニング |
Outline of Annual Research Achievements |
本研究では,電子テキスト化された古典資料(『吾妻鏡』などの平安時代~鎌倉時代に書かれた資料)に対してテキストマイニングを行うことにより人物や地名などの情報の抽出を行い,それらの分析をし,その結果の可視化を行う. 本手法では古典資料に対してテキストマイニングを行うために,サポートベクターマシンによる機械学習を行うことにより,古文の重要語抽出器の作成を行っている.平成27年度では,この重要語抽出器の精度の向上を図り,一定の成果が得られた。また,抽出した重要語の分類を試みており,これについては次年度においても取り組む予定である.さらに,古典資料(『東大寺要録』)に対する注釈付与において,抽出した重要語を新たな注釈候補として推薦するという応用を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
古典資料から情報を抽出するという目的は,一定の成果が得られた.また,抽出対象を『東大寺要録』や『役者評判記』に拡大し汎用性を高めたうえで,その抽出精度を向上できたことは成果であると考えている.また,抽出した重要語の分類を試みたり,得られた重要語の応用を提案できたことも,今年度の成果であると考えている.本研究の古典資料から情報を抽出し,それを活用するという目的に向かって進展していると考えており,全体としては「おおむね順調に進展している」との評価になると考えている.
|
Strategy for Future Research Activity |
平成28年度は,抽出した重要語の分類を行いたいと考えている.抽出した重要語が人名,地名,もの,あるいはそれ以外の何かであるかなどに分類することで,抽出した情報の活用方法の幅が広がるからである.また,抽出した情報を分析し,その結果を可視化する方法について実現したいと考えている.
|
Causes of Carryover |
研究代表者の所属変更に伴い,当初予定していたよりも学会発表への参加(特に海外での国際会議)回数が少なかったため.
|
Expenditure Plan for Carryover Budget |
研究の進展により得られた成果の公表を行うため,国内・国際会議に参加する際の参加費,旅費に充てる予定である.
|