2017 Fiscal Year Annual Research Report
Information Extraction and Linked Open Data Construction of Area Studies Literature
Project/Area Number |
16K21124
|
Research Institution | Kyoto University |
Principal Investigator |
亀田 尭宙 京都大学, 東南アジア地域研究研究所, 助教 (10751993)
|
Project Period (FY) |
2016-04-01 – 2018-03-31
|
Keywords | コーパス作成 / 情報組織化 |
Outline of Annual Research Achievements |
最終年度は、昨年度にテキスト化とその補助ツールの開発を行った『東南アジア研究』コーパスについて、その分析と活用方法の検討を行った。国際的なアジア研究の学会 Association for Asian Studies では、他科研「実証的循環型コレクションモデルの創出による研究図書館の危機打開」のメンバーや海外の東南アジア研究者とパネルを組み、本コーパスの分析から見えてくる、論文において扱われている国やトピック、論文内での国家間関係について報告を行った。その際に、Linked Open Data 上の異なる表記(例えば、いわゆるタイについて、Thailand、タイ王国など)を用いることで論文上の多様な表記をまとめて統計を得ることができた。
一方で、多様な地域、多様なトピックを扱う本コーパスは、その中の論文同士の関係が密ではなく、外部のデータベース内にも似た知識源がないなど、「つながるデータ」としての Linked Open Data の良さが活かすには困難を抱えていることが明らかになった。今後は、本科研に関わって開発した PDFをテキストコーパス化するためのプラットフォームや人手による知識構造の抽出が容易にする JSON Editor によって、自動での知識構造抽出に至らないデータの構造化を自然言語で書かれた他の地域研究資源にも適用することで、データ相互の関連を密にし、個々の論文や概念、地域を理解する際に有用な情報源としていきたい。
|
Research Products
(2 results)