外交データ分析に関する人工知能(AI)の開発に向けて
Project/Area Number |
17K18549
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Research Field |
Political Science and related fields
|
Research Institution | Japan University of Economics (2019-2020) Fukuoka Institute of Technology (2017-2018) |
Principal Investigator |
長岡 さくら 日本経済大学, 経済学部(福岡キャンパス), 准教授 (10550402)
|
Co-Investigator(Kenkyū-buntansha) |
中川 智治 福岡工業大学, 社会環境学部, 教授 (50336046)
|
Project Period (FY) |
2017-06-30 – 2022-03-31
|
Project Status |
Granted (Fiscal Year 2020)
|
Budget Amount *help |
¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2018: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2017: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | 外交文書 / AI技術 / データ分析 / 外交研究 / 国際法学 |
Outline of Annual Research Achievements |
本研究は、将来、人工知能(Artificial Intelligence、以下「AI」と称する。)技術を外交史料研究において利活用するために行う探究的な研究である。 近年、外交記録公開によって公開される外交文書の量が著しく増大している。このような状況において、公開された厖大な外交文書から、一人の研究者が、特定の研究目的に従って、全ての関連ある資料を探し出し、読みこなし、分析を行い、それを一定の期間内に体系的に検討することについては、今後ますます困難になっていくことが予想される。そこで、本研究では、近年、発展がめざましいAI技術を外交史料研究に利活用するために必要となる手法について検討を行い、AI技術が、どの程度、外交研究において利活用可能なのかについて整理し、利活用の手法について提案を試みる。 これまでの作業・検討では、主として、文字データ化された文書の解析を中心に研究を進めた。文字データ化された文書の解析については、QDAソフトによる解析は、AI技術の開発(実装)についての研究として本研究を展開させるには適していないことが判明した。そこで令和元年度及び令和2年度は、平成30年度中に開始した文字データ化された文書の解析作業を文字認識アルゴリズムと一体的に進めることを可能にするため、前年度に文字認識アルゴリズムを構築した数値解析ソフト環境を用いて、新たに文書解析のアルゴリズム構築に取り組んだ。 一方、近年、様々な国内外の政府機関、国際機関、学術団体等において、「AI」の開発や利活用に関するガイドラインの作成や提言が活発に行われている。このような、いわゆる「AI原則」について、本研究との関連において法的観点から整理を行った。しばしば指摘されている「AI」と人権や倫理との関連性について、当該研究成果の一部について研究報告を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究では、当初、紙媒体で提供され、これを画像化した一連の外交史料を主たるサンプルデータとして用い、研究を進める予定であった。 ところが、研究を進めるにつれ、文字データとして提供されていない一連の外交史料は、言語の種類、文字の態様、文書の形式、綴り込まれている史料の多様性等の問題から、市販されている汎用的なOCRソフトを用いた簡便な文字データ化には、ソフトの調整だけでは越えられない課題があることが判明した。そこで、画像化された史料のOCRに関しては、パターン認識による文字認識アルゴリズム自体を構築可能な数値解析ソフトに変更して対応することにした。数値解析ソフトを用いての文字認識アルゴリズムの構築には、プログラミング環境を整備する必要があり、平成30年度に当該環境を整えた。また、文字画像認識に用いるサンプルデータの見直しも行った。なお、念のため、OCRソフトによる文字データ化の作業結果と数値解析ソフトを用いて作成した文字認識アルゴリズムによる文字データ化の作業結果とを比較した。その結果、数値解析ソフトによる作業結果のほうが、OCRソフトによる作業結果よりも高精度であることが確認できた。 そして、令和元年度以降、文字データ化された文書の解析を中心に研究を進めている。平成30年度における作業・検討によって、QDAソフトによる解析は、AI技術の開発(実装)についての研究として本研究を展開させるには適していないことが判明した。そこで、令和元年度及び令和2年度は、文字認識アルゴリズムを構築した数値解析ソフト環境を用いて、新たに文書解析のアルゴリズム構築に取り組んでいる。又、本研究との関連において、「AI原則」に関する整理を行なった。 なお、現在、新型コロナウイルス感染症の影響により当初計画の変更を余儀なくされ、やや遅延を生じているが、補助事業期間延長により計画の完了を目指している。
|
Strategy for Future Research Activity |
新型コロナウイルス感染症の影響により、計画を変更し、補助事業期間延長を行ったため、令和3年度が研究最終年度となる。 令和3年度は、主として次の二点、即ち、当初計画における最終年度であった令和元年度から実施中の文字データ化された文書の解析を更に進め、当初計画の完了を目指すとともに、本研究の総括を行う。 まず、文字データ化された文書の解析については、令和2年度に引き続き、数値解析ソフト環境を用いて、文書解析のアルゴリズム構築に取り組む。とりわけ、文書解析のアルゴリズム構築にあたっては、他分野における先行事例を参考に、外交史料研究において利活用可能な手法等について検討を行う。その際、これまでに入手を保留したデータを用いての検証についても検討する。研究推進にあたっては、本年度も新型コロナウイルス感染症の影響を受ける可能性があることから、適宜、当初計画を遂行又は補完できるよう気を配っていきたい。 また、本年度は研究最終年度であるため、研究結果についての総括を行う。その際、本研究が目指す、AI技術を用いて、研究代表者がこれまでに人力で行ってきた資料の「探し出し、読みこなし、分析する」といった一連の作業の一部を代替させることの課題についても盛り込む予定である。 なお、本研究の進捗とともに、近年、作成が進んでいるいわゆる「AI原則」について、本研究との関連においてしばしば指摘されている「AI」と人権や倫理との関連性の問題といった検討課題が確認された。これらの問題については、令和3年度に新規採択された研究課題・基盤研究(C)(一般)「外交文書データの国際法・外交研究への利活用の拡充に向けて(課題番号:21K01382)」において、さらに検討を重ねたい。
|
Report
(4 results)
Research Products
(3 results)