2022 Fiscal Year Research-status Report
外交文書データの国際法・外交研究への利活用の拡充に向けて
Project/Area Number |
21K01382
|
Research Institution | Eikei University of Hiroshima |
Principal Investigator |
長岡 さくら 叡啓大学, ソーシャルシステムデザイン学部, 准教授 (10550402)
|
Co-Investigator(Kenkyū-buntansha) |
中川 智治 福岡工業大学, 社会環境学部, 教授 (50336046)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 外交文書 / AI技術 / データ分析 / 外交研究 / 国際法学 |
Outline of Annual Research Achievements |
本研究は、人工知能(AI)技術を用いて外交文書データを国際法・外交研究に利活用するために行う研究である。また、本研究は、先行する研究課題(挑戦的研究(萌芽):17K18549)の成果に基づき行う研究でもある。 これまでの研究成果を踏まえ、本研究では、研究者がこれまでに人力で行ってきた資料を「探し出し、読みこなし、分析する」といった研究過程における一連の作業の一部を、AI技術を用い、機械に代替・補完させるための手法について具体的な提案を目指している。 研究期間の二年次たる令和4(2022)年度は、まず、前年度に引き続き、文字認識アルゴリズムについて検討を行った。これまでの検討結果から、外交史料は、文書の形式、文字の配列、文字の態様、言語の種類、その他史料の多様性等の問題から、文字認識のアルゴリズム構築には作業条件の調整が必要であることが判明している。本年度は特に、言語の種類が異なった史料について検討を行った。その結果、外交史料を画像に変換し機械に文字認識させる過程については、数値解析ソフトの環境の下、本研究の開始当時よりも改善された形で機械に文字として取り込めることは確認できた。 そこで本年度は、研究過程の次の段階である「機械に取り込んだ文字」を「機械に解析させる過程」についても検討を開始した。そもそも、人力で行う研究過程における作業を機械に代替させるためには、機械で作業可能な形に当該過程を再定義する必要がある。検討の結果、文字認識の結果として「機械に取り込んだ文字」を「機械に解析させる過程」ための前提条件について一定の理解を得た。機械に代替させることを前提とした研究過程に基づき、人力により実施した研究成果については、次年度に公表する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、人工知能(AI)技術を用いて外交文書データを国際法・外交研究に利活用するために行う研究である。本研究では、当初、研究過程を、①文字認識アルゴリズムの構築(前提条件の整理)、②文字認識アルゴリズムとデータマイニングアルゴリズム連結の調整、③AI技術での補助・補完可能性の総括、の三段階に分けて検討を行うと計画していた。 研究期間の二年次たる令和4年度は、まず、上述の第一段階について前年度に引き続き検討を行った。これまでの検討結果から、外交史料は、文書の形式、文字の配列、文字の態様、言語の種類、その他史料の多様性等の問題から、文字認識のアルゴリズム構築には作業条件の調整が必要であることが判明している。本年度は特に、言語の種類が異なった史料について検討を行った。その結果、外交史料を画像に変換し機械に文字認識させる過程については、数値解析ソフトの環境の下、本研究の開始当時よりも改善された形で機械に文字として取り込めることは確認できた。 そこで、上述の第二段階についても検討を開始した。そもそも、人力で行っていた研究過程における作業を機械に代替させるためには、機械で作業可能な形に当該過程を再定義する必要がある。検討の結果、文字認識の結果として「機械に取り込んだ文字」を「機械に解析させる過程」ための前提条件について一定の理解を得た。機械に代替させることを前提とした研究過程に基づき、人力により実施した研究成果については、次年度に公表する予定である。 なお、新型コロナウィルス感染症の蔓延継続や学内業務過多(研究代表者が五つもの学内運営業務(WG・委員会)を担当)により研究時間の確保が難しい状況があった。工夫した結果、何とか影響を最小限に留めることができた。 これらの点から、本研究課題の現在までの進捗状況は、おおむね順調に進展していると考える。
|
Strategy for Future Research Activity |
本研究では、研究者がこれまでに人力で行ってきた資料を「探し出し、読みこなし、分析する」といった研究過程における一連の作業の一部を、AI技術を用い、機械に代替・補完させるための手法について具体的な提案を目指している。 そして本研究では、先行研究での知見をふまえ、当初、研究過程を三段階に分割して計画していた。計画をふまえ令和4年度からは、第二段階の「文字認識アルゴリズムとデータマイニングアルゴリズム連結の調整」にも取り組んでいる。 一方、令和4年度の研究成果から、第二段階のデータマイニングアルゴリズムについては、文字認識アルゴリズムとの連結調整だけでは済まない可能性が判明した。即ち、データマイニングとは、文字通りデータを「採掘」することであるが、そのアルゴリズムを構築するためには、当該「データ採掘」が、「計算可能である形式として取り扱うことができ、かつ解決可能な問題である」として定義される必要がある。別の言い方をすれば、「機械に取り込んだ文字」を「機械に解析させる過程」において、何を、どのように、どの程度、達成出来れば、データマイニングアルゴリズムとして成功したと評価できるのかについての条件抽出を行う必要性に気がついた。 外交史料は、分析対象として取り上げる主題により、取り扱う史料の範囲が単一の国から複数の国々と異なり、また、対象とする時間的範囲も異なる。そのため、外交史料分析を機械に代替・補完させるとして、その成果を評価する際の基準も複数考えられる。 以上の諸点をふまえ、研究期間の最終年次たる令和5(2023)年度は、これまでの研究成果の公表を予定するとともに、令和4年度に引き続き、「機械に取り込んだ文字」を「機械に解析させる過程」について更に検討する。又、本研究の総まとめとして第三段階の「AI技術での補助・補完可能性の総括」についての検討を行い、総括を行う予定である。
|
Causes of Carryover |
令和3年度に引き続き、令和4年度も新型コロナウィルス感染症の蔓延が継続したため、資料収集を予定した諸機関への訪問が叶わなかったことに伴う次年度使用額が生じた。令和5年度は、当初予定していた資料収集や関係者による研究会の実施に加え、上述の諸機関への訪問・資料収集を可能な限り実施し、当初の研究計画を遂行する予定である。
|
Remarks |
長岡さくら、「外交文書データを用いた国際法研究を補完するAI技術の利用」福岡工業大学総合研究機構環境科学研究所第17回環境研究発表会(2023年) 中川智治、「国際法研究・外交史研究の分野においてAI技術の利活用の可能性」福岡工業大学総合研究機構環境科学研究所第17回環境研究発表会(2023年)
|