2023 Fiscal Year Research-status Report
条約のテキスト分析による動態的・実証的な「国際社会論」の実現
Project/Area Number |
23K17542
|
Research Institution | The University of Tokyo |
Principal Investigator |
湯川 拓 東京大学, 大学院総合文化研究科, 准教授 (80728775)
|
Co-Investigator(Kenkyū-buntansha) |
阪本 拓人 東京大学, 大学院総合文化研究科, 教授 (40456182)
若狭 彰室 東京経済大学, 現代法学部, 准教授 (00780123)
|
Project Period (FY) |
2023-06-30 – 2025-03-31
|
Keywords | 国際社会論 / 条約 / テキスト分析 |
Outline of Annual Research Achievements |
本研究は条約のテキスト分析を行うことで、「国際社会」概念そのものや国際的な構成原理の動的な変化について実証的に明らかにするものである。そこにおいては、権威的で標準的な条約データベースであるOxford Historical Treaties(OHT)を用いる。これは1648年から1919年の間における16192個という大量の条約を網羅したものである。 今年度は、このデータベースからテキストデータを抽出し、分析可能な形に整形することが主たる作業となった。具体的には、データベースからすべての条約のPDFを、プログラムを使って自動的にダウンロードすることが課題となる。PDFの多くは文字認識されていないスキャン画像であるため、光学文字認識(OCR)処理を行うが、それに対しプログラムを使って不要な要素を除去するなどの前処理を行った。これは特に問題なく進んだものもあれば、条約によっては特別な処理を要するものもあり、総じて膨大な作業量を要求するものであった。精力的に進めてはいるものの、完成までにはまだ時間がかかる見込みである。 その作業と並行して、条約に用いられている言語に対象を絞って分析を行った。データベース内の条約が何語で書かれているかを判別し、データとして整理した。その際には、締約国と採用された条約言語の対応関係も量的に明らかにした。それを用い、条約言語の変遷を可視化することに成功した。そして、その背景にある政治的背景について、現在検討中である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
テキストデータの抽出は順調に進んだが、整形が予想以上に困難を伴うものであることが判明した、という点に尽きる。通常のOCR処理だけでは済まず、付加的な作業が多々発生することとなった。それでも、作業自体は継続的に進めており、膨大な課題を一つ一つ克服しつつある。 他方、条約言語に絞った研究は比較的順調に進展した。
|
Strategy for Future Research Activity |
データの前処理を進めていくことが最優先の課題となる。特に、17世紀のドイツ語の処理や、元のデータにおいて二段組になっているテキストの処理などが課題となる。この膨大な前処理の作業さえ終われば、実現可能な分析は非常に豊富にあるため、鋭意取り組みたい。 他方、先行して進めている条約言語の研究は2年目の間にペーパーとしてまとめる予定である。
|
Causes of Carryover |
テキストデータの前処理が予想外に困難で作業量が多いことが判明したため、遂行予定がずれ込んだことが原因である。特にアウトプットのための国際学会への参加を見送ることになったという理由が大きい。
|
Research Products
(7 results)