研究課題/領域番号 |
23K17542
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分6:政治学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
湯川 拓 東京大学, 大学院総合文化研究科, 准教授 (80728775)
|
研究分担者 |
阪本 拓人 東京大学, 大学院総合文化研究科, 教授 (40456182)
若狭 彰室 東京経済大学, 現代法学部, 准教授 (00780123)
|
研究期間 (年度) |
2023-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2024年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2023年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 国際社会論 / 条約 / テキスト分析 |
研究開始時の研究の概要 |
「国際社会」(international community)という概念は国際関係を理解する上で極めて重要な概念でありながらも、既存研究においては同概念についての歴史的・動態的な分析は極めて不十分であった。すなわち、「国際社会」概念が外交当事者からどのように用いられてきたのかという分析は、全くと言ってよいほど為されてこなかった。それに対し、本研究では計算社会科学の先端的な手法を取り込み、条約のテキスト分析という新しい方法を用いることで、「国際社会」概念に対して、①動態的分析、②実証的分析という二点を実現することで根本的に画期的な貢献を試みる。
|
研究実績の概要 |
本研究は条約のテキスト分析を行うことで、「国際社会」概念そのものや国際的な構成原理の動的な変化について実証的に明らかにするものである。そこにおいては、権威的で標準的な条約データベースであるOxford Historical Treaties(OHT)を用いる。これは1648年から1919年の間における16192個という大量の条約を網羅したものである。 今年度は、このデータベースからテキストデータを抽出し、分析可能な形に整形することが主たる作業となった。具体的には、データベースからすべての条約のPDFを、プログラムを使って自動的にダウンロードすることが課題となる。PDFの多くは文字認識されていないスキャン画像であるため、光学文字認識(OCR)処理を行うが、それに対しプログラムを使って不要な要素を除去するなどの前処理を行った。これは特に問題なく進んだものもあれば、条約によっては特別な処理を要するものもあり、総じて膨大な作業量を要求するものであった。精力的に進めてはいるものの、完成までにはまだ時間がかかる見込みである。 その作業と並行して、条約に用いられている言語に対象を絞って分析を行った。データベース内の条約が何語で書かれているかを判別し、データとして整理した。その際には、締約国と採用された条約言語の対応関係も量的に明らかにした。それを用い、条約言語の変遷を可視化することに成功した。そして、その背景にある政治的背景について、現在検討中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
テキストデータの抽出は順調に進んだが、整形が予想以上に困難を伴うものであることが判明した、という点に尽きる。通常のOCR処理だけでは済まず、付加的な作業が多々発生することとなった。それでも、作業自体は継続的に進めており、膨大な課題を一つ一つ克服しつつある。 他方、条約言語に絞った研究は比較的順調に進展した。
|
今後の研究の推進方策 |
データの前処理を進めていくことが最優先の課題となる。特に、17世紀のドイツ語の処理や、元のデータにおいて二段組になっているテキストの処理などが課題となる。この膨大な前処理の作業さえ終われば、実現可能な分析は非常に豊富にあるため、鋭意取り組みたい。 他方、先行して進めている条約言語の研究は2年目の間にペーパーとしてまとめる予定である。
|