研究課題/領域番号 |
15KT0040
|
研究機関 | 東京大学 |
研究代表者 |
和田 毅 東京大学, 大学院総合文化研究科, 教授 (20534382)
|
研究分担者 |
上田 博人 東京大学, 大学院総合文化研究科, 特任研究員 (20114796) [辞退]
R・TINOCO Antonio 上智大学, 外国語学部, 教授 (80296889)
|
研究期間 (年度) |
2015-07-10 – 2020-03-31
|
キーワード | 紛争 / 自然言語処理 / イベント分析 |
研究実績の概要 |
本研究は、暴力的紛争(暴動・民族浄化・集団虐殺・内戦など)の勃発を予知するシステムを構築するために、①理論的な枠組みの整理、②リアルタイムで分析可能なイベント・データ・システムの構築、③イベント・データを分析し、紛争の予知に役立てる統計モデルの開発、の3つの作業を実施している。今年度の研究実績は以下の通りである。 「①理論的な枠組みの整理」については、学術支援職員1名を中心に作業を進めた。 「②リアルタイムで分析可能なイベント・データ・システムの作成」については、スペイン在住のスペイン語自然言語処理の専門家と共同研究の形で作業を進めた。同時に、"Big Data and Natural Language Processing in the Social Sciences & Humanities"と名付けたワークショップを4回実施した。国内外から講師を迎え、人文社会科学の研究者や学生を対象に自然言語処理の様々な側面についての講義・訓練を行った。さらに、リアルタイムで自動的に作成されるイベント・データの質や精度を検証するために、メキシコの学生5名が人力でコード化を行うパラレル・データの作成作業も継続した。 「③イベント・データの分析と統計モデルの開発」作業に関しては、分析作業を継続して行い、5月のLatin American Studies Associationにて国際共同研究チームを結成して、イベント分析の成果報告を行った。また、7月から8月にハンガリーで開催されたEuropean Consortium for Political Researchの方法論ワークショップに参加し、先端的な分析方法を習得した。9月にはメキシコ国立自治大学のJorge Cadena-Roa教授を招聘し、メキシコの政治イベントに関する研究成果の報告を受けた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成30年度には、国際共同研究を国内外で実施することができたことと、この研究の中核部分である自然言語処理技術を用いたイベント・データベース構築作業が、順調に進展したことが理由である。スペイン語自然言語処理の専門家が昨年度までよりも多くの時間をこのプロジェクトにあてることができるようになったことが、その大きな要因である。
|
今後の研究の推進方策 |
最終年となる2019年度は、3つの主要な研究活動(①理論的な枠組みの整理、②リアルタイムで分析可能なイベント・データ・システムの構築、③イベント・データの分析と統計モデルの開発)それぞれを推進させるとともに、これら①②③を一つに統合させることも目標とする。 ①暴力的な紛争の発生過程を整理する理論化作業に関しては、これまで通りに進めていく。特に、9月から12月にかけて、社会運動研究の一大拠点であるカリフォルニア大学アーバイン校に赴き、理論的な精緻化を図る。 ③暴力的紛争の勃発を予測する統計モデルの開発作業も継続する。5月にボストンで開催されるLatin American Studies Associationの年次大会に参加して、イベント・データの分析手法に関するワークショップを開催し、アルゼンチンやチリからの先端的な研究者や日本やメキシコの若手研究者とともに、手法を洗練させる。 ②リアルタイムで世界中の政治活動の情報をプロセスしてイベント・データを構築する作業も継続して進めていく。スペインの自然言語処理の専門家を中心に、テキスト情報のイベント・コードのタグ付け機能の精緻化を図る。このため、7月にはメキシコの学生を中心に教師データを作成する作業を実施し、自動コード化の精度を計測できるようにする。また、1月には国際共同研究会議を実施し、本研究課題の総括と今後の課題について検討する機会をもつ。
|
次年度使用額が生じた理由 |
(理由) 平成30年度については順調に研究が進展したが、平成29年度までの研究状況に遅れが生じており、そのために次年度使用額が生じた。具体的には、主要な支出項目として、①スペイン語自然言語処理作業を担当する専門家を雇用する人件費があるが、スペイン語の自然言語処理の専門家を日本で見つけることは難しく、平成28年度に見出した人材も、スペインに就職・帰国することになったため、本研究に当初の計画通りの時間を費やすことが難しくなった。その結果、①の作業の進展が計画よりも遅延することとなった。この遅延を受けて、①の成果をもとにした国際学術会議の開催も延期することとなったため、次年度使用額が生じた。 (使用計画) 平成30年度に、スペイン語自然言語処理の専門家とともに順調に作業を実施する体制が整ったため、一層の作業の進展を図っていく。そして、延期した国際学術会議も実施し、研究成果の総括をする予定である。
|