研究課題/領域番号 |
15KT0040
|
研究機関 | 東京大学 |
研究代表者 |
和田 毅 東京大学, 大学院総合文化研究科, 准教授 (20534382)
|
研究分担者 |
上田 博人 東京大学, 大学院総合文化研究科, 特任研究員 (20114796) [辞退]
R・TINOCO Antonio 上智大学, 外国語学部, 教授 (80296889)
|
研究期間 (年度) |
2015-07-10 – 2019-03-31
|
キーワード | 紛争 / 自然言語処理 / イベント分析 |
研究実績の概要 |
本研究は、暴力的紛争(暴動・民族浄化・集団虐殺・内戦など)の勃発を予知するシステムを構築するために、①理論的な枠組みの整理、②リアルタイムで分析可能なイベント・データ・システムの構築、③イベント・データを分析し、紛争の予知に役立てる統計モデルの開発、の3つの作業を同時に進めている。今年度の研究実績は以下の通りである。 「①理論的な枠組みの整理」については、大学院生を含む作業チームがこれまで同様に作業を進めた。2017年11月には、社会運動や紛争に関する大学院生の研究発表をメキシコにて実施した。 「②リアルタイムで分析可能なイベント・データ・システムの作成」については、その作業を継続した。スペイン在住のスペイン語自然言語処理の専門家と共同研究の形で作業を進めた。同時に、自然言語処理の専門家以外の研究者もこの手法を理解し応用できるようにするため、ワークショップを開催した。Global Event Data System (GEDS) Seminar Series: "Big Data and Natural Language Processing in the Social Sciences & Humanities"と名付けたワークショップでは、国内外から講師を迎え、自然言語処理の様々な側面についての講義・訓練を7回にわたって実施した。さらに、リアルタイムで自動的に作成されるイベント・データの質や精度を検証するために、人力でコード化を行うパラレル・データの作成も開始した。11月にメキシコにて、スペイン語新聞記事をコード化する作業を国際共同研究の形で実施した。 「③イベント・データの分析と統計モデルの開発」作業に関しては、分析作業を継続して行い、5月のLatin American Studies Associationにて国際共同研究チームを結成して、イベント分析の成果報告を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
この研究の中核となるのが、自然言語処理技術を用いてスペイン語の記事からリアルタイムでデータベースを構築する作業である。この作業を中心となって担当するスペイン語自然言語処理の専門家が、自国スペインに帰国することになり、スペインで仕事をしながらこの共同研究にも従事する形態となったために、計画の通りにはデータベース構築作業が進展しなかった。
|
今後の研究の推進方策 |
3つの主要な研究活動のうち、①暴力的な紛争の発生過程を整理する理論化作業に関しては、これまで通りに進めていく。特に、構造的な条件や動的メカニズムを特定する作業を重視して、国際関係論での紛争研究や政治社会学の社会運動研究など多様な分野の研究を広くまとめる作業を実施する。 ③暴力的紛争の勃発を予測する統計モデルの開発作業も継続する。今年度は特にこの作業を重視し、イベント・データという特殊なデータを分析する能力をさらに高めていくために、研究チームのメンバーを統計分析のワークショップなどに派遣する。 ②リアルタイムで世界中の政治活動の情報をプロセスしてイベント・データを構築する作業は、3つの主要な研究活動の中でも一番遅れている部分である。その最大の理由は、スペイン語の自然言語処理技術をもつ専門家を持続的に安定して雇用することが難しいためである。今後も人材を見つけることが難しい場合は、現在作業を依頼しているスペインの専門家に加えて、英語の自然言語処理の専門家を雇用することによって、一気にこの作業の進展を図る。英語を扱う自然言語処理の専門家は数多く存在するからである。もちろん、スペイン語を理解できない英語の専門家ではスペイン語のテキストの処理には限界がある。この課題を克服するため、十分なスペイン語の能力をもつ大学院生をRAとして雇用して、共同で作業を実施するようにする。 年度末には、これらの3つの作業チームの成果をまとめた国際学術会議を実施する。
|
次年度使用額が生じた理由 |
(理由) 平成29年度の主要な支出項目として、①スペイン語自然言語処理作業を担当する専門家を雇用する人件費と、②海外から研究者を招へいし研究成果について検討する国際学術会議の開催費用を計上していた。スペイン語の自然言語処理の専門家を日本で見つけることは難しく、昨年見出した人材も、スペインに就職・帰国することになったため、本研究に当初の計画通りの時間を費やすことが難しくなった。その結果、①の作業の進展が計画よりも遅延することとなった。この遅延を受けて、②の国際学術会議の開催も延期することとなったため、次年度使用額が生じた。 (使用計画) 今年度は、スペイン語自然言語処理の専門家に限定せず、英語の専門家をチームに加えることで、作業の進展を図っていく。そして、延期した国際学術会議も実施する計画である。
|