2017 Fiscal Year Research-status Report
Project/Area Number |
17K12783
|
Research Institution | University of Tsukuba |
Principal Investigator |
佐野 幸恵 筑波大学, システム情報系, 助教 (60580206)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ブログ / 実データ解析 / 集合的記憶 / 集合的感情 / 忘却 |
Outline of Annual Research Achievements |
本研究では、実データを再現するモデル開発を通して、ウェブ上における人々の書き込みの忘却と想起パターンを明らかにすることを目的としている。そのために、ウェブ、特にソーシャルメディア上での人々の書き込みを定量的に解析することが、本研究の重要な最初のステップとなる。そこで本年度は、まず日本語のブログにおける単語出現頻度時系列を対象に、データ解析プログラムの構築と、それを用いた基礎的な解析を行った。特に今年度では過去の申請者らの研究で明らかになっている、「感情」を例に集合的記憶を定量的に測定するためのプログラム(python)構築を行った。 本研究では、先行研究に従い、複数の「単語」の出現頻度時系列を組み合わせることにより、感情を定義する。この時、組み合わせた異なる単語間で、出現頻度時系列にどのような相関関係があるのかは明らかになっておらず、本研究で初めてを明らかにした。例えば、疲労を表す感情に属する単語の出現頻度時系列は、弱い正の相関(平均相関 0.21)を持つのに対し、異なる感情間(例えば、疲労と緊張)に属する単語の間では、ほぼ相関を持たない(平均相関 0.08)ことを確認した。すなわち、意味の異なる単語間では相関を持たず、また似た意味を持つ単語間でも、相関は存在しても非常に弱いと言える。このことから、今後、さまざまな単語の出現頻度時系列を解析する際には、他の単語からの影響はほぼ考えなくてよいという結論を得た。 ここまでの結果から、感情においては東日本大震災時に、緊張と不安の感情が忘却される速度が遅く、1ヶ月以上持続していたことを確認した。それに対して、混乱や落ち込みの感情は忘却される速度は速く、1ヶ月以内には震災前のレベルに戻るという結果を得た。また、集合的記憶に関して、うわさの忘却過程などにも注目した研究を並行して行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は、本研究で扱う日本語のブログデータにおいて、ある単語を含む出現頻度時系列の解析を集中的に行った。また、これから日本語のブログ以外のデータを(Wikipediaアクセスログ等)を扱うための、データベース(MongoDB)の構築を行っており、次年度以降の研究に向けて準備も行うことができた。 今年度行った、日本語のブログにおける、異なる単語間における出現頻度時系列間の相関関係等、基礎的な解析結果は英文誌に投稿し、査読を経て短期間で掲載許可を得ており、2018年7月に出版予定である。さらに、感情の忘却過程を含む内容の論文は概ね書きあがっており、今年度中には投稿予定である。以上より、全体として本研究は概ね順調に進んでいると言える。
|
Strategy for Future Research Activity |
今後は、まず平成30年度では、昨年度までに構築した解析プログラムを使って、感情だけではなく人名に注目した時系列解析を行う。さらに、大規模に日本語と英語版のそれぞれのWikipediaのアクセスログデータを入手し、構築したデータベースに格納した上で、解析をスタートさせる予定である。そして日本語ブログ単語出現頻度、日本語版Wikipediaアクセス数、英語版Wikipediaアクセス数と、異なる媒体間、言語間の結果を比較し、論文を執筆する。さらに、ここまでの内容をまとめて国際会議でも発表予定である。平成31年度では、最終的にここまでに得られた、実際のデータ解析結果を再現するモデルの構築へと取り掛かる。
|