研究課題/領域番号 |
16J05352
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
マルチメディア・データベース
|
研究機関 | 大阪大学 |
研究代表者 |
中村 達哉 大阪大学, 情報科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2016-04-22 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
1,300千円 (直接経費: 1,300千円)
2017年度: 600千円 (直接経費: 600千円)
2016年度: 700千円 (直接経費: 700千円)
|
キーワード | ソーシャルメディア / 話題抽出 / 言語横断解析 / Wikipedia / エンティティリンキング |
研究実績の概要 |
本研究課題では、Twitterに代表されるソーシャルメディアから言語横断的に話題を抽出し、異なる言語間で共通して話題となっている情報、あるいは、特定の言語のみ話題となっている情報など、言語の壁を超えた話題情報の分析を可能とする枠組みの構築を目指している。言語横断的な話題抽出により、異なる言語圏の話題情報の比較が可能となるため、言語の違いだけでなく、国や文化、さらには、ソーシャルメディアのユーザの居住地や所属コミュニティなど様々な観点からソーシャルメディア上の話題の包括的な分析への応用が期待される。本年度は以下のような課題に取り組んだ。 従来の話題抽出手法はソーシャルメディアのテキスト中の単語の出現回数などの統計情報から話題を表す単語もしくは単語群を抽出するため、抽出した話題を異なる言語間で比較することができなかった。そこで、テキスト中の話題を表す単語を多言語Web百科事典Wikipediaの記事に対応付けるエンティティリンキング手法を提案した。Wikipediaでは同じ概念を表す異なる言語の記事は言語間リンクと呼ばれるリンクにより互いに繋がっているため、異なる言語から抽出した話題についても比較が可能となる。 また、前述の方法により抽出した話題情報について、言語間の共通点あるいは相違点を抽出する手法についても検討を進めた。例えば、複数の言語間で継続的に話題になっているような情報であっても、その話題の度合や関連して話題になっている情報が言語間で異なると考えられる。そこで、ソーシャルメディア上の話題を、互いに関連する話題同士を繋げたグラフ構造として表現し、各言語の話題グラフを比較することで対象の話題の共通点や相違点を明らかできる。
|
現在までの達成度 (段落) |
29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
29年度が最終年度であるため、記入しない。
|