ソーシャルメディアからの言語横断的な話題抽出に関する研究
Project/Area Number |
16J05352
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Multimedia database
|
Research Institution | Osaka University |
Principal Investigator |
中村 達哉 大阪大学, 情報科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2016-04-22 – 2018-03-31
|
Project Status |
Completed (Fiscal Year 2017)
|
Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2017: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2016: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | ソーシャルメディア / 話題抽出 / 言語横断解析 / Wikipedia / エンティティリンキング |
Outline of Annual Research Achievements |
本研究課題では、Twitterに代表されるソーシャルメディアから言語横断的に話題を抽出し、異なる言語間で共通して話題となっている情報、あるいは、特定の言語のみ話題となっている情報など、言語の壁を超えた話題情報の分析を可能とする枠組みの構築を目指している。言語横断的な話題抽出により、異なる言語圏の話題情報の比較が可能となるため、言語の違いだけでなく、国や文化、さらには、ソーシャルメディアのユーザの居住地や所属コミュニティなど様々な観点からソーシャルメディア上の話題の包括的な分析への応用が期待される。本年度は以下のような課題に取り組んだ。 従来の話題抽出手法はソーシャルメディアのテキスト中の単語の出現回数などの統計情報から話題を表す単語もしくは単語群を抽出するため、抽出した話題を異なる言語間で比較することができなかった。そこで、テキスト中の話題を表す単語を多言語Web百科事典Wikipediaの記事に対応付けるエンティティリンキング手法を提案した。Wikipediaでは同じ概念を表す異なる言語の記事は言語間リンクと呼ばれるリンクにより互いに繋がっているため、異なる言語から抽出した話題についても比較が可能となる。 また、前述の方法により抽出した話題情報について、言語間の共通点あるいは相違点を抽出する手法についても検討を進めた。例えば、複数の言語間で継続的に話題になっているような情報であっても、その話題の度合や関連して話題になっている情報が言語間で異なると考えられる。そこで、ソーシャルメディア上の話題を、互いに関連する話題同士を繋げたグラフ構造として表現し、各言語の話題グラフを比較することで対象の話題の共通点や相違点を明らかできる。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(3 results)