2018 Fiscal Year Annual Research Report
マイクロブログで言及される事物に関する緊急イベントの究明とその実時間モニタリング
Project/Area Number |
18J22830
|
Research Institution | The University of Tokyo |
Principal Investigator |
赤崎 智 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2018-04-25 – 2021-03-31
|
Keywords | Webマイニング / ソーシャルメディア / 自然言語処理 / 固有表現抽出 / エンティティリンキング |
Outline of Annual Research Achievements |
本研究では,「総武線の遅延」,「SMAPの解散」,「iPhone 8の爆発」,「Nintendo Switchの発売」などの,人の意思決定に影響を与える「事物の緊急イベント」をマイクロブログからリアルタイムで発見するシステムを実現する.まず,事物の緊急イベントというのは自明ではないため,過去の新聞やニュース記事などのイベントからマイクロブログ上で反響のあったイベントを見つけ出し,それに関するマイクロブログの言及をパターンとしてデータベースに集積する.次に,低頻度だが多数のロングテールな事物や新規に発生する事物については,緊急イベントを発見するための統計的な手がかりが得られないため,その事物の概念(上位語)を推定する手法を確立する.以上の2つの技術を統合し,緊急イベントに関する言及のパターンを事物の概念単位で共有し,あらゆる事物の緊急イベントのリアルタイムな把握を実現することを目的とする. 本年度は研究課題の将来のデモシステム化を見据え,修士課程在学時の研究内容であるマイクロブログから未知の事物を発見する手法を更に発展させ精度向上に務めた.具体的には,事物を発見する機械学習モデルの訓練データを自動的に収集する遠距離教師あり学習の手法を改善し,さらに機械学習モデルとして深層学習をベースとしたLSTM-CRFを採用することで大幅な精度向上を達成した.また,本研究でも対象とするロングテールな事物についても,大量かつリアルタイムに発見できることを確認した.当該内容については,人工知能学会にて発表を行い,トップ人工知能会議であるIJCAIにも採択された.また,当該内容についてのデモシステムの簡易版を実装し,システム化した際の挙動の確認も行なった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画として予定していた「事物の上位語やタイプへの汎化」に関する手法を検討し,手法の実装を終了しある程度の精度を達成しているため,本研究は概ね順調に進展していると考えている.
|
Strategy for Future Research Activity |
「事物の上位語やタイプへの汎化」について実装した手法の詳細な実験を行い,結果を国内・国際会議へと投稿することを検討している.また,研究計画として予定している,「マイクロブログ上で反響のあったイベントを見つけ出し,それに関するマイクロブログの言及の収集」についても手法の実装を行う.
|
Research Products
(11 results)