• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

ソーシャルビッグデータ解析のための適応的言語解析

研究課題

研究課題/領域番号 16K16109
研究機関東京大学

研究代表者

吉永 直樹  東京大学, 生産技術研究所, 准教授 (90773961)

研究期間 (年度) 2016-04-01 – 2018-03-31
キーワード自然言語処理 / ソーシャル・ビッグデータ / 知識獲得
研究実績の概要

(1) 本年度はソーシャル・ビッグデータ(特に、マイクロブログ)を適応的に言語解析する手法に関する研究開発を行った。具体的には、基礎解析において参照する知識を動的にソーシャル・メディアから獲得する研究を行い、リアルタイムで実世界イベントの話題が投稿される Twitter から Wikipedia に登録されていない未知エンティティを自動的に発見して収集する手法の開発を行った。提案手法では、エンティティが新たに発生して普及・認知される過程で、エンティティの新規性を示唆する表現が多く観測されることに注目し、未知エンティティ候補の文字列の周辺の言語表現を手がかりとして用いて、投稿から未知エンティティを収集する。既知エンティティと未知エンティティに関する投稿を混合した投稿から未知エンティティを検出する予備実験において、F1値 0.79(ベースライン0.66)で未知エンティティを検出できることを確認した。
(2) 本研究で開発する基礎解析器においては、タスクベースの数値評価を必ずしも重要視せず、実際のアプリケーションでの効果を意識して手法の研究開発を行う。そこで具体的なアプリケーションとして、係り受け解析等の基礎解析を利用してソーシャル・メディアから大衆の価値観を獲得する手法、及びリアルタイムで Twitter から大衆の価値観を獲得するシステムの開発を行った。また、(1) で獲得した知識自体の外的評価を行うため、発話状況を考慮した対話応答システムの研究開発を行った。
(3)_大規模評価用のマイクロブログコーパスの収集については、Twitter の投稿を API を利用して継続的に収集を進めており、1日あたり数千万件の収集体制を確立している。収集している投稿には、日本語に限らず多言語の投稿が含まれており、言語横断で実世界知識を収集することも可能な状態となった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度の研究開発により、マイクロブログを適応的に基礎解析する際に必要となる新情報(未知エンティティ)を収集する手法の開発が完了している。提案する知識獲得手法の有効性については、基礎解析での内的評価、及び応用での評価を通じて今後、確認を行う。
また、平成29年度に研究開発する基礎解析手法を評価するための基盤についても、基礎解析の内的評価を行う係り受け解析コーパスを除き、概ね整備された。
ソーシャルメディアを対象とした適応的な基礎解析手法については当初予定ほどの進展は見られなかったが、評価基盤については平成29年度に開発を予定していた実証評価のための基盤が整備できており、全体としては順調に進展している。

今後の研究の推進方策

平成29年度は、平成28年度に開発したマイクロブログからの未知エンティティ検出手法を元に獲得された知識を利用し、適応的に言語解析する手法の研究開発を行う。一方で、基礎解析(係り受け解析)の正解の付与されたマイクロブログコーパスを整備し、基礎解析手法の内的評価を行うとともに、平成28年度に開発したアプリケーションでの有効性を確認する。
なお、マイクロブログから得られた未知エンティティに関する知識は、単語分割や係り受け解析と言った基礎言語解析に限らず、機械翻訳や対話応答システムなど、広範な言語応用で直接的に活用できるものと期待できる。そこで、開発対象を単語分割や係り受け解析と言った基礎解析に必ずしも限定せず、広範な言語アプリケーションで活用できないかも合わせて検討を行う。

  • 研究成果

    (17件)

すべて 2017 2016

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 1件、 謝辞記載あり 4件) 学会発表 (13件) (うち国際学会 5件)

  • [雑誌論文] 石渡祥之佑,鍜治伸裕,吉永直樹,豊田正史,喜連川優2016

    • 著者名/発表者名
      文脈語間の対訳関係を用いた単語の意味ベクトルの翻訳
    • 雑誌名

      人工知能学会論文誌

      巻: 31(6) ページ: 1-10

    • DOI

      10.1527/tjsai.AI30-A

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Masahiko Itoh, Naoki Yoshinaga, Masashi Toyoda2016

    • 著者名/発表者名
      Word-Clouds in the Sky: Multi-layer Spatio-temporal Event Visualization from a Geo-parsed Microblog Stream
    • 雑誌名

      Proceedings of the 20th International Conference on Information Visualization (IV2016)

      巻: - ページ: 282-289

    • DOI

      10.1109/IV.2016.62

    • 査読あり / 謝辞記載あり
  • [雑誌論文] rdering Concepts Based on Common Attribute Intensity2016

    • 著者名/発表者名
      Tatsuya Iwanari, Naoki Yoshinaga, Nobuhiro Kaji, Toshiharu Nishina, Masashi Toyoda, Masaru Kitsuregawa
    • 雑誌名

      Proceedings of the 25th International Joint Conference on Artificial Intelligence (IJCAI-16)

      巻: - ページ: 3747-3753

    • 査読あり / 謝辞記載あり
  • [雑誌論文] マイクロブログからの社会的影響力を持つ情報カスケードの検知手法2016

    • 著者名/発表者名
      川本貴史, 豊田正史, 吉永直樹
    • 雑誌名

      情報処理学会論文誌データベース(TOD)

      巻: 9(2) ページ: 23-33

    • 査読あり / 謝辞記載あり
  • [学会発表] 暗黙の発話状況を考慮したニューラル対話モデル2017

    • 著者名/発表者名
      佐藤翔悦,吉永直樹,豊田正史,喜連川優
    • 学会等名
      言語処理学会第23回年次大会 (NLP2017)
    • 発表場所
      筑波大学,茨城県
    • 年月日
      2017-03-13 – 2017-03-17
  • [学会発表] 発生普及過程を捉えた未知エンティティの発見2017

    • 著者名/発表者名
      赤崎智,吉永直樹,豊田正史
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017)
    • 発表場所
      岐阜県高山市高山グリーンホテル,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] マイクロブログにおける画像投稿の文脈に基づくオンデマンド検索手法2017

    • 著者名/発表者名
      小泉実加,吉永直樹,豊田正史
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017)
    • 発表場所
      高山グリーンホテル,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] Inducing Writers' Values on Concept Ordering from Microblog2017

    • 著者名/発表者名
      Tatsuya Iwanari, Naoki Yoshinaga, Masashi Toyoda, Masaru Kitsuregawa
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM2017)
    • 発表場所
      高山グリーンホテル,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] 不足情報を自律的に問う対話エージェントの実現に向けた聞き返しの必要性検知2017

    • 著者名/発表者名
      大原 康平,佐藤 翔悦,吉永 直樹,豊田 正史
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM2017)
    • 発表場所
      高山グリーンホテル,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] Kotonush: Understanding Concepts Based on Values behind Social Media2016

    • 著者名/発表者名
      Tatsuya Iwanari, Kohei Ohara, Naoki Yoshinaga, Nobuhiro Kaji, Masashi Toyoda, Masaru Kitsuregawa
    • 学会等名
      Proceedings of the 26th International Conference on Computational Linguistics (COLING2016) system demonstrations
    • 発表場所
      大阪府立国際会議場,大阪府
    • 年月日
      2016-12-11 – 2016-12-16
    • 国際学会
  • [学会発表] テキストストリームから の 同名異義な未知 エンティティの検出2016

    • 著者名/発表者名
      赤崎智,乾孝司,吉永直樹,豊田正史
    • 学会等名
      NLP若手の会 第11回シンポジウム(YANS2016)
    • 発表場所
      ホテルシーモア,和歌山県
    • 年月日
      2016-08-28 – 2016-08-30
  • [学会発表] COMAVa: Concept Ordering Method for Acquiring Values2016

    • 著者名/発表者名
      岩成達哉,大原康平,吉永直樹,鍜治伸裕,豊田正史,喜連川優
    • 学会等名
      NLP若手の会 第11回シンポジウム (YANS2016)
    • 発表場所
      ホテルシーモア,和歌山県
    • 年月日
      2016-08-28 – 2016-08-30
  • [学会発表] Masahiko Itoh, Naoki Yoshinaga, and Masashi Toyoda,Word-Clouds in the Sky2016

    • 著者名/発表者名
      Masahiko Itoh, Naoki Yoshinaga, and Masashi Toyoda
    • 学会等名
      The 20th International Conference on Information Visualization (IV2016)
    • 発表場所
      リスボン,ポルトガル
    • 年月日
      2016-07-19 – 2016-07-22
    • 国際学会
  • [学会発表] Ordering Concepts Based on Common Attribute Intensity2016

    • 著者名/発表者名
      Tatsuya Iwanari, Naoki Yoshinaga, Nobuhiro Kaji, Toshiharu Nishina, Masashi Toyoda, Masaru Kitsuregawa
    • 学会等名
      Proceedings of the 25th International Joint Conference on Artificial Intelligence (IJCAI-16)
    • 発表場所
      ニューヨーク,アメリカ
    • 年月日
      2016-07-09 – 2016-07-15
    • 国際学会
  • [学会発表] UT Dialogue System at NTCIR-12 STC2016

    • 著者名/発表者名
      Shoetsu Sato, Shonosuke Ishiwatari, Naoki Yoshinaga, Masashi Toyoda and Masaru Kitsuregawa
    • 学会等名
      NTCIR-12 Conference on Evaluation of Information Access Technologies (NTCIR-12), STC: Short Text Conversation
    • 発表場所
      学術国際センター,東京都
    • 年月日
      2016-06-07 – 2016-06-10
    • 国際学会
  • [学会発表] 佐藤 翔悦, 石渡 祥之佑, 吉永 直樹, 豊田 正史, 喜連川 優2016

    • 著者名/発表者名
      発話状況を意識したオンライン上の対話における応答選択
    • 学会等名
      2016年度 人工知能学会全国大会
    • 発表場所
      北九州国際会議場,福岡県
    • 年月日
      2016-06-06 – 2016-06-09
  • [学会発表] Instant Translation Model Adaptation by Translating Unseen Words in Continuous Vector Space2016

    • 著者名/発表者名
      Shonosuke Ishiwatari, Naoki Yoshinaga, Masashi Toyoda, Masaru Kitsuregawa
    • 学会等名
      The 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2016)
    • 発表場所
      コンヤ,トルコ
    • 年月日
      2016-04-03 – 2016-04-09
    • 国際学会

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi