• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

学習なき発見のためのシーケンスデータ解析と可視化

Research Project

Project/Area Number 16K12428
Research InstitutionThe University of Tokyo

Principal Investigator

大澤 幸生  東京大学, 大学院工学系研究科(工学部), 教授 (20273609)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywords短時間シーケンスからの発見 / コンパクトデータ / データ市場 / 予兆発見
Outline of Annual Research Achievements

トレンドの変化点の抽出と、変化点前後におけるシーケンス全体の可視化についての基礎的なアルゴリズム群の開発を始めた。拙速に既存のAI技術を追わず「学習なき発見」という新パラダイムの本質を整理しつつある。
データの中で普遍的に出現するパターンの存在を前提とせず、従って大量のデータからの学習という既存のパラダイムに従うことなく、前後のトレンドを渡す「橋」(変化点)を検出するためのモデルを創るという単純な考え方を元として、この学習なき発見を実現する手法を探求している。
現状では、国際会議などで発表して「学習なき発見」の考え方をアピールし、ユーザのニーズや近い考えを持つ研究者のアイデアも収取して実データで試行しつつ原理確立に向かっている。このためにワークショップ手法IMDJによりデータユーザの要求と、変化点抽出技術の特性の関係を現場ユーザの協力を得てリンクしつつある。特に、学習なき発見は、利用に耐えるデータを収集した期間が短い人(コンパクトデータ保有者)も利用できる変化理解技術として、その社会的ニーズは巨大であることが把握できた。
アルゴリズム開発の視点からすれば、「学習なき発見」は、従来の変化検知の言葉でいえば時間ウィンドウ幅Wを非常に短く限定することにあたるので、これを最小化させる方向で研究を進めている既存研究とも比較しながら手法の開発を進めている。未発表の為に詳細はここに記載できないが、非常に短い単位時区間における事象群の確率分布の特徴を数量化し、その変化と、観測される重大事象の起きるタイミングを比較し有意な傾向を見出している。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

現在、AI分野において機械学習がトレンドの主流を占めているように見える潮流の外に足をおき、「学習なき発見」という新パラダイムの本質を整理するために、拙速な論文刊行に陥らず我が道を行く姿勢を重視している。この道の上で、本年度は有意な成果を得たと考えている。
その第一の理由は、大澤自身が創始したデータ市場に関連する国内外のワークショップ等において、「学習なき発見」やその背景にある考え方を示しつつ、その意義について、他のデータ分析技術や多様なデータの所在を総合的に考慮しながら検討を深めたことである。この結果、「学習なき発見」は、次のようなデータへの適用が期待されている社会的現状が表出化されたことは、本年度の狙いどおりである。①頻繁に文脈の変わるテキスト記事(ニュースなど)から、イノベーションのヒントを把握 ②スポーツにおける動作シーケンス:瞬時に文脈(試合における双方の狙い)が変わるとき、その変わり目を招く選手の意図と対応における意識の読み取り ③金融における取引シーケンスにおいて、買いではなく「売り」の判断 ④週ごとに扱う商品が更新されるスーパーマーケットのPOSデータから、顧客の動機を変化させる商品や情報の検出。
総じて、変化が速いため、その変化の背景を理解するために使える期間が短いデータ(コンパクトデータ)から、データに書かれていない文脈情報を捉えて意思決定に役立てることが学習なき発見への社会的期待であることが分かった。
第二に、アルゴリズム開発の視点からすれば、大澤の開発したTangled Stringをスポーツなどのデータにも適用した。この結果、上記の目的への有効性を検証しつつあり、スポーツ先端科学研究拠点のメンバーに加えられた。また、短期間の時区間データの特徴を数量化し、予兆数量化手法としての効果を検証し有意な傾向を見出しつつある。

Strategy for Future Research Activity

今後、学習なき発見を実現するアルゴリズムおよび、ヒューマンインタフェースの仕組み開発に入ってゆく。特に、参照データの時間ウィンドウ幅Wを短くすることは本質的である。このWは文脈の「期待持続性」、すなわち、どの程度の長さに渡り同じ文脈が持続するかという主観的な期待値を表す。
例えば、ある会話において「東京オリンピック」という語が、ある5分間は「エンブレム」について、次の5分間は「都民税」についての文脈で出現するとする。二つの文脈を別々のトレンドとして切り分ける為にはWを5分程度に設定すべきであるし、わずか5分間で両文脈が入り混じる会話の場合、文脈を二つに切り分けず一つの絡まりに融合して問題はないのでやはりWは5分程度で良い。
このように文脈の期待持続性は一種の時間経過プロセスのモデルであり、意思決定にとって重要な変化点を抽出する上で重要である。一方で、上記「進捗状況」に示したような社会的期待にかかわるデータにおいては、従来のトピックモデルの様に階層構造にはなっていないことが分かってきた。W値は対象データの種類ごとに経験的に指定できるので、これを一般化して、対象データについての専門家の経験から文脈の期待持続性を指定してもらう手法を開発する。すなわち、実業領域における文脈の期待持続性を調査しつつ、適切なアルゴリズムを開発して、分析→可視化→ユーザのコメント聴取→分析→可視化→・・・というプロセスのサイクルを最小化する技術の創造を狙ってゆく。
また地震データ等にも対象を広げ、時間のみならず空間のウィンドウ幅にも配慮しつつ、時空間的広がりのモデルがデータから学習できない場合に、狭いウィンドウのデータからも時区間前後への影響力を数値化する指標を開発する。また、ウィンドウ間の合成などを効率的に行う演算方法を開発する。

Causes of Carryover

進捗状況に記載したとおり、本研究の対象のひとつとしてニュース記事テキスト等が対象として有力であるとの知見を得たが、該当するデータは購入を要するため使途を切り替えた。この結果、物品費が予定を上回るため他の予算の使用を抑えた。このデータを分析する部分に人件費、また成果発表に旅費がかかるが、人件費の使用部分は来年度にまわし、現状は他のデータの分析と、上記ニュース分析の準備フェーズに充てている。
また、本年度の研究発表については、データ市場設計手法等を用いて関連領域の研究者や実務家から「学習なき発見」の社会的意義や性能を聴取するなど、他研究プロジェクト(企業との共同研究, JST CRESTなど)での成果の力も借りて生み出した内容が含まれるため、旅費を他プロジェクトから支出した。本プロジェクトに特化した成果発表は、来年度以降の旅費からとなるものと見込んでいる。

Expenditure Plan for Carryover Budget

人件費として、本年度に購入したニューズ記事および、国立情報学研究所経由で入手できるデータ、企業などから入手されるデータのうち、進捗状況に述べたような「発見なき学習」での解析が求められるデータの分析にあたる大学院生の謝金、関連成果の発表旅費などに充てる。
また、本研究の目的に特化したワークショップを開催し、その支援作業に学生をあて謝金などを支出する。さらに、その成果に関する発表のための旅費に充てたい。これらは、基本的なアルゴリズムの基礎モデル部分の開発を中心と考えていた二年目の作業としては、当初の予定よりも増加した作業となる。

  • Research Products

    (17 results)

All 2017 2016

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Acknowledgement Compliant: 1 results) Presentation (11 results) (of which Int'l Joint Research: 6 results,  Invited: 3 results) Book (1 results)

  • [Journal Article] BLOCKS: efficient and stable online visualization of dynamic network evolution2016

    • Author(s)
      Qi Ji, Yukio Ohsawa
    • Journal Title

      The Review of Socionetwork Strategies

      Volume: 10 Pages: 33-51

    • DOI

      10.1007/s12626-016-0062-y

    • Peer Reviewed
  • [Journal Article] Tangled String for Sequence Visualization as Fruit of Ideas in Innovators Marketplace on Data Jackets2016

    • Author(s)
      Yukio Ohsawa, Teruaki Hayashi
    • Journal Title

      Intelligent Decision Technologies

      Volume: 10 Pages: 235-247

    • DOI

      10.3233/IDT-150251

    • Peer Reviewed
  • [Journal Article] Visualization Method Based of Contour Map2016

    • Author(s)
      Rui Yang and Yukio Ohsawa
    • Journal Title

      Proc. IEEE International Conference on Data Mining Workshops

      Volume: 1 Pages: 826-830

    • DOI

      10.1109/ICDMW.2016.0122

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Sentence Clustering using PageRank Topic Model2016

    • Author(s)
      Kenshin Ikegami and Yukio Ohsawa
    • Journal Title

      Proceedings of PACLIC

      Volume: 1 Pages: 329-338

    • Peer Reviewed
  • [Journal Article] Non-Conformity Detection in High-Dimensional Time Series of Stock Market Data2016

    • Author(s)
      Akira Kasuga, Yukio Ohsawa, Yoshino T., Ashida S.
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 9799 Pages: 701-712

    • DOI

      10.1007/978-3-319-42007-3_60

    • Peer Reviewed
  • [Presentation] Market of Data for Communications toward Innovations2017

    • Author(s)
      Yukio Ohsawa
    • Organizer
      The International Conference on Innovation & Knowledge Management (iKM2017)
    • Place of Presentation
      清華大学 (北京)
    • Year and Date
      2017-03-16 – 2017-03-16
    • Int'l Joint Research / Invited
  • [Presentation] データジャケットにおける変数ラベルの共起性を考慮した変数ラベル推定手法の検討2017

    • Author(s)
      江本 守, 大澤幸生
    • Organizer
      電子情報通信学会 人工知能と知識処理研究会(AI):データ市場特集III
    • Place of Presentation
      就実大学(岡山県)
    • Year and Date
      2017-02-18 – 2017-02-18
  • [Presentation] データ市場における第三種の特徴量獲得 ~ チャンス発見の場の設計学 ~2017

    • Author(s)
      大澤幸生
    • Organizer
      電子情報通信学会 人工知能と知識処理研究会(AI):データ市場特集III
    • Place of Presentation
      就実大学(岡山県)
    • Year and Date
      2017-02-18 – 2017-02-18
  • [Presentation] 時系列データ可視化によるテニス選手の戦略分析2017

    • Author(s)
      吉鷹伸太朗, 大澤幸生
    • Organizer
      電子情報通信学会 人工知能と知識処理研究会(AI):データ市場特集III
    • Place of Presentation
      就実大学(岡山県)
    • Year and Date
      2017-02-18 – 2017-02-18
  • [Presentation] Visualization Method Based of Contour Map2016

    • Author(s)
      Rui Yang, Yukio Ohsawa
    • Organizer
      The 4th Workshop on Desigining the Market of Data, in IEEE International Conference on Data Mining Workshops
    • Place of Presentation
      Barcelona, Spain
    • Year and Date
      2016-12-12 – 2016-12-12
    • Int'l Joint Research
  • [Presentation] Evaluating model of traffic accident rate on urban data2016

    • Author(s)
      Jianshi Wang, Yukio Ohsawa
    • Organizer
      11th International Symposium Advances in Artificial Intelligence and Applications (AAIA'16)
    • Place of Presentation
      Gdansk, Poland
    • Year and Date
      2016-09-11 – 2016-09-11
    • Int'l Joint Research
  • [Presentation] Visualization of Superficial Similarities between Data Jackets for Aiding Creativity on Innovators Marketsplace on Data Jackets2016

    • Author(s)
      Norisada Masui, Yukio Ohsawa
    • Organizer
      20th International Conference on Knowledge Based and Intelligent Information and Engineering System
    • Place of Presentation
      York, UK
    • Year and Date
      2016-09-06 – 2016-09-06
    • Int'l Joint Research
  • [Presentation] Non-Conformity Detection in High-Dimensional Time Series of Stock Market Data2016

    • Author(s)
      Akira Hasuga, Yukio Ohsawa
    • Organizer
      The 29th Int'l Conf. IEA/AIE
    • Place of Presentation
      Morioka, Japan
    • Year and Date
      2016-08-02 – 2016-08-02
    • Int'l Joint Research
  • [Presentation] Sentence Clustering using PageRank Topic Model2016

    • Author(s)
      Kenshin Ikegami and Yukio Ohsawa
    • Organizer
      The 30th Pacific Asia Conference on Language, Information and Computation (PACLIC30)
    • Place of Presentation
      Seul, Korea
    • Year and Date
      2016-07-08 – 2016-07-08
    • Int'l Joint Research
  • [Presentation] チャンス発見学:医学研究の発想をいかに捉えてチャンスに活かすか2016

    • Author(s)
      大澤幸生
    • Organizer
      New Insight Crosstalk Meeting(NICM) 2016
    • Place of Presentation
      ホテルオークラ新潟(新潟県)
    • Year and Date
      2016-06-18 – 2016-06-18
    • Invited
  • [Presentation] AIは”バズワード”に堕ちたのか2016

    • Author(s)
      大澤幸生
    • Organizer
      人工知能学会全国大会メンタリングセッション講演
    • Place of Presentation
      北九州国際会議場(福岡県)
    • Year and Date
      2016-06-07 – 2016-06-07
    • Invited
  • [Book] データ市場2017

    • Author(s)
      大澤幸生, 早矢仕晃章, 秋元正博, 久代紀之, 中村潤, 寺本正彦
    • Total Pages
      289
    • Publisher
      近代科学社

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi