• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

集合知に基づくVI上昇予測モデルの実用化に向けたパイロットプラントの構築

研究課題

研究課題/領域番号 20K01863
研究機関東京都市大学

研究代表者

梅原 英一  東京都市大学, メディア情報学部, 教授 (00645426)

研究分担者 諏訪 博彦  奈良先端科学技術大学院大学, 先端科学技術研究科, 特任准教授 (70447580)
小川 祐樹  立命館大学, 情報理工学部, 講師 (40625985)
研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード日経VI予測モデル / 自然言語処理 / 機械学習 / 株式市場 / ソーシャルメディア
研究実績の概要

2020年度は新型コロナ感染症のためヤフーの本番サーバにアクセスすることができなかった。ヤフー社内の本番サーバにアクセスするためには、ヤフーの東京本社か大阪オフィスに出社する必要があったためである。しかし、新型コロナの影響で我々のヤフー社内への入館が禁止された。このためヤフー本番サーバに構築する必要のあるパイロットプラント構築作業はできなかった。
そこで今年度は日経VI上昇予測のロジック改善の検討と、事例研究として株式市場のコロナショックの期間におけるヤフー株式掲示板の話題変化と株式指標との関係について分析した。
第1のロジック改善については、既存のLDA(Latent Dirichlet Allocation)に加え新たにDoc2VecとBERTを試みた。結果は、言語モデルの違いで精度向上は見られなかった。しかし、日経VI上昇は正解ラベルの数が極めて少ないという特徴がある。そこでダウンサンプリング(正例負例比率を3:7または5:5とする)とすると精度向上が見られた。そこで今後はダウンサンプリングの手法を検討することとする。
第2の株式市場におけるコロナショックとヤフー株式掲示板の投稿内容の分析については、これまで順調な上昇相場であった株式市場がコロナショックにより乱高下した。この時期の投稿内容の変化に着目し、日経VIとの関係を調べた。掲示板のトピック抽出にはLDAを用いた。この結果からトピックに関する相関係数が入れ変わっている点があることが観測された。そこで統計的手法であるクラスター分析を用いてトピックのグルーピングを行った。その結果、5グループに分かれた。日経VIが低い時には政治的なトピックが多いこと、トピックが入れ替わる時期には、第4グループが多く出現することが分かった。今後、この点を詳細に調査し、トピックに切り替わりタイミングを用いた日経VI上昇予測との関係を分析してゆく。

現在までの達成度 (区分)
現在までの達成度 (区分)

4: 遅れている

理由

新型コロナ感染拡大の影響で、我々がヤフー社内へ入館することは禁止された。このためヤフーの本番サーバにアクセスすることができなかった。ヤフーデータの個人情報保護のために、ヤフー本番サーバにアクセスするには、我々がヤフーの東京本社か大阪の現地に出向く必要があるためである。このため、ヤフー本番環境で開発が必要な実証用のパイロットプラントシステムの構築はできなかった。この点に関しては、東京および大阪の新型コロナ感染症がある程度収束してからでないと再開はできない。
そこで2020年度はヤフー本番サーバにアクセスしなくても分析可能な範囲で研究を行ってきた。

今後の研究の推進方策

実証用のパイロットプラントシステムの構築は、東京・大阪の新型コロナ感染症が落ち着いて、我々がヤフー社内への入館が認められてからとなる。ヤフー本番サーバへのアクセスが許可された時点で再開する。現在の感染状況から判断すると、ワクチン接種が広く行われる夏以降になる可能性が高い。
それまでは、研究環境にある既存データを用いて、日経VI予測モデルの精度向上に努める。2020年度の成果を踏まえて、話題の変化タイミングの捕捉と正例負例の比率を検討する。また、この分野での国内会議等での対外発表も今年度は行ってゆく予定である。

次年度使用額が生じた理由

新型コロナウイルス感染症拡大のため、共同研究契約を締結しているヤフーの本番サーバにアクセスすることができなかった。このため当初予定していた作業が行えなかった。作業を予定していた学生アルバイトの謝金や交通費等を使うことができなかった。ヤフー本番サーバを用いた分析が行えなかったので、学会発表等の旅費等も発生しなかった。
2020年度は手元にある開発環境での分析に限定して行った。学会発表も国内会議のみに限定した。主にオンライン会議であったので旅費等も発生しなかった。
新型コロナウイルス感染症が収束して、ヤフー本番サーバにアクセスできるようになれば,この研究の遅れを取り戻す予定である。このための費用を2020年度分から執行する予定である。

  • 研究成果

    (11件)

すべて 2021 2020

すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (8件) (うち招待講演 1件)

  • [雑誌論文] 大学図書館のデジタル・トランスフォーメーションに対する組織のIT活用能力2021

    • 著者名/発表者名
      梅原英一
    • 雑誌名

      日本印刷学会誌

      巻: 58 ページ: 18-22

    • DOI

      10.11413/nig.58.18

  • [雑誌論文] 組織における個人情報保護行動モデルの構築-従業員の個人情報保護行動を促進するためには-2020

    • 著者名/発表者名
      梅原英一,加藤奈美恵,諏訪博彦,小川祐樹,杉浦昌
    • 雑誌名

      社会情報学

      巻: 8 ページ: 81-95

    • DOI

      10.14836/ssi.8.3_81

    • 査読あり
  • [雑誌論文] 否決された大阪都構想のTwitter投稿における世論形成理論成立の考察2020

    • 著者名/発表者名
      林浩輝,梅原英一,小川祐樹
    • 雑誌名

      社会情報学

      巻: 8 ページ: 165-175

    • DOI

      10.14836/ssi.8.3_165

    • 査読あり
  • [学会発表] ヤフーファイナンス掲示板を用いたコロナ・ショックにおける投資家の話題変化と株式指標の関係2021

    • 著者名/発表者名
      佐々木皓大,諏訪博彦,小川祐樹,梅原英一,山下達雄,坪内孝太,安本慶一
    • 学会等名
      第27回社会情報システム学シンポジウム
  • [学会発表] ヤフーファイナンス掲示板の投稿を用いた株投資リスク低減のための日経VI上昇予測2021

    • 著者名/発表者名
      佐々木皓大,諏訪博彦,小川祐樹,梅原英一,山下達雄,坪内孝太,安本慶一
    • 学会等名
      社会システムと情報技術研究ウィーク
  • [学会発表] マルチエージェント ・ シミュレーションによる従業員を新型コロナ感染から守る対策の提案2021

    • 著者名/発表者名
      杉本明隆,梅原英一
    • 学会等名
      第27回社会情報システム学シンポジウム
  • [学会発表] 2019 年参議院議員選挙におけるTwitter分析2021

    • 著者名/発表者名
      有谷 公輔,梅原 英一
    • 学会等名
      信学技報 LOIS2020-47
  • [学会発表] 遠隔グループワーク支援システムの開発2021

    • 著者名/発表者名
      何 双兵,梅原 英一
    • 学会等名
      情報処理学会第83回全国大会
  • [学会発表] 2019年大阪ダブル選挙におけるTwitter分析2020

    • 著者名/発表者名
      梅原英一,小川祐樹,平川敦貴
    • 学会等名
      2020年人工知能学会全国大会
  • [学会発表] 大学のデジタル化に対する組織のIT活用能力と従業員の能力開発2020

    • 著者名/発表者名
      梅原英一
    • 学会等名
      経営情報学会2020年秋季全国研究発表大会
  • [学会発表] 大学のデジタル化と大学図書館の電子化の課題2020

    • 著者名/発表者名
      梅原英一
    • 学会等名
      日本印刷学会2020年全国大会
    • 招待講演

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi