• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

冪則の観点からの高度技術の評価方法に関する研究

Research Project

Project/Area Number 20K20492
Research Category

Grant-in-Aid for Challenging Research (Pioneering)

Allocation TypeMulti-year Fund
Review Section A New Phase of Our Advanced Science and Technology Society
Research InstitutionWaseda University (2023)
The University of Tokyo (2020-2022)

Principal Investigator

石井 久美子 (田中久美子)  早稲田大学, 理工学術院, 教授 (10323528)

Co-Investigator(Kenkyū-buntansha) チン ユ  東京大学, 大学院新領域創成科学研究科, 教授 (00272394)
Project Period (FY) 2020-07-30 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥25,870,000 (Direct Cost: ¥19,900,000、Indirect Cost: ¥5,970,000)
Fiscal Year 2024: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2023: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2022: ¥7,410,000 (Direct Cost: ¥5,700,000、Indirect Cost: ¥1,710,000)
Fiscal Year 2021: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2020: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Keywords冪乗則 / 複雑系 / 系列データ / 言語データ / 経済データ / 画像データ / ビッグデータ / 深層学習モデル / 評価指標 / 数理モデル / 機械学習
Outline of Research at the Start

科学技術による人間および社会の変容を考察するには、その変容を評価することが必須である。本提案では、高度科学技術による複雑な対象の処理が、人間のそれにどこまで近付いているかを「冪乗則」の観点から評価する方法を提案する。人の主要なデータ・コンテンツとして、言語、株価、画像を対象とする。まず、そこに内在する冪的特性の実態を、既存研究をふまえて探究する。その上で、これらのデータを扱う数理モデルの冪的特性を吟味する。数理モデルには、高度科学技術の基礎となっている深層学習技術が含まれる。最後に、人のデータと、数理モデルの二者を冪乗則の観点から比較検討し、差異を具体的に評価する新しい方法を生み出す。

Outline of Annual Research Achievements

研究期間後半は、三つの方針の下で進めている。
第一は、データの複雑さを捉えるための、これまでとは異なる解析方法を見出すことである。まず、自然言語の大規模モデルを通して、言語の相関次元を計測し、本成果は物理学の難関英文論文として採録となった。また、河川の分岐などを対象に、冪乗則の観点から考察されているストラー数を自然言語の文構造に対して計測し、認知科学で知られる既存の重要成果との接点を理論的に。統計物理分野論文に採録となりHighlightsとして選ばれた。さまざまな数理モデルの冪的特性の再現度合いが論じられ、機械の人間からの差を評価する方法が論じられた。
第二は、系の冪乗則をより良く捉える研究で、冪分布を捉えやすい形に変換して扱いやすくしたり、シミュレーションにより、系を捉える研究を行った。まず、経済データの分布は冪的として知られるが、それをガウス分布にニューラルネットワークを用いて変換し、ボラティリティ予測を行い、変換が予測に有効であることを示した。本研究は経済系の国際会議論文として採録となった。また、エージェントベースモデルを用いて、経済予測の根幹となる、人間の特性と富の分布の相互関係を調べた。両者の共進化関係が示唆され、人間の経済活動におけるダイナミクスの理解に貢献する内容を、国際会議にて発表した。
第三は、冪分布に従うデータは、予測の難しい対象であるが、データを複合的に扱うことで、困難を緩和する方法の研究である。経済事象の中でも、特に予測が難しい長期予測に対して、言語データを組み合わせると、有意に良い予測が実現できることが示され、国際会議において2件採録・発表した。これら成果は、言語を利用した、新たな応用の可能性を示している。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

期間4年目は、その最初に、代表者が所属機関を移籍し、新しい機関での活動立ち上げを行う必要があった。前任者の退官前の機関所属(「先取り人事」)であったため、代表者のオフィスが実質無く、研究室のスペースも仮であり、研究を実施する上でス困難な1年を過ごした。オフィスの状況は、2024年度初頭に改善され、最終年度当初は研究スペースの立ち上げを要しオーバーヘッドが大きい。
本研究プロジェクトは、期間を通して、コロナ禍、代表者の在外研究、代表者の所属機関の異動、先取り人事でスペースが仮の状態、など研究を安定して遂行することが困難な状況が続き、この困難は、最終年度にまで上に説明したように、持ち越されている。とはいえ、本プロジェクトの進捗は、極めて順調であるとの自己判断である。
期間初頭には、研究書籍の大賞受賞など、事前研究がまとめられ研究の前線が整理された。その上で、後半には新しい研究の方向性に着手できている。機関全体を通して、人のデータに内在する冪的特性が探求され、それに基づき大規模言語モデルを含む数理モデルの再現度合いが論じられた。冪的特性が、機械と人間の差を質・量の両方の観点から評価することが探求された。3,4年目の取り組みで、言語については、新しい冪乗則の解析手法が見出された。経済データについては、冪乗則を捉えて予測に生かすための新しい方法論が、応用の可能性をふまえて得られた。さらに言語と経済の両方を捉えた融合研究が行われた。画像についても、冪乗則を生かし、肝ガンを画像から検出する応用研究に結びついている。最終年度は、研究のまとめを行う。

Strategy for Future Research Activity

最終年度は、これまでの成果をふまえ、未発表内容の論文化を進め、研究プロジェクト全体をまとめる。その方針として、3,4年目同様に三つの方向に沿って行う。
第一は、データの複雑さを捉えるための、これまでとは異なる別の解析方法を見出すことである。第二は、系の冪乗則を捉える研究である。冪乗則に従っている分布を捉えやすい形に変換して扱いやすくしたり、またシミュレーションを行うことで、系を捉える研究を行うことである。第三は、冪分布に従うデータは、予測の難しい対象であるが、データを複合的に扱うことで、この困難を補完する方法の研究を行うことである。人のデータに内在する冪的特性が探求され、数理モデルの再現度合いをふまえ、機械と人間の差を冪指数などとして評価する方法をまとめる。
データ別では以下の通りである。言語データについては、特に第一の方針で基礎的な研究が進んでいる。4年目に見出した相関次元の研究の関連研究を進め、最終年度中に論文発表を目指す。
経済データについては、株価について、分布を変換する方法を2年目に着想し、4年目に発表した。本件に関して、まだ未発表部分があるため、その論文発表を目指す。エージェントモデルを用いて、4年目に続き、人間の経済活動を模したエージェントベースモデルに基づき、最終年度は理論的な考察を行う。
最後に画像データについては、第一の方針で研究を行ってきたが、その数理モデルが3年目に実現した。画像データの冪乗則は、既存研究でも知られ、言語データによる「タグ」のふるまいは、言語データのそれを敷衍して考えることができる。画像については最終年度は、これまでの成果を全体の中で考察しまとめるにとどめられる。

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (31 results)

All 2024 2023 2022 2021 2020 Other

All Journal Article (10 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 7 results,  Open Access: 5 results) Presentation (15 results) (of which Int'l Joint Research: 6 results,  Invited: 8 results) Book (4 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results) (of which Overseas: 1 results)

  • [Journal Article] Correlation dimension of natural language in a statistical manifold2024

    • Author(s)
      Xin Du and Kumiko Tanaka-Ishii
    • Journal Title

      Physical Review Research

      Volume: -

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Improving the sensitivity of liver tumor classification in ultrasound images <i>via</i> a power-law shot noise model2023

    • Author(s)
      Karako K, Mihara Y, Hasegawa K, Chen Y
    • Journal Title

      BioScience Trends

      Volume: 17 Issue: 2 Pages: 117-125

    • DOI

      10.5582/bst.2023.01040

    • ISSN
      1881-7815, 1881-7823
    • Year and Date
      2023-04-30
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 言語はファイナンス工学にどのように寄与し得るか-大規模言語モデルChatGPTとそれを支えるAI技術の盲点-2023

    • Author(s)
      田中久美子
    • Journal Title

      証券アナリストジャーナル

      Volume: 11(61) Pages: 73-82

    • Related Report
      2023 Research-status Report
  • [Journal Article] Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts2022

    • Author(s)
      Xin Du and Kumiko Tanaka-Ishii
    • Journal Title

      Knowledge-Based Systems

      Volume: 249 Pages: 108917-108917

    • DOI

      10.1016/j.knosys.2022.108917

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Journal Article] Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts2022

    • Author(s)
      Xin Du and Kumiko Tanaka-Ishii
    • Journal Title

      Knowledge-Based Systems(Conditional acceptance)

      Volume: ***

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] Improving the sensitivity of liver tumor classification in ultrasound images with a power-law shot noise model2022

    • Author(s)
      Kenji Karako, Kumiko, Yuichiro Mihara, Junichi Arita, Akihiko Ichida, Bae Sung, Yoshikuni Kawaguchi, Takeaki Ishizawa, Nobuhisa Akamatsu, Junichi Kaneko, Kiyoshi Hasegawa, Yu Chen
    • Journal Title

      Biosciencetrends(投稿中)

      Volume: ***

    • Related Report
      2021 Research-status Report
  • [Journal Article] Menzerath's law in the syntax of languages compared with random sentences2021

    • Author(s)
      Kumiko Tanaka-Ishii
    • Journal Title

      Entropy

      Volume: 23(6) Issue: 6 Pages: 661-661

    • DOI

      10.3390/e23060661

    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] A comparison of two fluctuation analyses for natural language clustering phenomena: Taylor vs. ebeling& neiman methods.2021

    • Author(s)
      Kumiko Tanaka-Ishii and Shuntaro Takahashi
    • Journal Title

      Fractals

      Volume: 2 Issue: 02 Pages: 2150033-2150033

    • DOI

      10.1142/s0218348x2150033x

    • Related Report
      2021 Research-status Report 2020 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] 言語の長相関と文構造2021

    • Author(s)
      田中久美子
    • Journal Title

      数学セミナー

      Volume: 7 Pages: 8-12

    • Related Report
      2021 Research-status Report
  • [Journal Article] Automated liver tumor detection in abdominal ultrasonography with a modified Faster R-CNN architecture(in press)2021

    • Author(s)
      Karako, K., Mihara, Y., Arita, J., Ichida, A., Bae, S., Kawaguchi, Y., Ichizawa, T., Nobuhisa, A., Kaneko, J., Hasegawa, K., & Chen, Y.
    • Journal Title

      HepatoBiliary Surgery and Nutrition

      Volume: -

    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] 単語ベクトルに基づく新たな meaning-frequency law の検証.2024

    • Author(s)
      永田亮 田中久美子
    • Organizer
      言語処理学会第30回年次大会にて優秀賞受賞
    • Related Report
      2023 Research-status Report
  • [Presentation] Modeling momentum spillover with economic links discovered from financial documents2023

    • Author(s)
      Andy Chung and Kumiko Tanaka-Ishii
    • Organizer
      ACM International Conference on AI in Finance (ICAIF),
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Predictability of post-earnings announcement drift with textual and contextual factors of earnings calls2023

    • Author(s)
      Andy Chung and Kumiko Tanaka-Ishii
    • Organizer
      ACM International Conference on AI in Finance (ICAIF),
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Co-training realized volatility prediction model with neural distributional transformation2023

    • Author(s)
      Xin Du, Kai Moriyama, and Kumiko Tanaka-Ishii
    • Organizer
      ACM International Conference on AI in Finance (ICAIF),
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Human Signs through Semiotics of Computing2023

    • Author(s)
      Kumiko Tanaka-Ishii
    • Organizer
      Clare Hall Philosophy and History SIG Seminar
    • Related Report
      2022 Research-status Report
    • Invited
  • [Presentation] Semantic field of words represented as non-linear potental functions2022

    • Author(s)
      Xin Du and Kumiko Tanaka-Ishii
    • Organizer
      36th Conference on Advances in Neural Information Processing Systems
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Bonsai, Constaline and Language: Scale-Free Property of Natural Language2022

    • Author(s)
      Kumiko Tanaka-Ishii
    • Organizer
      Clare Hall Colloquium
    • Related Report
      2022 Research-status Report
    • Invited
  • [Presentation] 複雑系の視点からの言語とプログラムの差異2022

    • Author(s)
      田中久美子
    • Organizer
      ソフトウエア技術者会議(SEA) フォーラム
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] 言語を複雑系として捉える試み2022

    • Author(s)
      田中久美子
    • Organizer
      言語処理学会大会
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] 言語の長相関2021

    • Author(s)
      田中久美子
    • Organizer
      応用数理学会大会
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] Long Memory underlying Language2021

    • Author(s)
      Kumiko TANAKA-ISHII
    • Organizer
      International Conference on Quantitative Linguistics
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] 「カオスを生きる:「デジタルは『ちょうどいい道具』になれるのか~個人データと自己の関係~」2021

    • Author(s)
      田中久美子(共同研究者七丈直弘教授による代理登壇)
    • Organizer
      代表を務めたRISTEX-HITE プロジェクトの招待講演
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] 複雑系科学の観点からの言語研究の試み2021

    • Author(s)
      田中久美子
    • Organizer
      NLP コロキウム
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] A multi-agent simulation of wealth distribution under the influence of personalities2021

    • Author(s)
      Ganghao Liu and Yu Chen
    • Organizer
      Japan Society for Artificial Life - Workshop
    • Related Report
      2021 Research-status Report
  • [Presentation] Stock embeddings acquired from news articles and price history, and an ap-plication to portfolio optimization2020

    • Author(s)
      Xin Du and Kumiko Tanaka-Ishii
    • Organizer
      the 58th Annual Meeting of the Association for Computational Linguistics
    • Related Report
      2020 Research-status Report
    • Int'l Joint Research
  • [Book] Self-similar structure of sign systems: Not a metaphor. In Amir Bilgari, editor, Open Semiotics2022

    • Author(s)
      Kumiko Tanaka-Ishii
    • Publisher
      Hartman
    • Related Report
      2022 Research-status Report
  • [Book] 言語とフラクタル2021

    • Author(s)
      田中久美子
    • Total Pages
      344
    • Publisher
      東京大学出版会
    • Related Report
      2021 Research-status Report 2020 Research-status Report
  • [Book] Statistical Universals of Language: Between Mathematical Chance and Human Choice2021

    • Author(s)
      Kumiko Tanaka-Ishii
    • Total Pages
      244
    • Publisher
      Springer
    • Related Report
      2021 Research-status Report
  • [Book] Statistical Universals of Language: Between Mathematical Chance and Human Choice.2021

    • Author(s)
      Kumiko Tanaka-Ishii
    • Total Pages
      244
    • Publisher
      Springer
    • Related Report
      2020 Research-status Report
  • [Remarks] 深層学習技術に基づく株ポートフォリオ配信サイト

    • Related Report
      2021 Research-status Report
  • [Patent(Industrial Property Rights)] 情報処理装置、その制御方法、プログラム、ならびに、学習済モデル2021

    • Inventor(s)
      杜キンand 田中久美子
    • Industrial Property Rights Holder
      杜キンand 田中久美子
    • Industrial Property Rights Type
      特許
    • Filing Date
      2021
    • Acquisition Date
      2021
    • Related Report
      2021 Research-status Report
    • Overseas

URL: 

Published: 2020-08-03   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi