• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

冪則の観点からの高度技術の評価方法に関する研究

研究課題

研究課題/領域番号 20K20492
研究機関東京大学

研究代表者

石井 久美子 (田中久美子)  東京大学, 先端科学技術研究センター, 教授 (10323528)

研究分担者 チン ユ  東京大学, 大学院新領域創成科学研究科, 教授 (00272394)
研究期間 (年度) 2020-07-30 – 2025-03-31
キーワード冪乗則 / ビッグデータ / 深層学習モデル
研究実績の概要

本提案では、高度科学技術が、複雑な対象に関する活動において、人間にどこまで近付いているかを客観的に評価する手法を、「冪乗則」の観点から評価する方法を提案することを目的とする。本研究では、言語、経済データ、画像など、人が生み出すデータコンテンツに対して、そこに内在する冪的特性を調査する。それを扱う機械学習モデルがどの程度その特性を再現するかを調べ、その差異を元に、機械が人間にどの程度近づいたかを評価する方法を考える。
期間二年目は、初年度に積み残した環境整備を行った。コロナ禍で購入をすることができなかった深層学習用機械を設置した。また、データの入手についても、引き続き進めた。
研究実績は以下となる。言語データについては、初年度にまとめた書籍を完成させ出版した。英文版をSpringerから、和文版を東大出版会より5月に出版した。和文版に対して2021年12月に、毎日出版文化賞を受賞し、本開拓研究の大きな実績となった。さらに、書籍では扱わなかった冪乗則の実態を調査した。特に、言語の構文の中にあるMenzerathAltmann則に関して、また、ゆらぎ解析の異なる手法を比較し、雑誌論文を発表した。
経済データについては、エージェントベースモデルを用いて国民性格の分布の差異から資産分布のPower-Lawに与える影響を調べ、国内雑誌論文として発表した。また、系列についてはボラティリティに基づく研究を進め、雑誌論文の条件付き採録を得た。冪乗則に従うデータのモデルとして、新しい方式を考案し、現在論文を投稿中である。
画像データについては、Power-Law Shot Noise Modelを用いて肝臓の超音波検査画像内に存在する組織の中で腫瘍の分類感度を向上させた。学生が博士号を取得し、現在その論文は雑誌論文として投稿中である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2年目は、初年度に引き続きコロナ禍を原因として、予定通りにはいかないことが多かった。特に初年度よりDeepLearning用機械を一機購入することが予定されていたが、世界的な半導体の不足により、機械を確保することが難しく、1年がかりで努力を重ね、やっと年度末ギリギリに導入された。本機の導入により、3年目以降は研究が加速される。
一方のデータの収集であるが、研究の提案当初は、画像としては美術データなどを用いることを考えていた。しかし、世界的に美術館の人員がテレワークとなり、画像データの公開が遅れて見通しがたたず、絵画データの入手は困難な状況が続いている。また、美術データについては、冪乗則に関して既存論文が知られることも明らかとなった。この点、共同研究者が、画像としては医療データを用いることに活路を見出した。産業応用の観点からも、医療画像データの方が実り多いことは確実であることから、本プロジェクトでは、今後は画像データでは主に医療データを中心に据える。
対外的な関係が必須となる、研究の下支え部分のマネージメントは、コロナ禍では困難が続くが、研究自体は、実績はむしろ順調に積むことができた。第一に、言語の研究ついては、これまでの知見を一書とする書籍が出版され、毎日出版文化賞を得た。また、冪乗則に関わる新しい研究のアプローチを見出した。経済データの冪乗則についても、初年度の知見を踏まえ、今年度は順調に成果が挙がっている。画像については、分担者が肝臓の超音波画像データの中に冪乗則を計測する手法を確立させ、それを元に肝臓癌検出の論文として発表した。いずれのデータについても、論文発表は順調に行うことができた。
以上から、2年目の進捗としては計画どおりであるとの自己判断である。

今後の研究の推進方策

3年目以降は、これまでの研究を踏まえ、以下の三つの方針で研究を行い、論文発表を行い、応用を見出していく。方針には、三つの方向が含まれる。第一は、データの複雑さを捉えるための、これまでとは異なる別の解析方法を見出すことである。特に、異種のデータを扱うことが本プロジェクトの特徴であるが、解析方法をデータに横断的に調べることで、新しい解析手法に到達することができる見込みである。第二は、冪乗則に従っている分布を、捉えやすい形に変換することにより、扱いやすくする研究である。これは予測など工学応用に直結するものである。第三は、冪分布に従うデータは、予測の難しい対象であるが、言語と経済データなど、データを複合的に扱うことで、この困難を補完する方法の研究を行うことである。
言語データについては、第一の方針で基礎的な研究を進める。特に、次元解析という、画像や経済データにおいて適用されてきた既存解析手法を新手法を見出しつつあり、3年目に基礎的な論文発表を行う。
経済データについては、2年目のアイデアを受け、第二、第三の方針で研究を進める。経済データの変換方式を実現させ、また言語データを利用することで冪分布に従う価格・ボラティリティの予測性能を向上させる。また、共同研究者が、マルチシナリオシミュレーションを通して、国民性格分布による資産分布のPower-Lawの変化における機構解明を行う。
画像データについては、第一の方針で研究を行う。特に、言語や経済データで行われてきた解析手法の研究を推し進め、病変検出などの応用の可能性を明らかにする。特に、肝臓の超音波検査画像に対して、腫瘍以外の組織に関しても分類性能の向上を目指し、Power-Law Shot Noise Modelを使用した組織特性指標の抽出方法の改良を行う。

次年度使用額が生じた理由

コロナ禍により、予定していた学会等がオンライン開催になったため。次年度以降に利用予定である。

  • 研究成果

    (16件)

すべて 2022 2021 その他

すべて 雑誌論文 (5件) (うち査読あり 3件、 オープンアクセス 2件) 学会発表 (7件) (うち国際学会 1件、 招待講演 6件) 図書 (2件) 備考 (1件) 産業財産権 (1件) (うち外国 1件)

  • [雑誌論文] Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts2022

    • 著者名/発表者名
      Xin Du and Kumiko Tanaka-Ishii
    • 雑誌名

      Knowledge-Based Systems(Conditional acceptance)

      巻: *** ページ: ***

    • 査読あり
  • [雑誌論文] Improving the sensitivity of liver tumor classification in ultrasound images with a power-law shot noise model2022

    • 著者名/発表者名
      Kenji Karako, Kumiko, Yuichiro Mihara, Junichi Arita, Akihiko Ichida, Bae Sung, Yoshikuni Kawaguchi, Takeaki Ishizawa, Nobuhisa Akamatsu, Junichi Kaneko, Kiyoshi Hasegawa, Yu Chen
    • 雑誌名

      Biosciencetrends(投稿中)

      巻: *** ページ: ***

  • [雑誌論文] Menzerath's law in the syntax of languages compared with random sentences2021

    • 著者名/発表者名
      Kumiko Tanaka-Ishii
    • 雑誌名

      Entropy

      巻: 23(6) ページ: e23060661

    • DOI

      10.3390/e23060661

    • 査読あり / オープンアクセス
  • [雑誌論文] A comparison of two uctuation analyses for natural language clustering phenomena: Taylor vs. Ebeling& Neiman methods2021

    • 著者名/発表者名
      Kumiko Tanaka-Ishii and Shuntaro Takahashi
    • 雑誌名

      Fractals

      巻: 29(2) ページ: 2150033

    • DOI

      10.1142/S0218348X2150033X

    • 査読あり / オープンアクセス
  • [雑誌論文] 言語の長相関と文構造2021

    • 著者名/発表者名
      田中久美子
    • 雑誌名

      数学セミナー

      巻: 7 ページ: 8-12

  • [学会発表] 複雑系の視点からの言語とプログラムの差異2022

    • 著者名/発表者名
      田中久美子
    • 学会等名
      ソフトウエア技術者会議(SEA) フォーラム
    • 招待講演
  • [学会発表] 言語を複雑系として捉える試み2022

    • 著者名/発表者名
      田中久美子
    • 学会等名
      言語処理学会大会
    • 招待講演
  • [学会発表] 言語の長相関2021

    • 著者名/発表者名
      田中久美子
    • 学会等名
      応用数理学会大会
    • 招待講演
  • [学会発表] Long Memory underlying Language2021

    • 著者名/発表者名
      Kumiko TANAKA-ISHII
    • 学会等名
      International Conference on Quantitative Linguistics
    • 国際学会 / 招待講演
  • [学会発表] 「カオスを生きる:「デジタルは『ちょうどいい道具』になれるのか~個人データと自己の関係~」2021

    • 著者名/発表者名
      田中久美子(共同研究者七丈直弘教授による代理登壇)
    • 学会等名
      代表を務めたRISTEX-HITE プロジェクトの招待講演
    • 招待講演
  • [学会発表] 複雑系科学の観点からの言語研究の試み2021

    • 著者名/発表者名
      田中久美子
    • 学会等名
      NLP コロキウム
    • 招待講演
  • [学会発表] A multi-agent simulation of wealth distribution under the influence of personalities2021

    • 著者名/発表者名
      Ganghao Liu and Yu Chen
    • 学会等名
      Japan Society for Artificial Life - Workshop
  • [図書] 言語とフラクタル2021

    • 著者名/発表者名
      田中久美子
    • 総ページ数
      344
    • 出版者
      東京大学出版会
  • [図書] Statistical Universals of Language: Between Mathematical Chance and Human Choice2021

    • 著者名/発表者名
      Kumiko Tanaka-Ishii
    • 総ページ数
      244
    • 出版者
      Springer
  • [備考] 深層学習技術に基づく株ポートフォリオ配信サイト

  • [産業財産権] 情報処理装置、その制御方法、プログラム、ならびに、学習済モデル2021

    • 発明者名
      杜キンand 田中久美子
    • 権利者名
      杜キンand 田中久美子
    • 産業財産権種類
      特許
    • 産業財産権番号
      PCT/JP2021/003815
    • 外国

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi