2020 Fiscal Year Research-status Report
Project/Area Number |
20K20492
|
Research Institution | The University of Tokyo |
Principal Investigator |
石井 久美子 (田中久美子) 東京大学, 先端科学技術研究センター, 教授 (10323528)
|
Co-Investigator(Kenkyū-buntansha) |
チン ユ 東京大学, 大学院新領域創成科学研究科, 教授 (00272394)
|
Project Period (FY) |
2020-07-30 – 2025-03-31
|
Keywords | 冪乗則 / ビッグデータ / 深層学習モデル |
Outline of Annual Research Achievements |
言語については、既存成果が書籍にまとめられ、プロジェクトの見通しが立てられた。言語は系列であり、系列は要素が列に並ぶものであるため、冪乗則は、要素の分布に関するものと、系列に関するものとに分けられる。それぞれの詳細を整理し、冪乗則の種類を整理した。また、冪乗則が生成される数理的理由と考察をまとめた。既存の言語モデルの中で最新の深層学習アーキテクチャに基づく言語モデルだけが、冪乗則を概ね満たすことを論じた。とはいえ、その満たし方には、未だ限界もあることが整理された。この他、本書籍の先の研究を進め、2編の論文をまとめた。 経済データについては、冪乗則の実態を調査した。経済データの冪乗則は、言語のそれよりも研究の歴史が厚く、また古いため、さまざまなサーベイが出版されている。サーベイを通し、経済データにおいても、言語と同様の状況であることが理解された。また、深層学習を利用した経済モデルの一つにおいて、リターンの冪則がどのようになるかを調べた。現実のデータは、モデルのそれよりも、テールが厚く、レアイベントが多いことが確認された。 画像データについては、主として分担者が大きな一歩となる成果を挙げた。具体的には、肝臓の超音波検査から出力される画像データに対して、その冪則の成立を調べた。結果、局所的な画像の冪則の傾きの変化により、肝臓の組織から腫瘍を検知する可能性を確認した。 初年度の研究で、言語については、これまでの成果が、ひとまとまりのものとして整理され、本プロジェクトの今後の布石が得られ、より大きな視点から、経済データや画像データにおいて見るべき観点が整理された。このため、この大綱の下で次年度以降の研究は進めることができるようになった。 コロナ禍にあって、予定が前後してはいるが、予定が遅れたのは環境整備についてだけであり、実際の研究については予定より早く進んでいる。概ね、順調であるといえる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は、コロナ禍にあり、難しい年であった。まず研究環境を整えるために、DeepLearning用機械を一機購入する予定であったが、新製品発売の遅延があり、またそれに関わる情報の信頼性が疑われ、さらにテレワークの要請から設置が困難となったため、初年度は、既存の機器で可能な範囲の研究を行うことにした。また旅費は全く使用しなかった。 環境整備には、データの整備も含まれる。言語・経済については、必要なデータをテレワークの範囲で整えることができた。特に、経済関連の新聞データを入手し、整備した。また、経済データについては、高頻度データの入手を進め、二年目に入手予定である。一方、画像データについては、 目的の新しいデータセットが開示されるはずであったが、それがコロナ禍により遅延している。もともと、画像データについては二年目以降に主として取り組む予定であるため、データの入手を引き続き進める。このように、予定外のことが多く発生し、予算を大幅に二年度に繰り越すこととなった。初年度の環境整備については、二年度に実行する。 既存の機器類を利用しながらも、テレワークを通して常時研究に専念することができたため、実績はむしろ順調に積むことができた。第一に、言語の研究ついては、これまでの知見を一書とする書籍の執筆が大きく進み、2021年5月に和文、英文版を出版する運びである。さらに、冪乗則の計測方法について、英文論文が再録となり、2021年度に公表の予定である。また、経済データの冪乗則についても、経済モデルと現実のモデルの冪乗則における差異が考察され、その論文を現在投稿中である。画像については、分担者が肝臓の超音波画像データの中に冪乗則を計測する手法を考案し、それを元に肝臓癌検出の可能性が開けている。 以上、初年度の実績としては十分であり、順調な進捗である。
|
Strategy for Future Research Activity |
二年目は、まず、初年度に積み残した環境整備を行い、研究に最適な環境を整えていく。特に、コロナ禍で一年目に購入することができなかったDeep Learning用機械を設置する。また、データの入手については、今後も引き続き努力をする。 言語については、初年度にまとめた書籍の延長線上に研究を深めることになる。二年目には、書籍では扱わなかった冪乗則の実態を調査する。それには、未踏の冪乗則を吟味する他、別の解析の方法論を試み、言語の特性をより明らかにしていく。特に、冪乗則を文構造の視点から今後は再考することをも視野に入れる。 経済データについては、これまでは主として日次データで考察を行ったきたが、今後は高頻度データに関してその実態をふまえる。また、これまではリターンの分布の冪乗則に関する研究を主としてきたが、それをふまえながら、経済時系列に内在する長相関についても研究を深めていく。 最後に画像データについては、まずは生体データを主として探究を進めている。今後は、それをさらに深め、一定の知見を得ながら、冪乗則をふまえた病変検出などの応用の可能性を探る。また、人が生み出す写真や絵画などの画像の中にある冪乗則を調査することにも、データが入手され次第取り組む。方法論としては、画像内の物体の特徴量を抽出し、冪乗則の実態を計測することによる。それをGANなどの深層学習モデルが再現するかについて考察を深めていく。
|
Causes of Carryover |
コロナ禍により、初年度に購入予定であった深層学習機の入手を延期せざるを得なくなったため。深層学習機等は次年度以降に購入、利用予定である。
|
Research Products
(5 results)
-
-
[Journal Article] Automated liver tumor detection in abdominal ultrasonography with a modified Faster R-CNN architecture(in press)2021
Author(s)
Karako, K., Mihara, Y., Arita, J., Ichida, A., Bae, S., Kawaguchi, Y., Ichizawa, T., Nobuhisa, A., Kaneko, J., Hasegawa, K., & Chen, Y.
-
Journal Title
HepatoBiliary Surgery and Nutrition
Volume: -
Pages: -
Peer Reviewed / Open Access / Int'l Joint Research
-
-
-