• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

グラフィカル・データ・アナリシスによる格差研究と社会環境会計による解決方法の提案

研究課題

研究課題/領域番号 16K04022
研究機関関西学院大学

研究代表者

阪 智香  関西学院大学, 商学部, 教授 (10309403)

研究分担者 地道 正行  関西学院大学, 商学部, 教授 (60243200)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード探索的財務データ解析 / 付加価値分配 / 租税回避 / データ可視化
研究実績の概要

2018年度の研究成果は、次の4つである。
(1)データセット(DS-Osiris-2017)の前処理とデータ解析環境への読み込み(データラングリング)、そしてデータ解析の結果が再現可能となるかを検討した。具体的には、結果を得るための工程をUnix環境(主にmakeコマンドを利用)で自動実行することによって、データの前処理、データラングリング、データ解析、モデル選択、モデル評価、さらに文書作成までの全工程を再現可能なものとして生成できるかについて検証した。結果として、再現性が確保されることに成功した。
(2)Bureau van Dijk社のデータベースOrbis から抽出したデータセットを、連結(Consolidated)主体のものと非連結(Un-consolidated)主体のものに区分し、データの前処理を実行した。さらにデータラングリングを行うことによって、データ解析ができる形式に変換した。これらの工程を再現可能とするために、makeコマンドを利用することによって、自動実行することも検証した。
(3)企業活動の実態解明を行うために、(a)企業の富の偏在と国際・国内格差、(b)付加価値の分配、(c)企業の租税回避についての考察結果を、論文としてまとめ、会議発表した。
(4)付加価値の分配に焦点を当て、企業が生み出した付加価値が、様々なステークホルダーにどのように配分されているかを確認するために、世界の全上場企業の付加価値分配の実態と動向を可視化した。その結果、過去25年間で、企業は従業員への分配を減少させ、利益を増加させていること、特にアメリカ企業ではそれが顕著であることが明らかとなった。一方で、ドイツやフランスでは、従業員への高い分配割合を維持していることもわかった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2018年度は、Orbisデータ等の前処理とラングリングから始め、実際にデータを可視化し、企業活動の実態解明を行った。研究の進捗状況を、時系列的に記載すると次のとおりとなる。
2018年4月:データセット(DS-Osiris-2017)に対する探索的財務ビッグデータ解析を、データ(ファイル)操作、データ可視化、統計モデリング、モデル選択、モデル評価、再現可能研究の全行程の観点から実行することを検討した。 2018年5月:上場企業のデータセット(DS-Osiris-C-2018(連結決算)、DS-Osiris-U-2018)を用いて検証した。 2018年6月:データセット(DS-Orbis-C-2018)を用いて検証した。 2018年7-8月:データセット(DS-Orbis-U-2018)を用いて検証した。 2018年9月:データセット(DS-Orbis-C-2018)のFENNEL環境におけるクラスター化 (Hadoop、Hive)を実施した。 2018年10月: 探索的財務ビッグデータ解析(データ可視化、統計モデリング、モデル選択、モデル評価、動的文書生成、再現可能研究)を実施した。 2018年11~12月:データ全体を再確認し、データ提供母体であるインフォメーションプロバイダの情報を追加したデータ再抽出を依頼した。データセット(DS-Orbis-C、U-2018)の前処理と、FENNEL環境下での並列化を検証した。 2019年1~3月:再採取抽出されたデータセット(DS-Orbis-C、U-2018)の前処理を並列化し、FENNEL環境におけるクラスター化を検証した。データセット(DS-Orbis-C、U-2018)の可視化による検証を実施した。

今後の研究の推進方策

(1)時間的な推移を考慮したモデリングについては、経時的な観点から利用できるデータ量や、欠損情報などのデータの品質についての詳細な検討が必要であることがわかったため、引き続き2019年度に有効なモデリングを検討する予定である。
(2)実際にデータを可視化し検証する過程で、精緻に分析するためにはデータの追加が必要であることがわかり、改めてデータセットを入手した。この新しいデータセットに対して、2018年11月から検討を始めた並列化処理を、GNU parallelを利用して実験的に試みた結果、約10分の1の時間で前処理が完了できるという結果を得た。これは、ビッグデータ分析で重要な速度(velocity)の観点から注目すべき成果が得られたことを意味し、2019年度はこの並列化処理についてさらに詳細な検討を行う。
(3)前処理を行ったデータセットのファイルを、データ解析ソフトウェアRに読み込む段階、すなわちデータラングリングを行う工程を、R、Spark、Hadoop、Hive環境とGPGPU環境を連動させて高速化するというテーマについては、Sparkの最新のJava環境への対応の遅れから実現できていない。この課題に対して、2019年度は、データベースサーバPostgreSQLをGPGPU環境下で利用可能にするPG-Stromを用いることによって、高速化の実現を試みる。
(4)2018年度は規模の大きなデータセットのデータ処理の再現性とスピードを改善させることに注力したため、時空間の観点からのダイナミックでインタラクティブなデータ可視化に本格的に取り組む段階に至らなかった。ただし、小規模データセットに対しては、データ解析環境RにおけるgoogleVis、Shinyパッケージを利用してダイナミックにデータの構造を可視化することに成功しており、2019年度にはこの手法を用いて可視化に取り組む。

次年度使用額が生じた理由

(1)本研究では、非上場企業を含む約2000万社の財務データOrbisの分析も予定していたが、Orbisデータの予備的分析を行う中で、データを追加する必要が生じたため、新たに指標を追加した新データセットを2019年2月に入手した。この新データセットに対して、2019年度は、GNU parallel を利用して並列処理を行う。この並列化処理に必要な物品費・人件費として当該研究費を使用する。
(2)時間的な推移を考慮したモデリングについては、中間的な結果は出ているものの、経時的な観点から利用できるデータ量や、欠損情報などのデータの品質についての詳細な検討が必要であることが分かったため、引き続き有効なモデリングを検討する予定である。この検討に必要な図書費・(専門家のアドバイスを得るための)謝金等として当該研究費を使用する。
(3)今年度は規模の大きなデータセットのデータ処理の再現性とスピード改善に注力したため、時空間の観点からのダイナミックかつインタラクティブなデータ可視化に本格的に取り組む段階に至らなかった。ただし、小規模データセットについて、データ解析環境RにおけるgoogleVis、Shinyパッケージを利用してダイナミックにデータの構造を可視化することには成功しており、2019年度は大規模データの可視化に取り組む。このためのソフトウェア購入等のために当該研究費を使用する。

  • 研究成果

    (25件)

すべて 2019 2018

すべて 雑誌論文 (7件) (うち査読あり 2件、 オープンアクセス 4件) 学会発表 (17件) (うち国際学会 2件、 招待講演 1件) 図書 (1件)

  • [雑誌論文] Visualization of Tax Avoidance and Tax Rate Convergence: Exploratory Analysis of World-scale Accounting Data2019

    • 著者名/発表者名
      Saka, C., Oshika, T. and Jimichi, M.
    • 雑誌名

      Meditari Accountancy Research

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Financial KPIs for Sustainability: Evidence from Japanese Long-lived Firms2019

    • 著者名/発表者名
      Saka, C., Oshika, T. and Jimichi, M.
    • 雑誌名

      International Review of Business

      巻: 19 ページ: 1-18

    • オープンアクセス
  • [雑誌論文] 長寿企業の財務的特徴-収益性、財務報告の質、付加価値分配の分析-2019

    • 著者名/発表者名
      阪智香
    • 雑誌名

      商学論究

      巻: 第66巻第4号 ページ: 435-452

    • オープンアクセス
  • [雑誌論文] Visualization and statistical modeling of financial big data: double-log modeling with skew-symmetric error distributions2018

    • 著者名/発表者名
      Jimichi, M., Miyamoto, D., Saka, C., and Nagata, S.
    • 雑誌名

      Japanese Journal of Statistics and Data Science

      巻: 1 ページ: 347-371

    • DOI

      10.1007/s42081-018-0019-1

    • 査読あり
  • [雑誌論文] 探索的財務ビッグデータ解析-前処理、データラングリング、再現可能性-2018

    • 著者名/発表者名
      地道 正行
    • 雑誌名

      商学論究

      巻: 第66巻第1号 ページ: 1-31

    • オープンアクセス
  • [雑誌論文] 探索的財務ビッグデータ解析-データ可視化、統計モデリング、モデル選択、モデル評価、動的文書生成、再現可能研究-2018

    • 著者名/発表者名
      地道 正行
    • 雑誌名

      商学論究

      巻: 第66巻第2号 ページ: 1-41

    • オープンアクセス
  • [雑誌論文] 会計ビッグデータの可視化2018

    • 著者名/発表者名
      阪 智香
    • 雑誌名

      企業会計

      巻: 第70巻第4号 ページ: 4-5

  • [学会発表] Does Tax Avoidance Diminish Sustainability?2018

    • 著者名/発表者名
      Saka, C., Oshika, T. and Jimichi, M.
    • 学会等名
      41st Annual Congress of the European Accounting Association
    • 国際学会
  • [学会発表] Does Tax Avoidance Diminish Sustainability?2018

    • 著者名/発表者名
      Saka, C., Oshika, T. and Jimichi, M.
    • 学会等名
      23rd International Euro-Asia Research Conference
    • 国際学会
  • [学会発表] 探索的財務ビッグデータ解析-データ(ファイル)操作、データ可視化、統計モデリング、モデル選択、モデル評価、再現可能研究-2018

    • 著者名/発表者名
      地道 正行、宮本 大輔、阪 智香、永田 修一
    • 学会等名
      日本経営数学会第40回(通算60回) 研究大会
  • [学会発表] SDGs時代の会計の役割:会計からCSV(共有価値創造)を考える2018

    • 著者名/発表者名
      阪 智香
    • 学会等名
      日本組織会計学会第2回全国大会、統一論題
  • [学会発表] 財務ビッグデータの可視化と統計モデリング2018

    • 著者名/発表者名
      地道 正行、宮本 大輔、阪 智香、永田 修一
    • 学会等名
      学際大規模情報基盤共同利用・共同研究拠点(JHPCN) 第10回 シンポジウム
  • [学会発表] 財務データの可視化による企業活動の実態解明とSDGsへの課題2018

    • 著者名/発表者名
      阪 智香、地道 正行
    • 学会等名
      第35回応用経済時系列研究会
    • 招待講演
  • [学会発表] 探索的財務ビッグデータ解析-前処理、データラングリング、再現可能性-2018

    • 著者名/発表者名
      地道 正行、宮本大輔、阪 智香、永田 修一
    • 学会等名
      国際数理科学協2018年度年会「統計的推測と統計ファイナンス」分科会研究集会
  • [学会発表] 配当金支払金額の探索的データ解析2018

    • 著者名/発表者名
      柳 麻衣、阪 智香、地道 正行
    • 学会等名
      国際数理科学協会2018年度年会「統計的推測と統計ファイナンス」分科会研究集会
  • [学会発表] 探索的財務ビッグデータ解析2018

    • 著者名/発表者名
      地道 正行、阪 智香、宮本大輔、永田 修一
    • 学会等名
      2018年度統計関連学会連合大会
  • [学会発表] 配当金支払金額の探索的データ解析2018

    • 著者名/発表者名
      柳 麻衣、阪 智香、地道 正行
    • 学会等名
      2018年度統計関連学会連合大会
  • [学会発表] Visualization of Tax Avoidance and Tax Rate Convergence: Exploratory Analysis of Accounting Big Data2018

    • 著者名/発表者名
      阪 智香
    • 学会等名
      国際会計研究会・大阪会計研究会合同大会
  • [学会発表] SとGを会計データから考える―探索的会計ビッグデータ解析2018

    • 著者名/発表者名
      阪 智香
    • 学会等名
      日本社会関連会計学会第31回全国大会、統一論題
  • [学会発表] 探索的財務ビッグデータ解析-前処理、データラングリング、再現可能性2018

    • 著者名/発表者名
      地道 正行、宮本大輔、阪 智香、永田 修一
    • 学会等名
      日本計算機統計学会第32回シンポジウム
  • [学会発表] 探索的財務ビッグデータ解析2018

    • 著者名/発表者名
      地道 正行
    • 学会等名
      統計数理研究所共同研究集会 2018年度「データ解析環境Rの整備と利用」
  • [学会発表] 探索的財務ビッグデータ解析2018

    • 著者名/発表者名
      地道 正行、宮本大輔、阪 智香、永田 修一
    • 学会等名
      科研費シンポジウム「多変量データ解析法における理論と応用」
  • [学会発表] 探索的財務ビッグデータ解析2018

    • 著者名/発表者名
      阪 智香
    • 学会等名
      日本経営分析学会第1回西日本部会
  • [学会発表] 配当金の探索的データ解析2018

    • 著者名/発表者名
      柳 麻衣、阪 智香、地道 正行
    • 学会等名
      2018年度日本統計学会春季集会
  • [図書] データサイエンスの基礎: Rによる統計学独習2018

    • 著者名/発表者名
      地道 正行
    • 総ページ数
      237
    • 出版者
      裳華房
    • ISBN
      4785315784

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi