2022 Fiscal Year Research-status Report
Research into the Nature of Accounting Change: Analysis of the Impact of Theory on Practice and Institutions using BERT.
Project/Area Number |
22K01803
|
Research Institution | Osaka Sangyo University |
Principal Investigator |
澤登 千恵 大阪産業大学, 経営学部, 教授 (30352090)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 会計史 / 財務会計 / 監査 / 鉄道 / ガス / テキストマイニング / BERT |
Outline of Annual Research Achievements |
本研究の目的は会計変化の本質的要因を特定することである。実験が容易でない経済社会において,「どのように会計が変化してきたかとその本質的要因」を解明することは,日本が会計を「政策の手段」として本格的に活用するとき,その結果を予想することにつながり,政策は効果的に実施されることになる。本申請課題では,業界内で最初に財務報告制度を確立したと言われる19世紀イギリスの鉄道会社と,ここまでの研究で鉄道会社より先にいくつかの会計処理を導入したことがわかっているガス会社の会計の実務と制度の変化に対する「理論の変化」の影響を,当時の有識者の見解が記載されているThe Economist(UK)の記事104年分を2018年にGoogleのJacob Devlinが発表した自然言語処理モデル「BERT」を使用し分析することで明らかにする。 今年度は,テストとして,既に入手し,かつテキスト化と1年ごとに1ファイル化の手続きが終了しているLondon and Birmingham鉄道会社の全有価証券報告書を,BERTを使用して分析した。1849年の議会内委員会報告書からそれぞれの教師データを作成し,これで機械学習させ,データセットを作成し,全文章をシンプルに「capital accountに関する文」,「revenue accountに関する文」,それ以外にタグ付けした。最初はファイルごとに,次に段落ごとに分析を行った上で,これらを時系列分析した。一方で,分析結果から,分析手続きに検討の余地があると感じたため,他の会社でも試行することにした。当該問題を検証するために,同鉄道会社と同等規模の鉄道会社であるGrand Junction鉄道会社の有価証券報告書について同様の分析を行ったが,当該鉄道会社の有価証券報告書のテキストデータの精度が低かったため,期待していた分析結果を得ることはできなかった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
分析結果から,分析手続きに検討の余地があると感じたため,他の会社でも試行することにしたため,進捗が予定よりも遅れている。当該問題を検証するために,同鉄道会社と同等規模の鉄道会社であるGrand Junction鉄道会社の有価証券報告書について同様の分析を行ったが,当該鉄道会社の有価証券報告書のテキストデータの精度が低かったため,期待していた分析結果を得ることができなかった。一方で,現段階では,分析手続きの問題として,教師データの量の不足を予想している。教師データの量を増加させるために,リーダーカンパニーの有価証券報告書のテキストデータを自身で「capital accountに関する文」と「revenue accountに関する文」に分類したデータを,教師データとして採用することを検討している。次年度はまず,リーダーカンパニーであるLondon and North Wesstern鉄道会社の有価証券報告書を予定しており,当該テキストデータの精度を高める必要がある。
|
Strategy for Future Research Activity |
2023年度は,リーダーカンパニーであるLondon and North Wesstern鉄道会社の有価証券報告書のテキストデータの精度を高め,教師データの増加を図りつつ,The Economistの1849年までの期間についてデータセットを作成し,分析に取り掛かる。データセットの作成手順は以下のとおりである。The Economist(UK)の1847年から1947年までの記事の中で,railwayを含む記事をダウンロードする。次に,ファイルを1年ごとの1テキストファイルとしてまとめる。そして,1849年までの期間について,BERTを活用して,タグ付けしてデータセットを作成し,作成されたデータセットを時系列分析する。現段階では,「capital accountに関する文」と「revenue accountに関する文」と「それ以外」にタグ付けすることを予定している。
|
Causes of Carryover |
本年度は有価証券報告書のテスト分析に留まっており,The Economistの分析まで進まなかった。それ故に,当該資料のライセンス料が発生しなかった。当該予算はテキストデータの精度を高めるために使用予定である。
|