2021 Fiscal Year Research-status Report
Utilization of artificial intelligence for transparency and fairness in political funds
Project/Area Number |
21K18420
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
藤原 丈史 東京情報大学, 総合情報学部, 准教授 (60348456)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | 政務活動費 / 都道府県 / 情報公開 / データサイエンス |
Outline of Annual Research Achievements |
2021年度は政務活動費の各都道府県議会における公開状況の調査,および実際の政務活動費報告書等のデータ収集および整理を行った. 政務活動費は各地方公共団体の議員が調査研究およびその他の活動に使用するための経費である.その具体的な規定や運用については各地方公共団体の条例により定められており,さらにその情報公開の範囲や方法についても各団体によって異なり大分差がある状況である.特に本研究の目的である公的資金の透明性・公正性の観点からは望ましいことではない.近年,政務活動費の不正使用が明るみになってきており,各地方公共団体も透明化に向け舵を切りつつある.そこで本研究の最初の実施内容としては,各地方公共団体によって定められている政務活動費に関する条例・規則およびインターネット上での情報公開の状況を,都道府県を対象として整理,集計しまとめた.特に情報公開のレベルとしては,各議員・会派ごとに支出の根拠となる領収書の写し等まですべて公開している詳細レベルから,会派ごとの項目総額のみの公開にとどまっている状況までさまざまであった. 次に詳細レベルの情報をWeb上にて公開を行っている一部の都道府県から実際に政務活動費の支出データを取得し,前処理を行い分析できる形式に整理を行った.公開データは電子データではあっても,直接に分析を行えるような数値データではなく,紙の帳票をスキャンした画像データであるため,文字認識技術を活用して文字・数値データに変換するところから行う必要があった.さらに同じ都道府県内においても議員・会派ごとにそのフォーマットが異なる場合もあり,そのような差異を吸収するための変換プログラムを開発し前処理および整理を行う必要があった.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2021年度は,各都道府県の政務活動費における概要レベルの調査および取りまとめについては予定通り実施できたものの,詳細レベルのデータの整備については目標としていた都道府県の一部にとどまっている.これは想定以上に各都道府県,および都道府県内部であっても議員や会派といった報告者によってフォーマットやデータ形式が異なる場合があり,その対応のための個別対処や処理プログラムの開発に時間を要したためである.
|
Strategy for Future Research Activity |
2022年度は都道府県ごとの政務活動費における詳細レベルのデータ,つまり支出一件ごとに対するデータについて,目標とする残りの都道府県について整備を行う.2021年度はWeb上でこのレベルのデータを公開している都道府県のみについてであったが,2022年度はWeb上で公開を行っていない都道府県に対し情報公開請求を行い,紙ベースの資料の請求を行う.その紙ベースのデータを文字認識技術によって電子化し,さらにフォーマット変換等の前処理を行い分析データの整備を完了させる.さらにこの整備したデータに対し,2022年度後半以降はデータ可視化をはじめとした探索的データ解析を行うことで政務活動費としてのデータの概観をつかみ,その知見を生かしてさらに人工知能技術を活用した手法による政務活動費の支出における時系列的な性質を踏まえた上での特徴抽出を行う.これにより議員や会派ごとの支出パターンから一般的な支出か,それとは異なる不正支出の疑いも含むような例外的な支出かどうかといった自動判別を行うシステムの構築を目指す.
|
Causes of Carryover |
研究計画では当初2021年度に目標とする都道府県についてデータの整備を完了する予定であったが,データの前処理に想定以上の時間を要したため実施はその一部にとどまり,使用予定だった機材等が本年度はまだ必要にならなかったためである.残りの都道府県についてはWeb上では公開されていないため,情報公開請求による紙ベースの資料を対象とするため,2022年度の購入物品として高精度のスキャナおよび文字認識システムが必要となる.また,整備を完了したデータについてのセキュリティを踏まえた上での記憶装置,および実際の分析に必要となる分析装置(GPU等)の購入に充てる予定である.
|