| 研究課題/領域番号 |
23K01052
|
| 研究種目 |
基盤研究(C)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分05010:基礎法学関連
|
| 研究機関 | 名古屋大学 |
研究代表者 |
佐野 智也 名古屋大学, デジタル人文社会科学研究推進センター(法), 講師 (30419428)
|
| 研究期間 (年度) |
2023-04-01 – 2026-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
| キーワード | 法令データベース / 省令 / テキストデータ / 生成AI / テキストマイニング / 法令間の相互関係 / 法令XML / 立法沿革 / 法情報 / データベース / 法制史 / 戦時統制 |
| 研究開始時の研究の概要 |
本研究は、法令のテキストデータを用いその内容をコンピュータ処理することで、戦時期における経済法令の実態を明らかにすることを目的とする。 OCRの性能改善により、昭和前期以前の資料を高い品質でテキスト化できるようになった。本研究では、この成果を利用し、法令のテキストデータを収集・整備した上で、法令中の文言等から法令相互の関係を抽出しデータ化する。これにより、法令群の時系列変化や、法令群の中核となる影響力の強い法令を定量的に分析する。
|
| 研究実績の概要 |
2024年度は、閣令と省令(以下「省令」と総称)のデータ整備を進めた。明治19年から昭和20年までに公布された省令は21,347本に達し、限られた予算内で効率的にテキストデータ化することが課題であった。データ収集は時期によって異なる方法を採用した。明治19~45年分については、国立国会図書館(NDL)がNDLラボで公開している『法令全書』のOCRデータを利用した。大正以降は同様のOCRデータが存在しないため、『法令全書』から画像データを作成し、NDLが開発した高精度OCRプログラム(NDLOCR)を使用してテキストデータ化する方法をとった。NDLOCRによる処理では、条名や号名などの項目間にスペースが挿入されず、行末で改行が挿入される。適切なスペース挿入や不要な改行除去といったテキスト整形には、複雑なルールが必要となる。このテキスト整形の課題に対して、生成AIを活用した新しいアプローチを導入した。これにより、ルールベースでは対処が難しい文脈依存の整形処理を比較的正確に実行することが可能となった。この方法により高品質なテキストデータを効率的に生成することができた。この新しい手法により、昭和元年から昭和20年までに公布された計11,096本の省令のテキストデータを作成した。 また、法令間の相互関係データ化を実施した。法令間には、施行期日を定める関係や委任・執行命令などの階層関係が存在する。例えば、大正15年法律第69号民法中改正法律の施行期日は昭和4年勅令第105号で定められ、また「国家総動員法 → 物資統制令 → 廃油取締規則」といった階層関係が存在する。しかし、このような関係性は従来、上位法令から下位法令の把握が困難であった。そこで、テキストデータのパターンマッチングを活用して関係性を特定し、データベースに登録することで、関連法令を表示する機能を追加した。
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
本研究の主目的は、法令のテキストデータを活用して戦時期における経済法令の実態を明らかにすることにある。この目標達成のためには、まず基礎となる法令データのデジタル化が不可欠であり、初年度から計画的に取り組んできた。この点について、本研究の核心部分である省令のデータ化において、着実な進展があった。明治19年から明治45年までの省令はデータ化が完了し、昭和元年から昭和20年までの省令についても、国立国会図書館が開発した高精度OCRプログラムと生成AIを組み合わせた手法により、テキストデータを作成した。これは戦時期を含む重要な時期の省令をカバーしており、当初計画の重要部分を達成している。 また、法令間の相互関係のデータ化においても、テキストデータのパターンマッチングを活用して関係性を特定し、データベースに登録する機能を実装した。 以上から、当初計画の核心部分である法令データのデジタル化とその解析において着実な成果が得られており、研究の進捗状況は、おおむね順調と評価できる。
|
| 今後の研究の推進方策 |
高精度OCRプログラムと生成AIを組み合わせた手法を使って、大正期の省令のテキストデータ作成を継続する。作成したテキストデータについては、構造データ化(XMLデータ化)を順次進めていく。 また、法令間の相互関係の特定作業も並行して推進する。研究過程において、当初の想定と異なり、省令中の記載内容から上位法令を特定できないケースが少なくないことが明らかになった。このような事例に対する効果的な対応方法を検討し、相互関係のデータ化における精度向上を図る。 研究の成果について、法制史学会やデジタルアーカイブ学会等の関連学会での報告を積極的に行う。
|