2022 Fiscal Year Research-status Report
Project/Area Number |
22K12734
|
Research Institution | Osaka University |
Principal Investigator |
養老 真一 大阪大学, 大学院法学研究科, 教授 (30240831)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 法情報 / 機械学習 / 判例検索 |
Outline of Annual Research Achievements |
本研究では、法的知識が十分でないものによる判例検索を支援するシステムの構築と検証を目的とする。 2022年度は、まず、具体的にどのようなシステムを構築していくのかの検討を行った。判決文には、裁判の争点となった具多的な法条と法律要件という専門知識が含まれている。しかしそのような情報は、十分な専門知識をもたない人間が判決文を読んでも、簡単に得ることは出来ない。このような専門知識を判決文から得るようなシステムの構築を目指すこととした。判決文のもつ専門知識は、判例データベース、第一法規「判例体系」の「体系目次」から得ることとした。「体系目次」には裁判で争点となった法律要件毎に判決がまとめられている。このシステムがターゲットとする範囲であるが、まずは、民事法、特に民法の債権にかかわる判決を対象とすることした。これは十分な量の判決文があることが期待できるためである。 具体的な作業としては、まず、日本語wikipediaをデータとして、fasttextの学習を行わせた。これをベースに各判決文を文書ベクトルで表現していく。「体系目次」から得られるのは、契約の関係上、判例リストのみであり、判決文全体を得る事はできない。そこで判例リストから、裁判所サイトの裁判例情報から該当判例を自動的に取得するシステムを作成した。 適切な自然言語処理を行うためにはデータの前処理は必須である。得られた判決文はPDFであり、また余計な空白や改行、ページや行番号など、後の処理の障害となるような情報が含まれている。これらを自動的に除去するシステムを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
システムの対象とする判決の種類、また、学習すべき専門知識をどのようなものにするのが適切か検討することに時間を要し、そのため多少、進行が遅れている。
|
Strategy for Future Research Activity |
まず、fasttextを用いて、蓄積した判決文を文書ベクトルに変換する。次に判例体系より入手した適用法条、法律要件などの専門知識をlight gbm等で適切に学習できるかどうかをみる。 最初の段階としては、学習する専門知識を広範囲にとらずに、適用法条や法律要件を絞り、その範囲内で学習がうまくいくかどうかをみる予定にしている。 次の段階としては、Bertを用いて同様の学習が行えるかどうかを試みる予定にしている。Bertを利用すれば、文書ベクトルに判例の文脈情報も不可されるので、より適切な学習が行える可能性がある。
|
Causes of Carryover |
若干の残額が生じたが、少額であるので、次年度の全体の使用計画には影響しない。
|