研究課題/領域番号 |
22K12734
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 大阪大学 |
研究代表者 |
養老 真一 大阪大学, 大学院法学研究科, 教授 (30240831)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 法情報 / 機械学習 / 判例検索 / 法情報学 / 判例 / 自然言語処理 |
研究開始時の研究の概要 |
本研究では、法的知識が十分でないものによる判例検索を支援するシステムの構築と検証を行う。 ある事件について、どのような判例が役に立つか知りたいとしよう。十分な法的知識があれば効率のよい検索を行うことができるが、そうででない場合にはこれは難しく、事件の事実関係を手掛かりに検索を行うしかない。しかし、現在の判例検索システムでは、効率よくこのような検索をすることは困難である。本研究では最新の機械学習の手法を取り入れ、事実関係を手掛かりにする検索システムの構築と検証を行う。
|
研究実績の概要 |
本研究では、法的知識が十分でないものによる判例検索を支援するシステムの構築と検証を目的とする。 2022年度は、まず、具体的にどのようなシステムを構築していくのかの検討を行った。判決文には、裁判の争点となった具多的な法条と法律要件という専門知識が含まれている。しかしそのような情報は、十分な専門知識をもたない人間が判決文を読んでも、簡単に得ることは出来ない。このような専門知識を判決文から得るようなシステムの構築を目指すこととした。判決文のもつ専門知識は、判例データベース、第一法規「判例体系」の「体系目次」から得ることとした。「体系目次」には裁判で争点となった法律要件毎に判決がまとめられている。このシステムがターゲットとする範囲であるが、まずは、民事法、特に民法の債権にかかわる判決を対象とすることした。これは十分な量の判決文があることが期待できるためである。 具体的な作業としては、まず、日本語wikipediaをデータとして、fasttextの学習を行わせた。これをベースに各判決文を文書ベクトルで表現していく。「体系目次」から得られるのは、契約の関係上、判例リストのみであり、判決文全体を得る事はできない。そこで判例リストから、裁判所サイトの裁判例情報から該当判例を自動的に取得するシステムを作成した。 適切な自然言語処理を行うためにはデータの前処理は必須である。得られた判決文はPDFであり、また余計な空白や改行、ページや行番号など、後の処理の障害となるような情報が含まれている。これらを自動的に除去するシステムを作成した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
システムの対象とする判決の種類、また、学習すべき専門知識をどのようなものにするのが適切か検討することに時間を要し、そのため多少、進行が遅れている。
|
今後の研究の推進方策 |
まず、fasttextを用いて、蓄積した判決文を文書ベクトルに変換する。次に判例体系より入手した適用法条、法律要件などの専門知識をlight gbm等で適切に学習できるかどうかをみる。 最初の段階としては、学習する専門知識を広範囲にとらずに、適用法条や法律要件を絞り、その範囲内で学習がうまくいくかどうかをみる予定にしている。 次の段階としては、Bertを用いて同様の学習が行えるかどうかを試みる予定にしている。Bertを利用すれば、文書ベクトルに判例の文脈情報も不可されるので、より適切な学習が行える可能性がある。
|